utf-8

  • 1012 рейтинг
    13 ответов
    UTF-8 полностью

    Я настраиваю новый сервер и хочу полностью поддерживать UTF-8 в моем веб-приложении. Я пытался в прошлом на существующих серверах, и мне всегда приходилось прибегать к ISO-8859-1.

    Где именно мне нужно установить кодировку / кодировки? Я знаю, что мне нужно настроить

    ...
  • 473 рейтинг
    16 ответов
    Лучший способ конвертировать текстовые файлы между наборами символов?

    Какой самый быстрый и простой инструмент или метод для преобразования текстовых файлов между наборами символов?

    В частности, мне нужно конвертировать из UTF-8 в ISO-8859-15 и наоборот.

    Все идет: одна строка на вашем любимом языке сценариев, инструменты командной строки или другие

    ...
  • 385 рейтинг
    13 ответов
    В чем разница между UTF-8 и Unicode

    Я слышал противоречивые мнения от людей - согласно Википедии, см. Здесь .

    Это одно и то же, не так ли? Может кто-нибудь уточнить?

  • 378 рейтинг
    12 ответов
    UTF-8, UTF-16 и UTF-32

    В чем различия между UTF-8, UTF-16 и UTF-32?

    Я понимаю, что все они будут хранить Unicode, и что каждый использует различное количество байтов для представления символа. Есть ли преимущество выбора одного над другим?

  • 346 рейтинг
    13 ответов
    Как заставить UTF-8 работать в веб-приложениях Java?

    Мне нужно, чтобы UTF-8 работал в моем веб-приложении Java (сервлеты + JSP, без фреймворка) для поддержки äöå и т. Д. для обычного финского текста и кириллицы, например ЦжФ для особых случаев.

    Моя установка следующая:

    • Среда разработки: Windows XP
    • Производственная среда:
    ...
  • 270 рейтинг
    24 ответов
    Определите кодировку и сделайте все в UTF-8

    Я читаю много текстов из различных RSS-каналов и вставляю их в свою базу данных.

    Конечно, есть несколько различных кодировок символов, используемых в каналах, e. г. UTF-8 и ISO-8859-1.

    К сожалению, иногда возникают проблемы с кодировкой текстов. Пример:

    1. «ß» в «Fußball»

    ...
  • 259 рейтинг
    4 ответов
    UTF-8: генерал? Бен? Unicode?

    Я пытаюсь выяснить, какую сортировку я должен использовать для различных типов данных. 100% содержимого, которое я буду хранить, отправлено пользователем.

    Насколько я понимаю, я должен использовать UTF-8 General CI (без учета регистра) вместо UTF-8 Binary. Тем не менее, я не

    ...
  • 255 рейтинг
    13 ответов
    Юникод (UTF-8) чтение и запись в файлы в Python

    У меня какой-то мозговой сбой в понимании чтения и записи текста в файл (Python 2. 4).

    # The string, which has an a-acute in it.
    ss = u'Capit\xe1n'
    ss8 = ss.encode('utf8')
    repr(ss), repr(ss8)
    

    («u'Capit \ xe1n», «Capit \ xc3 \

    ...
  • 221 рейтинг
    15 ответов
    Как использовать UTF-8 в свойствах ресурса с ResourceBundle

    Мне нужно использовать UTF-8 в свойствах моего ресурса, используя Java ResourceBundle. Когда я ввожу текст прямо в файл свойств, он отображается как mojibake.

    Мое приложение работает на Google App Engine.

    Может кто-нибудь привести пример? Я не могу получить эту

    ...
  • 209 рейтинг
    10 ответов
    Как проверить, является ли строка юникодом или ascii?

    Что мне нужно сделать в Python, чтобы выяснить, какую кодировку?

  • 181 рейтинг
    7 ответов
    Проблемы с кодировкой HTML - & quot; & quot; персонаж появляется вместо «& amp; nbsp;»

    У меня есть устаревшее приложение, которое только начинает плохо себя вести, по какой-то причине я не уверен. Он генерирует кучу HTML, который ActivePDF превращает в отчеты PDF.

    Процесс работает так:

    1. Извлечь шаблон HTML из БД с токенами в нем для
    ...
  • 159 рейтинг
    9 ответов
    Как написать файл UTF-8 с Java?

    У меня есть текущий код, и проблема в том, что он создает файл кодовой страницы 1252, я хочу заставить его создать файл UTF-8

    Может кто-нибудь помочь мне с этим кодом, так как я говорю, что в настоящее время он работает.

    ...
  • 158 рейтинг
    30 ответов
    Как я могу вывести UTF-8 CSV на PHP, который Excel будет читать правильно?

    У меня есть очень простая вещь, которая просто выводит некоторые вещи в формате CSV, но это должен быть UTF-8. Я открываю этот файл в TextEdit или TextMate или Dreamweaver, и он правильно отображает символы UTF-8, но если я открываю его

    ...
  • 154 рейтинг
    4 ответов
    Запись в файл UTF-8 на Python

    Я действительно запутался с codecs.open function. Когда я делаю:

    file = codecs.open("temp", "w", "utf-8")
    file.write(codecs.BOM_UTF8)
    file.close()
    

    выдает ошибку

    UnicodeDecodeError: кодек «ascii» не может декодировать байт 0xef в позиции 0: порядковый номер не в диапазоне (128)

    Если я сделаю:

    file
    ...
  • 151 рейтинг
    15 ответов
    Как определить кодировку файла в OSX?

    Я пытаюсь ввести некоторые символы UTF-8 в файл LaTeX в TextMate (который говорит, что его кодировка по умолчанию - UTF-8), но LaTeX, кажется, не понимает их. Запуск cat my_file.tex показывает символы правильно в терминале. Запуск ls -al показывает то, чего

    ...
  • 142 рейтинг
    10 ответов
    Кодировать строку в UTF-8

    У меня есть строка с символом «-», и у меня есть некоторые проблемы с ней. Мне нужно закодировать эту строку в кодировку UTF-8. Я пробовал таким образом, но это не работает:

    byte ptext[] = myString.getBytes();
    String value = new String(ptext,
    ...
  • 136 рейтинг
    8 ответов
    MySQL & quot; неверное строковое значение & quot; ошибка при сохранении строки Unicode в Django

    Я получил странное сообщение об ошибке при попытке сохранить first_name, last_name в модели Django auth_user.

    Неудачные примеры

    user = User.object.create_user(username, email, password)
    user.first_name = u'Rytis'
    user.last_name = u'Slatkevičius'
    user.save()
    >>> Incorrect string value: '\xC4\x8Dius' for column 'last_name' at row 104
    ...
  • 132 рейтинг
    16 ответов
    PHP: Как удалить все непечатаемые символы в строке?

    Я думаю, что мне нужно удалить символы 0-31 и 127,

    Есть ли функция или кусок кода, чтобы сделать это эффективно.

  • 126 рейтинг
    4 ответов
    Разница между UTF-8 и UTF-16?

    Разница между UTF-8 и UTF-16? Зачем нам это нужно?

    MessageDigest md = MessageDigest.getInstance("SHA-256");
    String text = "This is some text";
    
    md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed
    byte[] digest = md.digest();
    
  • 124 рейтинг
    7 ответов
    Юникод символы в URL

    В 2010 году вы бы обслуживали URL-адреса, содержащие символы UTF-8, на большом веб-портале?

    Символы Unicode запрещены согласно RFC на URL-адресах (см. здесь ). Они должны быть закодированы в процентах, чтобы соответствовать стандартам.

    Моя главная мысль, тем не менее, состоит в

    ...