Юникод и электронная почта - Unicode and email

Много почтовые клиенты теперь предложите некоторую поддержку Unicode. Некоторые клиенты автоматически выбирают между устаревшей кодировкой и Unicode в зависимости от содержимого письма.[1] или когда пользователь этого требует.[2]

Технические требования к отправке сообщений, не содержащихASCII символы по электронной почте включают

  • кодирование определенных полей заголовка (тема, имена отправителя и получателя, организация отправителя и имя для ответа) и, опционально, тела в кодировке передачи содержимого
  • кодирование не-ASCII-символов в одном из преобразований Unicode
  • согласование использования кодировки UTF-8 в адресах электронной почты и кодах ответа (SMTPUTF8 )
  • отправка информации о кодировке передачи контента и используемом преобразовании Unicode, чтобы получатель мог правильно отобразить сообщение (см. Моджибаке ).

Если адрес электронной почты отправителя или получателя содержит символы, отличные от ASCII, отправка сообщения требует также их кодирования в формате, понятном почтовым серверам.

Поддержка Unicode в протоколах

  • RFC 6531 предоставляет механизм для разрешения адресов электронной почты, отличных от ASCII, в кодировке UTF-8 в SMTP[3] или же LMTP протокол

Поддержка Unicode в заголовке сообщения

Чтобы использовать Unicode в определенных полях заголовка электронной почты, например строки темы, имена отправителя и получателя, текст Unicode должен быть закодирован с использованием MIME «Закодированное слово» с кодировкой Unicode в качестве кодировки. Чтобы использовать Unicode в доменной части адресов электронной почты, IDNA кодирование должно использоваться традиционно. В качестве альтернативы SMTPUTF8[3] позволяет использовать кодировку UTF-8 в адресах электронной почты (как в локальной части, так и в доменном имени), а также в разделе заголовка почты. Были созданы различные стандарты для модификации обработки данных, отличных от ASCII, до первоначально использовавшегося только для ASCII протокола электронной почты:

  • RFC 2047 обеспечивает поддержку кодирования значений, отличных от ASCII, таких как настоящие имена и строки темы в заголовке электронной почты[4]
  • RFC 5890 обеспечивает поддержку кодирования доменных имен, отличных от ASCII, в система доменных имен[5]
  • RFC 6532 позволяет использовать UTF-8 в разделе заголовка письма [6]

Поддержка Unicode в теле сообщений

Как и во всех кодировках, кроме US-ASCII, при использовании текста Unicode в электронной почте, MIME должен использоваться, чтобы указать, что для текста используется формат преобразования Unicode.

UTF-7, хотя иногда считается устарел, имеет преимущество перед другими кодировками Unicode в том, что не требует кодирования передачи для соответствия семибитным ограничениям унаследованных почтовых серверов Интернета. С другой стороны, UTF-16 должны быть закодированы для передачи, чтобы соответствовать формату данных SMTP. Хотя это и не обязательно, UTF-8 обычно также кодируется при передаче, чтобы избежать проблем на семибитных почтовых серверах. Кодировка передачи MIME UTF-8 делает его нечитаемым как обычный текст (в случае base64 ) или, для некоторых языков и типов текста, сильно неэффективен по размеру (в случае цитируемый-печатный ).

Некоторые форматы документов, например HTML, PostScript и Расширенный текстовый формат имеют собственные 7-битные схемы кодирования для символов, отличных от ASCII, и поэтому их можно отправлять без использования каких-либо специальных кодировок электронной почты. Например. Электронная почта HTML можно использовать HTML-объекты использовать символы из любого места в Unicode, даже если исходный текст HTML для электронного письма имеет устаревшую кодировку (например, 7-битный ASCII). Подробнее об этом см. Юникод и HTML.

Смотрите также

Рекомендации

  1. ^ "страсть к путешествиям / апель". GitHub. Получено 2018-09-05.
  2. ^ «Настройка Outlook для использования UTF-8». Получено 2018-09-05.
  3. ^ а б Цзянькан, Яо; Вэй, Мао. «Расширение SMTP для интернационализированной электронной почты». tools.ietf.org. Получено 2018-09-05.
  4. ^ Мур, Кит. "MIME (многоцелевые расширения почты Интернета), часть третья: расширения заголовков сообщений для текста, отличного от ASCII". tools.ietf.org. Получено 2018-09-05.
  5. ^ Кленсин, Джон С. «Интернационализированные доменные имена для приложений (IDNA): определения и структура документов». tools.ietf.org. Получено 2018-09-05.
  6. ^ Авель, Ян; Шон, Стил. «Интернационализированные заголовки электронной почты». tools.ietf.org. Получено 2018-09-05.

внешняя ссылка