Сложный текстовый макет - Complex text layout

В Деванагари ddhrya-лигатура, как показано в ЯнаСанскритСанс font, который должен вызываться механизмом компоновки для рендеринга последовательности द + ् + ध + ् + र + ् + य = द्ध्र्य.
Слово العربية аль-арабия, «арабский [язык]» на арабском языке, в последовательных этапах обработки. В первой строке показаны буквы в порядке слева направо и без них, как они могут отображаться в приложении без сложного макета текста. Во второй строке применено двунаправленное отображение, а в третьей - глиф -Механизм формирования отображал буквы в соответствии с контекстом.

Сложный текстовый макет (CTL) или же сложный рендеринг текста это наборный из системы письма в котором форма или расположение графема зависит от его отношения к другим графемам. Термин используется в области программного обеспечения интернационализация, где каждая графема представляет собой персонаж.

Скрипты, требующие CTL для правильного отображения, могут быть известны как сложные скрипты. Примеры включают Арабский алфавит и скрипты Брахмическая семья, Такие как Деванагари или Тайский алфавит. Многие скрипты не требуют CTL. Например, Латинский алфавит или же китайские иероглифы можно набирать, просто отображая каждый символ один за другим в прямых строках или столбцах. Однако даже у этих скриптов есть альтернативные формы или дополнительные функции (например, курсив Writing), которые требуют CTL для создания на компьютерах.

Характеристики, требующие CTL

Основные характеристики сложности CTL:

  • Двунаправленный текст, где символы могут быть написаны как справа налево, так и слева направо.
  • Контекстно-зависимое формирование и лигатуры, где персонаж может изменить свою форму в зависимости от своего местоположения и / или окружающих символов. Например, персонаж в Арабский шрифт может иметь до четырех различных форм, в зависимости от контекста.
  • Порядок, при котором отображаемый порядок символов не совпадает с логическим порядком. Например, в деванагари, который пишется слева направо, графема для «короткого i» появляется слева от («до») согласного, за которым следует: в कि ки, то ि должен отображаться слева, его носовая часть достигает уровня выше k- Направо.

Не все проявления этих характеристик требуют CTL. Например, Греческий алфавит имеет контекстно-зависимое формирование буквы сигма, который появляется как ς в конце слова и σ в другом месте. Однако эти две формы обычно хранятся как разные символы; например, Unicode имеет оба U + 03C2 ς ГРЕЧЕСКАЯ СТРОЧНАЯ БУКВА ОКОНЧАТЕЛЬНАЯ СИГМА и U + 03C3 σ ГРЕЧЕСКАЯ СТРОЧНАЯ БУКВА СИГМА, и не рассматривает их как эквивалент. В целях сопоставления и сравнения программное обеспечение должно рассматривать строку «δῖος Ἀχιλλεύς» как эквивалентную «δῖοσ Ἀχιλλεύσ»,[1] но для целей набора они различны, и CTL не требуется для выбора правильной формы.

Реализации

Большинство программ для рендеринга текста, поддерживающих CTL, будут включать информацию о конкретных сценариях, и поэтому смогут правильно их отображать без файлы шрифтов необходимо предоставить инструкции по размещению символов. Такое программное обеспечение обычно предоставляется в библиотека; примеры включают:

Однако такое программное обеспечение не может должным образом отображать любой сценарий, для которого отсутствуют инструкции, которые могут включать в себя многие сценарии меньшинства. Альтернативный подход - включить инструкции по рендерингу в сам файл шрифта. Программное обеспечение для рендеринга по-прежнему должно уметь читать и следовать инструкциям, но это относительно просто.

Примеры этого последнего подхода включают Продвинутая типографика Apple (AAT) и Графитовый. Оба эти названия охватывают как формат инструкции, так и поддерживающее его программное обеспечение; AAT включен в яблоко операционные системы, а графит доступен для Майкрософт Виндоус и Linux -системы.

В OpenType Формат в первую очередь предназначен для систем, использующих первый подход (знание макета в рендерере, а не шрифте), но у него есть несколько функций, которые помогают с CTL, такие как контекстные лигатуры. Инструкции AAT и Graphite могут быть встроены в файлы шрифтов OpenType.

Смотрите также

Рекомендации

  1. ^ "FAQ - Греческий язык и алфавит". Консорциум Unicode. 2012-12-03. Получено 2013-09-13. Легче просто приравнять два сигма-кода для операций, связанных, например, с содержанием слова.

внешняя ссылка