Z-вариант - Z-variant

В Unicode, два глифы как говорят Z-варианты (часто пишется z Варианты), если они имеют одинаковую этимологию, но имеют немного разный внешний вид и разные Unicode кодовые точки. Например, символы Unicode U + 8AAA 說 и U + 8AAC 説 являются Z-вариантами. Понятие Z-дисперсии применимо только к "CJKV скрипты "- китайский, японский, корейский и вьетнамский - и является подтемой Ханьское объединение.

Отличия по оси Z

Философия Unicode распределения кодовых точек для языков CJK организована по трем принципам:топоры. «Ось X представляет различия в семантике; например, латинская заглавная A (U + 0041 A) и греческая заглавная альфа (U + 0391 Α) представлены двумя разными кодовыми точками в Unicode и могут быть названы» X-варианты »(хотя этот термин не является распространенным). Ось Y отображает существенные различия во внешнем виде, но не в семантике; например, традиционный китайский иероглиф мао «кошка» (U + 8C93 貓) и упрощенный китайский иероглиф (U + 732B 猫) являются Y-вариантами.[1]

Ось Z отображает незначительные типографские различия. Например, китайские иероглифы (U + 838A 莊) и (U + 8358 荘) являются Z-вариантами, как и (U + 8AAA 說) и (U + 8AAC 説). Глоссарий на Unicode.org определяет «Z-вариант» как «Две унифицированные идеограммы CJK с идентичной семантикой и унифицированными формами»,[1] где «унифицируемый» понимается в смысле объединения Хань.

Таким образом, если бы объединение Хань было совершенно успешным, Z-вариантов не существовало бы. Они существуют в Юникоде, потому что считалось полезным иметь возможность передавать документы в оба конца между Юникодом и другими кодировками CJK, такими как Big5 и CCCII. Например, символ 莊 имеет кодировку CCCII 21552D, тогда как его Z-вариант 荘 имеет кодировку CCCII 2D552D. Таким образом, этим двум вариантам были присвоены разные кодовые точки Unicode, так что преобразование документа CCCII в Unicode и обратно было бы без потерь операция.

Путаница

Есть некоторая путаница с точным определением «Z-вариант». Например, в Интернет-проект (из RFC  3743 ) от 2002 г.,[2] можно найти «нет» (U + 4E0D ) и (U + F967 ) описывается как «варианты шрифта», причем термин «Z-вариант» явно зарезервирован для межъязыковых пар, таких как Мандаринский китайский «кролик» (U + 5154 ) и японцы к «кролик» (U + 514E ). Тем не менее Консорциум Unicode с Unihan база данных [3] рассматривает обе пары как Z-варианты.

Смотрите также

Рекомендации