Фонетические символы в Юникоде - Phonetic symbols in Unicode

Unicode поддерживает несколько фонетические сценарии и записи с помощью существующих систем письма и добавления дополнительных блоков с фонетическими символами. Эти фонетические дополнения являются производными от существующего алфавита, обычно латинского, греческого или кириллического. В Unicode нет «скрипта IPA». Помимо IPA, расширения к IPA и устаревшие и нестандартные символы IPA, эти блоки также содержат символы из Уральский фонетический алфавит и Фонетический алфавит американизма.

Фонетические сценарии

В Международный фонетический алфавит (IPA) использует буквы из других систем письма, как и большинство фонетических шрифтов. IPA, в частности, использует латинские, греческие и кириллические символы. Сочетание диакритических знаков также добавляет смысла фонетическому тексту. Наконец, в этих фонетических алфавитах используются буквы-модификаторы, которые специально созданы для фонетического значения. «Буква-модификатор» строго предназначена не как независимая графема, а как модификация предыдущего символа.[1] в результате получилась отличная графема, особенно в контексте Международного фонетического алфавита. Например, ʰ не должен появляться сам по себе, но изменяет предыдущий или следующий символ. Таким образом, является одним символом IPA, отличным от т. Однако на практике некоторые из этих «букв-модификаторов» также используются как полные графемы, например ʿ как транслитерация семитского айин или гавайский окина, или ˚ транслитерация абхазского ә.

От IPA к Unicode

Согласные буквы

В следующих таблицах указаны последовательности кодовых точек Unicode для фонем, используемые в Международный фонетический алфавит. Жирный код указывает на то, что в таблице Unicode есть примечания по применению, такие как «звонкая боковая ретрофлексия» для U + 026D ɭ СТРОЧНАЯ ЛАТИНСКАЯ БУКВА L С КРЮЧКОМ RETROFLEX (HTMLɭ). Запись, выделенная жирным курсивом, указывает, что само имя персонажа относится к фонеме, например U + 0298 ʘ ЛАТИНСКАЯ БУКВА ДВОЙНОЙ ЩЕЛЧОК (HTMLʘ)

БилабиальныйЛабиодентальныйСтоматологическийАльвеолярныйПостальвеолярныйРетрофлексЛабиализированный небныйПостальвеолярно-велярный
Взрывнойп 0070б 0062п 0070 032A 0062 032A 0074 032A 0064 032Aт
0074
d 0064ʈ 0288ɖ 0256
Имплозивныйɓ̥ 0253 0325ɓ 0253ɗ̪ 0257 032Aɗ 0257*
Ejectiveп 0070 02BCt̪ʼ 0074 032A 02BC 0074 02BCʈʼ 0288 02BC
Носовойм̥ 006D 0325м 006Dɱ̊ 0271 030Aɱ 0271n 006E 032A 030An 006E 032An 006E 0325п 006Eɳ̊ 0273 030Aɳ 0273
Трельʙ 0299р 0072 0325р 0072*
Нажмите или откидывайтеⱱ̟ 2C71 031F 2C71ɾ 027Eɽ 027D
Боковой лоскутɺ 027A*
Fricativeɸ 0278β 03B2ж
0066
v 0076θ 03B8ð 00F0s 0073z 007Aʃ 0283ʒ 0292ʂ 0282ʐ 0290ɧ 0267
Боковой фрикативныйɬ 026Cɮ 026E A78E
Выходящий фрикативный 0073 02BCʃʼ 0283 02BC
Выталкивающий боковой фрикативныйɬʼ 026C 02BC
Ударныйʬ
02AC
ʭ
02AD
Приблизительныйβ̞̊ 03B2 031E 030Aβ̞ 03B2 031Eʋ̥ 028B 0325ʋ 028Bð̞ 00F0 031Eɹ̥ 0279 0325ɹ 0279ɻ̊ 027B 030Aɻ 027Bɥ̊ 0265 030Aɥ 0265
Боковой аппроксимант 006C 0325л 006Cɭ 026D
Нажмите согласнуюʘ
0298
ǀ
01C0
ǃ
01C3
ǃ / ǂ
01C3 / 01C2
Боковой щелчок*ǁ
01C1
Альвеоло-небныйНебныйЛабиально-велярныйVelarУвулярныйГлоткаНадгортанникGlottal
Взрывнойȶ 0236ȡ 0221c 0063ɟ 025Fk͡p 006B 0361 0070ɡ͡b 0261 0361 0062k 006Bɡ 0261q 0071ɢ 0262ʡ 02A1ʔ 0294
Имплозивныйʄ 0284ɠ 0260ʛ 029B
Ejective 0063 02BC 006B 02BC 0071 02BC
Носовойȵ 0235ɲ 0272ŋ͡m 014B 0361 006Dŋ 014Bɴ 0274
Трельʀ 0280*
Нажмите или откидывайте*
Боковой лоскут**
Fricativeɕ 0255ʑ 0291ç 0063 0327ʝ 029DИкс 0078ɣ 0263χ 03C7ʁ 0281час 0127ʕ 0295ʜ 029Cʢ 02A2час 0068ɦ 0266
Приблизительныйj 006Aʍ 028Dш 0077ɰ 0270
Боковой аппроксимантȴ 0234ʎ 028Eʟ 029F

Гласные

На следующих рисунках показаны фонетические гласные и их кодовые точки Unicode / UCS. Гласные, появляющиеся парами на рисунке справа, обозначают округленные и неокругленные вариации соответственно. Опять же, символы с именами Unicode, относящиеся к фонемам, выделены жирным шрифтом. Те, у которых есть явные примечания к применению, выделены жирным курсивом. Те из них, которые были заимствованы без изменений из другого письма (латинского, греческого или кириллица), выделены курсивом.

Unicode кодовые точки для фонетические гласные
В этой таблице представлены фонетические трапеция гласных

До и после пули необоснованный· округлый гласные

близкоя · у
0069 0079
ɨ · ʉ
0268 0289
ɯ · ты
026F0075
Почти близкоɪ · ʏ
026A 028F
ɪ̈ · ʊ̈
026A 0308· 028A 0308
 · ʊ
028A
Близко-серединае · ø
0065 00F8
ɘ · ɵ
0258 0275
ɤ · о
0264 006F
Серединаə
0259
Открытый-среднийɛ · œ
025B 0153
ɜ · ɞ
025C 025E
ʌ · ɔ
028C 0254
Почти открытыйæ ·
00E6
ɐ
0250
Открытоа · ɶ
0061 0276
ɑ · ɒ
0251 0252

Диакритики

ДиакритическийФункцияHexДиакритическийФункцияHexДиакритическийФункцияHex
МодификаторОбъединениеМодификаторОбъединениеМодификаторОбъединение
˳Безмолвный0x02F30x0325̤Дышащий звонкий0x0324͏̪Стоматологический0x032A
ˬОзвучен0x02EC0x032C˷Скрипучий голос0x02F70x0330˽Апикальный0x02FD0x033A
ʰС придыханием0x02B0͏̼Лингволабиальный0x033C͏̻Ламинал0x033B
̹Более округлые0x0339ʷЛабиализированный0x02B7̃Назализованный0x0303
͏̜Менее закругленный0x031CʲПалатализированный0x02B2Носовой релиз0x207F
˖Продвинутый0x02D60x031FˠВеларизированный0x02E0ˡБоковой выпуск0x02E1
ˍОтозван0x02CD0x0320ˤФарингализированный0x02E4˺Без слышимого выпуска0x02FA0x031A
̈Централизованный0x0308̴Velarized или Pharyngealized0x0334ːУдлиненный0x02D0
˟Среднецентрализованный0x02DF0x033D˔Поднял0x02D40x031D
ˌСлоговое письмо0x02CC0x0329˕Понижен0x02D50x031E
͏̯Неслоговый0x032F͏̘Продвинутый корень языка0x0318
˞Ротичность0x02DE͏̙Втянутый корень языка0x0319

Блоки Unicode

От блоков Unicode к скриптам

Фонетические сценарии кодируются шестью Блоки Unicode.

Расширения IPA (U + 0250–02AF)

Расширения IPA[1]
Таблица кодов официального консорциума Unicode (PDF)
 0123456789АBCDEF
U + 025xɐɑɒɓɔɕɖɗɘəɚɛɜɝɞɟ
U + 026xɠɡɢɣɤɥɦɧɨɩɪɫɬɭɮɯ
U + 027xɰɱɲɳɴɵɶɷɸɹɺɻɼɽɾɿ
U + 028xʀʁʂʃʄʅʆʇʈʉʊʋʌʍʎʏ
U + 029xʐʑʒʓʔʕʖʗʘʙʚʛʜʝʞʟ
U + 02Axʠʡʢʣʤʥʦʧʨʩʪʫʬʭʮʯ
Заметки
1.^ Начиная с версии Unicode 13.0

Буквы-модификаторы интервала (U + 02B0–02FF)

Символы в блоке «Буквы-модификаторы интервала» предназначены для образования единства с предыдущей буквой (которую они «модифицируют»). Например. персонаж U + 02B0 ʰ МОДИФИКАТОР СТРОЧНАЯ H не предназначен просто как надстрочный индекс час (час), но как знак устремления, помещенный после всасываемой буквы, как в п "с придыханием глухой двугубный взрывной ". Блок содержит:

  • Буквы-модификаторы надстрочного латинского индекса: (U + 02B0 – U + 02B8): ʰ стремление; ʱ хриплый голос, пробормотал; ʲ палатализация; ʳ, ʴ, ʵ, ʶ r-раскраска или r-offglides; ʷ лабиализация; ʸ палатализация, Американист использование для U + 02B2
  • Разные фонетические модификаторы: (U + 02B9 – U + 02D7): ʹ ʺ ʻ ʼ ʽ ʾ ʿ ˀ ˃ ˄ ˅ ˆ ˇ ˉ ˋ ˌ ˎ ˏ ː ˑ ˒ ˔ ˖ ˗
  • Промежуточные клоны диакритических знаков: (U + 02D8 – U + 02DD): ˘ бреве; ˙ точка выше; ˚ кольцо выше; ˛ огонек; ˜ маленькая тильда; ˝ двойной острый акцент
  • Дополнения на основе IPA 1989 года: (U + 02DE – U + 02E4): ˞ ˟ ˠ ˡ ˢ ˣ ˤ
  • Тональные буквы: (U + 02E5 – U + 02E9): ˥ ˦ ˧ ˨ ˩
  • Расширенный Бопомофо тональные знаки: U + 02EA ˪ МОДИФИКАТОР БУКВА ИНЬ ОТХОДЯЩИЙ ТОНОВЫЙ МАРК; U + 02EB ˫ БУКВА МОДИФИКАТОР ЯН УХОДЯЩИЙ ТОНОВЫЙ ЗНАК
  • Модификаторы IPA: U + 02EC ˬ МОДИФИКАТОР ПИСЬМО ГОЛОСОВАНИЕ, без наддува
  • Другие буквы модификаторов: U + 02EE ˮ БУКВА МОДИФИКАТОР ДВОЙНОЙ АПОСТРОФ для Ненецкий
  • Уральский фонетический алфавит (UPA) модификаторы: (U + 02EF – U + 02FF): ˯ ˰ ˱ ˲ ˳ ˴ ˵ ˶ ˷ ˸ ˹ ˺ ˻ ˼ ˽ ˾ ˿
Буквы модификатора интервала[1]
Таблица кодов официального консорциума Unicode (PDF)
 0123456789АBCDEF
U + 02Bxʰʱʲʳʴʵʶʷʸʹʺʻʼʽʾʿ
U + 02Cxˀˁ˂˃˄˅ˆˇˈˉˊˋˌˍˎˏ
U + 02Dxːˑ˒˓˔˕˖˗˘˙˚˛˜˝˞˟
U + 02Exˠˡˢˣˤ˥˦˧˨˩˪˫ˬ˭ˮ˯
U + 02Fx˰˱˲˳˴˵˶˷˸˹˺˻˼˽˾˿
Заметки
1.^ Начиная с версии Unicode 13.0

Фонетические расширения (U + 1D00–1D7F)

Этот блок вместе с Приложением о фонетических расширениях ниже содержит:

  • Строчные заглавные буквы "ɢ ɪ ɴ ɶ ʀ ʏ ʙ ʜ ʟ"
  • Перевёрнутые строчные буквы «ɐ ɥ ɯ ɹ ɺ ɻ ʇ ʌ ʍ ʎ ʞ ʮ ʯ»
  • Строчные заглавные буквы «ʁ ʛ ᴀ ᴁ ᴃ ᴍ ᴎ ᴏ ᴐ ᴘ ᴚ ᴡ ᴨ ᴩ»
  • Буквы с небными крючками «ƫ ᶀ ᶁ ᶂ ᶃ ᶄ ᶇ ᶈ ᶉ ᶊ ᶋ ᶌ ᶍ ᶎ ᶪ ᶵ»
  • Буквы с ретрофлексными крючками «ᶏ ᶐ ᶒ ᶓ ᶔ ᶕ ᶖ ᶗ ᶘ ᶙ ᶚ ᶩ ᶼ»
Фонетические расширения[1]
Таблица кодов официального консорциума Unicode (PDF)
 0123456789АBCDEF
U + 1D0x
U + 1D1x
U + 1D2x
U + 1D3xᴿ
U + 1D4x
U + 1D5x
U + 1D6x
U + 1D7xᵿ
Заметки
1.^ Начиная с версии Unicode 13.0

Дополнение к фонетическим расширениям (U + 1D80–1DBF)

Дополнение к фонетическим расширениям[1]
Таблица кодов официального консорциума Unicode (PDF)
 0123456789АBCDEF
U + 1D8x
U + 1D9x
U + 1DAx
U + 1DBxᶿ
Заметки
1.^ Начиная с версии Unicode 13.0

Буквы тона модификатора (U + A700 – A71F)

Тональные буквы модификатора[1]
Таблица кодов официального консорциума Unicode (PDF)
 0123456789АBCDEF
U + A70x
U + A71x
Заметки
1.^ Начиная с версии Unicode 13.0

Верхние и нижние индексы (U + 2070–209F)

Верхние и нижние индексы[1][2][3]
Таблица кодов официального консорциума Unicode (PDF)
 0123456789АBCDEF
U + 207x
U + 208x
U + 209x
Заметки
1.^ Начиная с версии Unicode 13.0
2.^ Серые области обозначают неназначенные кодовые точки
3.^ Обратитесь к Блок Unicode дополнения Latin-1 для символов ¹ (U + 00B9), ² (U + 00B2) и ³ (U + 00B3)


Поддержка шрифтов для IPA

Поддержка шрифтов IPA расширяется, и теперь она включена в несколько шрифтов, таких как Times New Roman версии, которые поставляются с различными последними компьютерами операционные системы. Однако диакритические знаки не всегда передаются должным образом. Шрифты IPA, которые бесплатно доступны в Интернете, включают Gentium, несколько из SIL (такие как Charis SIL, и Doulos SIL ), DejaVu Sans, и ТИТУС Кибербита, которые все в свободном доступе; а также коммерческие шрифты, такие как Brill, доступные от Brill Publishers, и Lucida Sans Unicode и Arial Unicode MS, доставка с различными Microsoft продукты. Все они включают в себя несколько диапазонов символов в дополнение к IPA. Современный Веб-браузеры как правило, не требуется никакой конфигурации для отображения этих символов, при условии, что для операционной системы доступен шрифт, поддерживающий это.


Ввод путем выбора на экране

Дальнейшая информация: Ввод Unicode # Выбор с экрана

Апплет для выбора персонажа

Многие системы предоставляют возможность визуального выбора символов Юникода. ISO / IEC 14755 называет это метод ввода с экрана выбора.

Майкрософт Виндоус предоставил Unicode-версию программы Character Map (найдите ее, нажав ⊞ Победа+р затем введите карта диаграммы затем ударил ↵ Enter) начиная с версии NT 4.0 - появляется в потребительской версии с XP. Это ограничено символами в Базовая многоязычная плоскость (BMP). Символы доступны для поиска по имени символа Unicode, и таблица может быть ограничена конкретным блоком кода. Также доступны более продвинутые сторонние инструменты того же типа (примечательный бесплатное ПО пример BabelMap ).

macOS предоставляет «палитру символов» с аналогичными функциями, а также поиск по связанным символам, таблицам глифов в шрифте и т. д. Это может быть включен в меню ввода в строке меню в разделе Системные настройки → Международный → Меню ввода (или Системные настройки → Язык и текст → Источники ввода) или можно просмотреть в разделе Правка → Эмодзи и символы во многих программах.

Эквивалентные инструменты, такие как гучармап (ГНОМ ) или kcharselect (KDE ) - существуют в большинстве настольных сред Linux.

Смотрите также

использованная литература

  1. ^ "Буквы модификатора интервала". Everything2.com. 2002-08-29. Получено 2016-01-23.

внешние ссылки