Базовый латинский алфавит ISO - ISO basic Latin alphabet

В Базовый латинский алфавит ISO это Латинский алфавит и состоит из двух наборов по 26 букв, зашифрованных в[1] различные национальные и международные стандарты и широко используются в международном общении. Это те же буквы, которые составляют английский алфавит.

Два набора содержат следующие 26 букв каждый:[1][2]

Базовый латинский алфавит ISO
Верхний регистр Латинский алфавитАBCDEFгЧАСяJKLMNОпQрSТUVWИксYZ
Строчные буквы Латинский алфавитабcdежгчасяjkлмпопqрsттыvшИксyz

История

К 1960-м годам стало очевидно компьютер и телекоммуникации отрасли в Первый мир что нужен непатентованный метод кодирования символов. В Международная организация по стандартизации (ISO) инкапсулировал Латинский шрифт в их (ISO / IEC 646 ) 7-битный стандарт кодировки символов. Чтобы добиться широкого признания, эта инкапсуляция была основана на популярном использовании. Стандарт был основан на уже опубликованных Американский стандартный код для обмена информацией, более известный как ASCII, который входит в набор символов буквы 26 × 2 английский алфавит. Более поздние стандарты, выпущенные ISO, например ISO / IEC 8859 (8-битная кодировка символов) и ISO / IEC 10646 (Unicode Latin ), продолжали определять буквы английского алфавита 26 × 2 как основной латинский алфавит с расширениями для обработки других букв на других языках.[1]

Терминология

В Блок Юникода который содержит алфавит называется "C0 Controls и базовая латынь ". Существуют два подзаголовка:[3]

  • "Прописные латинские буквы": буквы начинаются с U + 0041 и содержат в своем описании строку LATIN CAPITAL LETTER.
  • "Строчный латинский алфавит": буквы начинаются с U + 0061 и содержат в своем описании строку LATIN SMALL LETTER.

Есть еще два набора в Формы половинной и полной ширины блок:[4]

  • Прописные буквы: буквы начинаются с U + FF21 и содержат в своем описании строку ПОЛНОСТЬЮ ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА.
  • Строчные: буквы начинаются с U + FF41 и содержат в своем описании строку ПОЛНАЯ ШИРИНА ЛАТИНСКАЯ СТРОЧНАЯ БУКВА.

Хронология стандартов кодирования

  • 1865 г. Международный код Морзе был стандартизирован на Международном телеграфном конгрессе в Париже, а позже стал стандартом Международным союзом электросвязи (ITU).
  • 1950-е годы Радиотелефонный орфографический алфавит ИКАО[5]

Временная шкала для широко используемых компьютерных кодов, поддерживающих алфавит

  • 1963: ASCII (7-битный стандарт кодировки символов из Американская ассоциация стандартов, который стал ANSI в 1969 г.)
  • 1963/1964: EBCDIC (разработан IBM и поддерживает те же буквенные символы, что и ASCII, но с разными кодовыми значениями)
  • 1965-04-30: ратифицировано ECMA так как ECMA-6[6] основан на работе Технического комитета TC1 ECMA, проводимой с декабря 1960 года.[6]
  • 1972: ISO 646 (ISO Стандарт 7-битного кодирования символов, использующий те же значения буквенного кода, что и ASCII, пересмотрен во втором издании ISO 646: 1983 и третьем издании ISO / IEC 646: 1991 как совместное ISO / IEC стандарт)
  • 1983: Рек. МСЭ-Т. T.51 | ISO / IEC 6937 (многобайтовое расширение ASCII)
  • 1987: ИСО / МЭК 8859-1: 1987 (8-битная кодировка символов)
    • Впоследствии были опубликованы другие версии и части ISO / IEC 8859.
  • Середина-конец 1980-х: Окна-1250, Окна-1252, и другие кодировки, используемые в Майкрософт Виндоус (некоторые примерно похожи на ISO / IEC 8859-1)
  • 1990: Unicode 1.0 (разработан Консорциум Unicode ),[7][8] содержится в блоке "C0 Controls и базовая латынь "с использованием тех же значений буквенного кода, что и ASCII и ISO / IEC 646.
    • Впоследствии были опубликованы другие версии Unicode, и позже он стал совместным ISO / IEC стандарт, как указано ниже.
  • 1993: ИСО / МЭК 10646-1: 1993, стандарт ISO / IEC для символов в Unicode 1.1
    • Впоследствии были опубликованы другие версии ISO / IEC 10646-1 и одна из ISO / IEC 10646-2. С 2003 года стандарты публикуются под названием «ISO / IEC 10646» без разделения на две части.
  • 1997: Список глифов Windows 4

Представление

Буквы основного латинского алфавита ISO на 16-сегментный дисплей (плюс арабские цифры ).

В ASCII буквы принадлежат печатные символы а в Unicode, начиная с версии 1.0, они принадлежат блоку "C0 Controls и базовая латынь ". В обоих случаях, как и в ISO / IEC 646, ISO / IEC 8859 и ISO / IEC 10646 они занимают позиции в шестнадцатеричной системе счисления от 41 до 5A для прописных букв и от 61 до 7A для строчных.

Без учета регистра, все буквы имеют кодовые слова в Орфографический алфавит ИКАО и может быть представлен азбука Морзе.

Применение

Все строчные буквы используются в Международный фонетический алфавит (IPA). В X-SAMPA и САМПА эти буквы имеют такое же звуковое значение, как и в IPA.

Алфавиты, содержащие одинаковый набор букв

В список ниже включены только алфавиты, в которых отсутствуют:

  • буквы, диакритические знаки которых делают их отдельными буквами.
  • мультиграфы, составляющие отдельные буквы.
АлфавитДиакритическийМультиграфы (не составляющие отдельные буквы)Лигатуры
Африкаанс алфавитá, é, è, ê, ë, я, я, я, ó, ô, ú, û, ý
Каталонский алфавитà, é, è, я, я, ó, ò, ú, ü, ç, lꞏlгу ⟩, ⟨ig ⟩, ⟨ix ⟩, ⟨ll ⟩, ⟨нью-йорк ⟩, ⟨qu ⟩, ⟨rr ⟩, ⟨сс
Голландский алфавитä, é, è, ë, я, ö, üВ диграфij ⟩ Иногда считается отдельной буквой. В этом случае он обычно заменяет или смешивается с ⟨y⟩. Другие орграфы: ⟨аа ⟩, ⟨ае ⟩, ⟨ай ⟩, ⟨au ⟩, ⟨ch ⟩, ⟨ее ⟩, ⟨эй ⟩, ⟨ЕС ⟩, ⟨т.е. ⟩, ⟨э ⟩, ⟨ой ⟩, ⟨оо ⟩, ⟨ОУ ⟩, ⟨ui ⟩, ⟨уу
английский алфавиттолько в заимствованных словах (см. ниже)ш ⟩, ⟨ch ⟩, ⟨еа ⟩, ⟨ОУ ⟩, ⟨th ⟩, ⟨ph ⟩, ⟨нгæ, œ (архаичный)
Французский алфавитà, â, ç, é, è, ê, ë, я, я, ô, ù, û, ü, ÿай ⟩, ⟨au ⟩, ⟨эй ⟩, ⟨ЕС ⟩, ⟨ой ⟩, ⟨ОУ ⟩, ⟨вода ⟩, ⟨ch ⟩, ⟨ph ⟩, ⟨gn ⟩, ⟨ан ⟩, ⟨я ⟩, ⟨en ⟩, ⟨Эм ⟩, ⟨в ⟩, ⟨я ⟩, ⟨на ⟩, ⟨ом ⟩, ⟨ООН ⟩, ⟨ммм ⟩, ⟨yn ⟩, ⟨гм ⟩, ⟨айн ⟩, ⟨цель ⟩, ⟨эйн ⟩, ⟨Oin ⟩, ⟨ао ⟩, ⟨æ, œ
Немецкий алфавит[нужна цитата ]ä, ö, üщ ⟩, ⟨qu ⟩, ⟨ch ⟩, ⟨ph ⟩, ⟨нг ⟩, ⟨т.е. ⟩, ⟨ск ⟩, ⟨эй ⟩, ⟨ЕС ⟩, ⟨äuß (иногда считается письмом)
Итальянский алфавит (расширенный)[а]à, è, é, я, ò, ùch ⟩, ⟨ci ⟩, ⟨gh ⟩, ⟨джи ⟩, ⟨gl ⟩, ⟨gli ⟩, ⟨gn ⟩, ⟨sc ⟩, ⟨наука
Идо алфавитниктоqu ⟩, ⟨ch ⟩, ⟨шникто
Индонезийский алфавиттолько в учебных материалах (см. ниже)кх ⟩, ⟨нг ⟩, ⟨нью-йорк ⟩, ⟨сы ⟩, Дифтонги: ai, au, ei, oi
Алфавит интерлингватолько в неассимилированных заимствованных словах (см. ниже)ch ⟩, ⟨ph ⟩, ⟨qu ⟩, ⟨rh ⟩, ⟨шникто
Яванский латинский алфавитé, èdh ⟩, ⟨кх ⟩, ⟨нг ⟩, ⟨нью-йорк ⟩, ⟨сы ⟩, ⟨thникто
Люксембургский алфавитä, é, ë
Малайский алфавиттолько в учебных материалах (см. ниже)gh ⟩, ⟨кх ⟩, ⟨нг ⟩, ⟨нью-йорк ⟩, ⟨сыникто
Португальский алфавит[b]ã, х, á, é, я, ó, ú, â, ê, ô, à, çch ⟩, ⟨lh ⟩, ⟨нэ ⟩, ⟨rr ⟩, ⟨сс ⟩, ⟨я ⟩, ⟨Эм ⟩, ⟨я ⟩, ⟨ом ⟩, ⟨ммм ⟩, ⟨ãe ⟩, ⟨ão ⟩, ⟨хэникто
Сунданский латинский алфавитéЕС ⟩, ⟨нг ⟩, ⟨нью-йоркникто

Английский - один из немногих современных европейских языков, не требующих диакритических знаков для родных слов (хотя диэрезис используется некоторыми американскими издателями в таких словах, как «сотрудничество»).[c][9]

Сконструированный язык Интерлингва никогда не используйте диакритические знаки, кроме неусвояемых заимствованных слов. Однако их можно удалить, если они не используются для изменения гласной (например, кафе, от Французский: кафе).[10]

Малайский и индонезийский (на основе малайского) - единственные языки за пределами Европы, которые используют весь латинский алфавит и не требуют диакритических знаков и лигатур.[d] Многие из 700+ языков Индонезии, такие как яванский, также используют индонезийский алфавит для написания своих языков.

Нумерация столбцов

Латинский (латинский) алфавит обычно используется для нумерации столбцов в таблице или диаграмме. Это позволяет избежать путаницы с номерами строк, используя арабские цифры. Например, таблица 3 на 3 будет содержать столбцы A, B и C, установленные для строк 1, 2 и 3. Если требуется больше столбцов помимо Z (обычно последняя буква алфавита), столбец немедленно после Z стоит AA, затем AB и так далее (см. биективная система base-26 ). Это можно увидеть, прокрутив страницу вправо в программе для работы с электронными таблицами, например Майкрософт Эксель или LibreOffice Calc.

Это двузначные «буквы» для столбцов таблицы, точно так же, как числа от 10 до 99 - это двузначные числа. В Греческий алфавит имеет аналогичную расширенную форму, в которой при необходимости используются такие двузначные буквы, но она используется для глав братство в отличие от столбцов таблицы.

Такие двузначные буквы для маркированного списка - это AA, BB, CC и т. Д., В отличие от числовой системы значений, описанной выше для столбцов таблицы.

Смотрите также

Заметки

  1. ^ Традиционно считается, что итальянский алфавит состоит всего из 21 буквы, не считая j, k, ш, Икс, y. Однако на практике эти буквы встречаются в ряде заимствований. J также встречается в некоторых родных итальянских именах собственных как вариант написания полуслова я.
  2. ^ Примечание для португальского: k и y (но нет ш) были частью алфавита до нескольких реформ правописания в течение 20 века, целью которых было изменить этимологическое правописание португальского языка на более легкое фонетическое правописание. Эти буквы были заменены другими буквами с таким же звучанием: таким образом психология стал Психология, киоск стал quiosque, мученик стал Мартири др. В настоящее время k, ш, и y встречаются только в иностранных словах и производных от них терминах, а также в научных сокращениях (например, км, байронизм). Эти буквы снова считаются частью алфавита после Соглашение об орфографии на португальском языке 1990 г., который вступил в силу 1 января 2009 года в Бразилии. Увидеть Реформы португальской орфографии.
  3. ^ В качестве примера статьи, содержащей диэрезис в "coöperate", а также акценты на заимствованных словах в английском языке, например седиль в "фасадах" и циркумфлекс в слове "креп" см. Графтон, Энтони (23 октября 2006 г.). "Книги: Чокнутые профессора, История академической харизмы". Житель Нью-Йорка.
  4. ^ Однако в учебных материалах на малайском и индонезийском языках ⟨é (E с острым ударением) может использоваться для уточнения произношения буквы E; в этом случае ⟨e⟩ произносится / ə /, а ⟨é⟩ произносится / e /.

использованная литература

  1. ^ а б c «Интернационализация стандартизации 7-битных кодов, ISO 646». Трансъевропейская ассоциация исследовательских и образовательных сетей (TERENA). Получено 3 октября, 2010.
  2. ^ «RFC1815 - Наборы символов ISO-10646 и ISO-10646-J-1». Получено 3 октября, 2010.
  3. ^ «Элементы управления C0 и базовая латынь» (PDF). Unicode.org. Получено 8 августа, 2016.
  4. ^ «Полуширина и полная форма» (PDF). Unicode.org. Получено 8 августа, 2016.
  5. ^ «Почтовая история ИКАО». www.icao.int. Получено 17 февраля, 2019.
  6. ^ а б Стандартный ECMA-6: набор 7-битных кодированных символов (PDF) (5-е изд.). Женева, Швейцария: Европейская ассоциация производителей компьютеров (Экма). Март 1985 г. В архиве (PDF) из оригинала 29 мая 2016 г.. Получено 29 мая, 2016. Технический комитет TC1 ECMA впервые собрались в декабре 1960 года для подготовки стандартных кодов для целей ввода / вывода. 30 апреля 1965 года стандарт ECMA-6 был принят Генеральной ассамблеей ECMA.
  7. ^ «База данных символов Юникода». Стандарт Юникода. Получено 22 марта, 2013.
  8. ^ Стандартная версия Unicode 1.0, том 1. Эддисон-Уэсли Паблишинг Компани, Инк. 1990 г. ISBN  0-201-56788-1.
  9. ^ "Странный знак Нью-Йорка - диэрезис". 16 декабря 2010 г. Архивировано с оригинал 16 декабря 2010 г.
  10. ^ «Введение в IED (в угловой форме)». www.interlingua.com. Получено 21 сентября, 2020.