Акустическая фонетика - Acoustic phonetics

Акустическая фонетика является подполем фонетика, который касается акустический аспекты речь звуки. Акустическая фонетика исследует такие особенности временной области, как средний квадрат амплитуда из форма волны, его продолжительность, его основная частота, или функции частотной области, такие как частотный спектр, или даже объединили спектрально-временные особенности и связь этих свойств с другими разделами фонетики (например, артикуляционный или же слуховая фонетика ), и абстрактным лингвистическим концепциям, таким как фонемы, фразы или высказывания.

Изучение акустической фонетики значительно расширилось в конце 19 века с изобретением Эдисон фонограф. Фонограф позволял записывать речевой сигнал, а затем обрабатывать и анализировать его. Воспроизводя один и тот же речевой сигнал от фонографа несколько раз, каждый раз фильтруя его разными полосовой фильтр, а спектрограмма речевого высказывания можно было выстроить. Серия статей Людимар Германн опубликовано в Pflügers Archiv в последние два десятилетия XIX века исследовали спектральные свойства гласных и согласных с помощью фонографа Эдисона, и именно в этих работах термин формант был впервые представлен. Германн также воспроизводил записи гласных, сделанные с помощью фонографа Эдисона, с разной скоростью, чтобы различать Уиллис и Уитстона теории образования гласных.

Дальнейшие успехи в акустической фонетике стали возможны благодаря развитию телефон промышленность. (Кстати, Александр Грэхем Белл отец, Александр Мелвилл Белл, был фонетиком.) Во время Вторая Мировая Война, работать в Bell Telephone Laboratories (который изобрел спектрограф ) значительно облегчило систематическое изучение спектральных свойств периодический и апериодические звуки речи, голосовой тракт резонансы и гласная форманты, качество голоса, просодия, так далее.

Интегрированные остатки линейного предсказания (ILPR) были эффективной функцией, предложенной Т. В. Анантхападманабхой в 1995 году, которая близко приближается к сигналу голосового источника.[1] Это оказалось очень эффективным для точной оценки эпох или момента закрытия голосовой щели.[2] А. Г. Рамакришнан и др. в 2015 году показали, что коэффициенты дискретного косинусного преобразования ILPR содержат информацию о динамике, которая дополняет кепстральные коэффициенты частоты mel.[3] Индекс взрыва - еще одна скалярная функция во временной области, которую представили Т. В. Анантападманабха и др. для характеристики замыкания-взрывного перехода стоп-согласных.[4]

Теоретически акустику речи можно смоделировать аналогично электрические схемы. Лорд Рэйли был одним из первых, кто осознал, что новую электрическую теорию можно использовать в акустике, но только в 1941 году схемная модель была эффективно использована в книге Чибы и Кадзиямы под названием «Гласный: его природа и структура». (Эта книга японских авторов, работающих в Японии, была издана на английском языке в разгар Второй мировой войны.) В 1952 г. Роман Якобсон, Гуннар Фант, и Моррис Халле написал «Предварительные сведения к анализу речи», основополагающую работу, связывающую акустическую фонетику и фонологическую теорию вместе. За этой небольшой книгой в 1960 г. последовала книга Фанта «Акустическая теория речевого образования», которая оставалась основной теоретической основой для акустических исследований речи как в академии, так и в промышленности. (Сам Фант был очень вовлечен в телефонную индустрию.) Другие важные создатели этой области включают Кеннет Н. Стивенс автор книги «Акустическая фонетика», Осаму Фуджимура и Питер Лэйдфогед.

Смотрите также

Библиография

  • Кларк, Джон; И Яллоп, Колин. (1995). Введение в фонетику и фонологию (2-е изд.). Оксфорд: Блэквелл. ISBN  0-631-19452-5.
  • Джонсон, Кит (2003). Акустическая и слуховая фонетика (в иллюстрациях). 2-е издание Blackwell Publishing Ltd. ISBN  1-4051-0122-9 (переплет: щелочная бумага); ISBN  1-4051-0123-7 (мягкая обложка: щелочная бумага).
  • Ladefoged, Питер (1996). Элементы акустической фонетики (2-е изд.). Издательство Чикагского университета, Ltd. Лондон. ISBN  0-226-46763-5 (ткань); ISBN  0-226-46764-3 (бумага).
  • Фант, Гуннар. (1960). Акустическая теория речевого образования с расчетами на основе рентгеновских исследований русской артикуляции. Описание и анализ современного стандартного русского языка (№ 2). s'Gravenhage: Мутон. (2-е изд. Издано в 1970 г.).
  • Хардкасл, Уильям Дж .; И Лейвер, Джон (ред.). (1997). Справочник фонетических наук. Оксфорд: издательство Blackwell Publishers. ISBN  0-631-18848-7.
  • Германн, Л. (1890) "Phonophotographische Untersuchungen". Архив Пфлюгера. f. d. ges Physiol. LXXIV.
  • Якобсон, Роман; Фант, Гуннар; & Холли, Моррис. (1952). Подготовка к анализу речи: отличительные черты и их корреляты. Технический отчет лаборатории акустики МИТ (№ 13). Кембридж, Массачусетс: MIT.
  • Фланаган, Джеймс Л. (1972). Анализ речи, синтез и восприятие (2-е изд.). Берлин: Springer-Verlag. ISBN  0-387-05561-4.
  • Kent, Raymond D .; & Читать, Чарльз. (1992). Акустический анализ речи. Сан-Диего: Singular Publishing Group. ISBN  1-879105-43-8.
  • Писони, Дэвид Б .; И Ремез, Роберт Э. (ред.). (2004). Справочник по восприятию речи. Оксфорд: Блэквелл. ISBN  0-631-22927-2.
  • Стивенс, Кеннет Н. (2000). Акустическая фонетика. Современные исследования в лингвистике (№ 30). Кембридж, Массачусетс: MIT. ISBN  0-262-69250-3.
  • Стивенс, Кеннет Н. (2002). «К модели лексического доступа, основанной на акустических ориентирах и отличительных признаках». Журнал акустического общества Америки. 111 (4): 1872–1891. Дои:10.1121/1.1458026. PMID  12002871. S2CID  1811670.

Рекомендации

  1. ^ T. V. Ananthapadmanabha, «Акустические факторы, определяющие воспринимаемое качество голоса», в Физиология голосовых связок - Контроль качества голоса, O.Fujimura and M. Hirano, Eds. Сан-Диего, Калифорния: издательская группа Singualr, 1995, гл. 7. С. 113–126.
  2. ^ А. П. Пратош, Т. В. Анантападманабха и А. Г. Рамакришнан, «Извлечение эпохи на основе интегрированного линейного остатка предсказания с использованием индекса взлома», IEEE Transactions on Audio, Speech, and Language Processing, 2013, Vol. 21, вып. 12. С. 2471-2480.
  3. ^ А. Г. Рамакришнан, Б. Абхирам и С. Р. Махадева Прасанна, «Характеристика источника голоса с использованием синхронного дискретного косинусного преобразования высоты тона для идентификации говорящего», Журнал Американского акустического общества, экспресс-письма, том. 137 (), стр., 2015.
  4. ^ Т. В. Анантападманабха, А. П. Пратош, А. Г. Рамакришнан, «Обнаружение переходов закрытие-взрыв стопов и аффрикатов в непрерывной речи с использованием индекса взрыва», Журнал Американского акустического общества, том. 137, 2015.

внешняя ссылка