Двигательная теория восприятия речи - Motor theory of speech perception - Wikipedia

В моторная теория восприятия речи это гипотеза, что люди воспринимать произносимые слова путем определения голосовой тракт жесты, которыми они произносятся, а не путем определения звук шаблоны, которые порождает речь.[1][2][3][4][5] Первоначально утверждалось, что восприятие речи осуществляется через специализированный модуль то есть врожденный и для человека. Хотя идея модуля была уточнена в более поздних версиях теории,[5] остается идея, что роль речи двигательная система заключается не только в создании речевых артикуляций, но и в их обнаружении.

Гипотеза вызвала больший интерес за пределами области восприятие речи чем внутри. Это особенно увеличилось после открытия зеркальные нейроны которые связывают производство и восприятие двигательных движений, включая движения голосового тракта.[5]

Теория была первоначально предложена в Лаборатории Хаскинса в 1950-х годах Элвин Либерман и Франклин С. Купер, и развитый далее Дональд Шанквейлер, Майкл Студдерт-Кеннеди, Игнатий Маттингли, Кэрол Фаулер и Дуглас Уэлен.

Истоки и развитие

Когда мы слышим сказанные слова мы чувствуем, что они сделаны из слуховых звуки. Моторная теория восприятия речи утверждает, что за звуками, которые мы слышим, скрываются предполагаемые движения голосовой тракт который произносит их.

Гипотеза берет свое начало в исследованиях с использованием воспроизведение паттернов создавать читающие машины для слепой это заменит орфографические буквы звуками.[6] Это привело к тщательному изучению того, как разговорные звуки соответствуют акустическим. спектрограмма из них как последовательность слуховых звуков. Это обнаружило, что последовательные согласные и гласные накладываются друг на друга во времени (явление, известное как коартикуляция ).[7][8][9] Это предполагает, что речь не слышна как акустический «алфавит» или «шифр», а как «код» перекрывающихся речевых жестов.

Ассоциативный подход

Изначально теория была ассоциативной: младенцы имитируют речь, которую слышат, и это приводит к бихевиористский ассоциации между артикуляцией и ее сенсорными последствиями. Позже эта открытая мимика будет прервана и превратится в восприятие речи.[8] Однако этот аспект теории был отброшен с открытием того, что проязычный младенцы уже мог обнаружить большинство фонетических контрастов, используемых для разделения различных звуков речи.[1]

Когнитивистский подход

На смену бихевиористскому подходу пришел когнитивист тот, в котором был речевой модуль.[1] Модуль обнаружил речь в условиях скрытого дистальные объекты а не на ближайшем или непосредственном уровне их вклада. Доказательством этого послужило исследование, которое обнаружило особенность обработки речи, например дуплексное восприятие.[10]

Смена дистальных объектов

Первоначально предполагалось, что восприятие речи связано с речевыми объектами, которые одновременно

  • инвариантные движения речевых артикуляторов[8]
  • инвариант моторные команды направляется в мышцы для перемещения артикуляторов голосового тракта[11]

Позже это было изменено, чтобы включить фонетические жесты, а не двигательные команды,[1] а затем жесты, предполагаемые говорящим на предвокальном лингвистическом уровне, а не фактические движения.[12]

Современная редакция

Претензия "речь особенная" была снята,[5] поскольку было обнаружено, что восприятие речи может происходить из-за неречевых звуков (например, хлопанье дверью для дуплексное восприятие ).[13]

Зеркальные нейроны

Открытие зеркальные нейроны привела к возобновлению интереса к моторной теории восприятия речи, и у этой теории до сих пор есть свои сторонники,[5] хотя есть и критики.[14]

Поддерживать

Информация о жестах без слуха

Если речь идентифицируется с точки зрения того, как она произносится физически, то неаудиальная информация должна быть включена в речь. восприятия даже если это все еще субъективно слышно как "звуки". На самом деле это так.

  • В Эффект МакГерка показывает, что увидев производство устной слог отличающийся от синхронизированного с ним слухового сигнала, влияет на восприятие слухового сигнала. Другими словами, если кто-то слышит «ба», но видит видео, на котором кто-то произносит «га», то они слышат другое - некоторые люди считают, что слышат «да».
  • Людям легче слышать речь в шум если они могут видеть говорящего.[15]
  • Люди могут лучше слышать слоги, когда можно почувствовать их звучание тактильно.[16]

Категорическое восприятие

Используя синтезатор речи, звуки речи можно варьировать место сочленения вдоль континуума от / bɑ / к / dɑ / к / ɡɑ /, или в время начала голоса на континууме от / dɑ / к / tɑ / (Например). Когда слушателей просят различать два разных звука, они воспринимают звуки как принадлежащие к разным категориям, хотя звуки постоянно меняются. Другими словами, 10 звуков (со звуком на одном конце / dɑ / и звук на другой крайности / tɑ /, а те, что посередине, меняются по шкале) могут все акустически отличаться друг от друга, но слушатель будет слышать их все как / dɑ / или же / tɑ /. Точно так же английский согласный / d / может различаться в своих акустических деталях в зависимости от фонетического контекста (/ d / in / du / технически не звучит так, как в / di /, например), но все / d /в восприятии слушателя попадают в одну категорию (звонкие альвеолярные взрывные), и это потому, что «лингвистические представления - это абстрактные, канонические, фонетические сегменты или жесты, лежащие в основе этих сегментов».[17] Это говорит о том, что люди идентифицируют речь с помощью категоричное восприятие, и поэтому специализированный модуль, такой как предложенный моторной теорией восприятия речи, может быть на правильном пути.[18]

Имитация речи

Если люди могут слышать жесты в речи, имитация речи должна быть очень быстрой, например, когда повторяются слова, которые слышны в речи. наушники как в затенение речи.[19] Люди могут повторять услышанные слоги быстрее, чем они могли бы воспроизвести их обычно.[20]

Производство речи

  • Слуховая речь активизирует мышцы голосового тракта,[21] и моторная кора[22] и премоторная кора.[23] Интеграция слухового и визуального ввода в восприятие речи также затрагивает такие области.[24]
  • Нарушение работы премоторной коры нарушает восприятие речевых единиц, таких как взрывчатые вещества.[25]
  • Активация моторных областей происходит в терминах фонематических функций, которые связаны с артикуляторами голосовых дорожек, которые создают речевые жесты.[26]
  • Восприятию звука речи способствует упреждающая стимуляция моторного представления артикуляторов, ответственных за его произношение.[27]
  • Слуховая и моторная корковая связь ограничена определенным диапазоном частоты возбуждения нейронов.[28]

Сетка восприятие-действие

Существуют доказательства того, что восприятие и производство обычно связаны в двигательной системе. Это подтверждается существованием зеркальные нейроны которые активируются как при просмотре (или слышании) действия, так и при его выполнении.[29] Другой источник доказательств - то, что для общая теория кодирования между представлениями, используемыми для восприятия и действия.[30]

Критика

Моторная теория восприятия речи не получила широкого распространения в области восприятия речи, хотя она более популярна в других областях, таких как теоретическая лингвистика. Как отметили три его сторонника, «у него мало сторонников в области восприятия речи, и многие авторы цитируют его в первую очередь для того, чтобы предложить критический комментарий».[5]п. 361 Существует несколько критических замечаний по этому поводу.[31][32]

Множественные источники

На восприятие речи влияют непроизводственные источники информации, такие как контекст. Отдельные слова трудно понять изолированно, но их легко услышать в контексте предложения. Поэтому кажется, что для восприятия речи используются несколько источников, которые оптимальным образом объединены вместе.[31]

Производство

Моторная теория восприятия речи предсказывает, что речевые моторные способности у младенцев предсказывают их способности к восприятию речи, но на самом деле это наоборот.[33] Также можно было бы предсказать, что дефекты в производстве речи ухудшат восприятие речи, но это не так.[34] Однако это касается только первой и уже вытесненной бихевиористской версии теории, в которой младенцы должны были учиться все модели производства-восприятия путем подражания в раннем детстве. Это уже не основная точка зрения теоретиков моторной речи.

Речевой модуль

Несколько источников доказательств наличия специализированного речевого модуля не нашли подтверждения.

  • Дуплексное восприятие можно наблюдать при дверном хлопке.[13]
  • В Эффект МакГерка также может быть достигнуто с помощью нелингвистических стимулов, таких как показ кому-то видео, на котором прыгает баскетбольный мяч, но воспроизведение звука прыгающего мяча для пинг-понга.[нужна цитата ]
  • Что касается категоричное восприятие, слушатели могут быть чувствительны к акустическим различиям в пределах одной фонетической категории.

В результате некоторые исследователи отказались от этой части теории.[5]

Сублексические задачи

Доказательства, представленные для моторной теории восприятия речи, ограничиваются такими задачами, как распознавание слогов, в которых используются речевые единицы, а не полные произносимые слова или произносимые предложения. В результате «восприятие речи иногда интерпретируется как относящееся к восприятию речи на сублексическом уровне. Однако конечной целью этих исследований, по-видимому, является понимание нейронных процессов, поддерживающих способность обрабатывать звуки речи в экологически приемлемых условиях, т.е. это ситуации, в которых успешная обработка звука речи в конечном итоге приводит к контакту с ментальной лексикой и слуховым восприятием ".[35] Однако это создает проблему «слабой связи с их неявной целью исследования - распознаванием речи».[35]

Птицы

Было высказано предположение, что птицы также слышим друг друга пение птиц в плане вокальных жестов.[36]

Смотрите также

Рекомендации

  1. ^ а б c d Либерман, А. М .; Купер, Ф. С .; Shankweiler, D. P .; Студдерт-Кеннеди, М. (1967). «Восприятие речевого кода». Психологический обзор. 74 (6): 431–461. Дои:10,1037 / ч0020279. PMID  4170865.
  2. ^ Либерман, А. М .; Маттингли И.Г. (1985). «Моторная теория восприятия речи в редакции». Познание. 21 (1): 1–36. CiteSeerX  10.1.1.330.220. Дои:10.1016/0010-0277(85)90021-6. PMID  4075760.
  3. ^ Либерман, А. М .; Маттингли, И. Г. (1989). «Специализация по восприятию речи». Наука. 243 (4890): 489–494. Дои:10.1126 / science.2643163. PMID  2643163.
  4. ^ Либерман, А. М .; Уэлен, Д. Х. (2000). «Об отношении речи к языку». Тенденции в когнитивных науках. 4 (5): 187–196. Дои:10.1016 / S1364-6613 (00) 01471-6. PMID  10782105.
  5. ^ а б c d е ж грамм Galantucci, B .; Fowler, C.A .; Турви, М. Т. (2006). «Обзор моторной теории восприятия речи». Психономический бюллетень и обзор. 13 (3): 361–377. Дои:10.3758 / bf03193857. ЧВК  2746041. PMID  17048719.
  6. ^ Либерман, А. М. (1996). Речь: Особый код. Кембридж, Массачусетс: MIT Press. ISBN  978-0-262-12192-7
  7. ^ Либерман, А. М .; Delattre, P .; Купер, Ф. С. (1952). «Роль выбранных стимулов-переменных в восприятии глухих заглушающих согласных». Американский журнал психологии. 65 (4): 497–516. Дои:10.2307/1418032. JSTOR  1418032. PMID  12996688.
  8. ^ а б c Либерман, А. М .; Delattre, P.C .; Купер, Ф. С .; Герстман, Л. Дж. (1954). «Роль переходов согласный-гласный в восприятии стоповых и носовых согласных». Психологические монографии: общие и прикладные. 68 (8): 1–13. Дои:10,1037 / ч0093673. PDF
  9. ^ Fowler, C.A .; Зальцман, Э. (1993). «Координация и коартикуляция в речевом производстве». Язык и речь. 36 (Pt 2-3) (2-3): 171–195. Дои:10.1177/002383099303600304. PMID  8277807. PDF
  10. ^ Либерман, А. М .; Isenberg, D .; Ракерд, Б. (1981). «Дуплексное восприятие сигналов для стоп-согласных: свидетельство фонетического режима». Восприятие и психофизика. 30 (2): 133–143. Дои:10.3758 / bf03204471. PMID  7301513.
  11. ^ Либерман, А. М. (1970). «Грамматика речи и языка» (PDF). Когнитивная психология. 1 (4): 301–323. Дои:10.1016/0010-0285(70)90018-6.
  12. ^ Либерман, А. М .; Маттингли И.Г. (1985). «Моторная теория восприятия речи пересмотрена» (PDF). Познание. 21 (1): 1–36. CiteSeerX  10.1.1.330.220. Дои:10.1016/0010-0277(85)90021-6. PMID  4075760.
  13. ^ а б Fowler, C.A .; Розенблюм, Л. Д. (1990). «Дуплексное восприятие: сравнение односложных слов и хлопанья двери». Журнал экспериментальной психологии. Человеческое восприятие и производительность. 16 (4): 742–754. Дои:10.1037/0096-1523.16.4.742. PMID  2148589.
  14. ^ Massaro, D. W .; Чен, Т. Х. (2008). «Пересмотр моторной теории восприятия речи». Психономический бюллетень и обзор. 15 (2): 453–457, обсуждение 457–62. Дои:10.3758 / pbr.15.2.453. PMID  18488668.
  15. ^ MacLeod, A .; Саммерфилд, К. (1987). «Количественная оценка вклада зрения в восприятие речи в шуме». Британский журнал аудиологии. 21 (2): 131–141. Дои:10.3109/03005368709077786. PMID  3594015.
  16. ^ Fowler, C.A .; Декле, Д. Дж. (1991). «Слушание глазами и рукой: кросс-модальный вклад в восприятие речи». Журнал экспериментальной психологии. Человеческое восприятие и производительность. 17 (3): 816–828. Дои:10.1037/0096-1523.17.3.816. PMID  1834793.
  17. ^ Nygaard LC, Pisoni DB (1995). «Восприятие речи: новые направления в исследованиях и теории». В J.L. Miller, P.D. Эймас (ред.). Справочник по восприятию и познанию: речь, язык и общение. Сан-Диего: Academic Press. ISBN  978-0-12-497770-9.
  18. ^ Либерман, А. М .; Харрис, К. С .; Hoffman, H.S .; Гриффит Б.С. (1957). «Различение звуков речи внутри и вне границ фонем». Журнал экспериментальной психологии. 54 (5): 358–368. Дои:10,1037 / ч0044417. PMID  13481283.
  19. ^ Марслен-Уилсон, В. (1973). «Лингвистическая структура и слежка за речью с очень короткими задержками». Природа. 244 (5417): 522–523. Дои:10.1038 / 244522a0. PMID  4621131.
  20. ^ Porter Jr, R.J .; Любкер, Дж. Ф. (1980). «Быстрое воспроизведение последовательностей гласных и гласных: свидетельство быстрой и прямой акустико-моторной связи в речи». Журнал исследований речи и слуха. 23 (3): 593–602. Дои:10.1044 / jshr.2303.593. PMID  7421161.
  21. ^ Fadiga, L .; Craighero, L .; Buccino, G .; Риццолатти, Г. (2002). «Слушание речи специально модулирует возбудимость мышц языка: исследование TMS». Европейский журнал нейробиологии. 15 (2): 399–402. CiteSeerX  10.1.1.169.4261. Дои:10.1046 / j.0953-816x.2001.01874.x. PMID  11849307.
  22. ^ Watkins, K. E .; Strafella, A. P .; Паус, Т. (2003). «Видение и слышание речи возбуждает двигательную систему, участвующую в производстве речи». Нейропсихология. 41 (8): 989–994. Дои:10.1016 / с0028-3932 (02) 00316-0. PMID  12667534.
  23. ^ Wilson, S.M .; Сайгин, А.Е. П .; Sereno, M. I .; Якобони, М. (2004). «Прослушивание речи активирует моторные области, участвующие в производстве речи». Природа Неврология. 7 (7): 701–702. Дои:10.1038 / nn1263. PMID  15184903.
  24. ^ Skipper, J. I .; Ван Вассенхов, В .; Nusbaum, H.C .; Смолл, С. Л. (2006). «Слышать губы и видеть голоса: как области коры головного мозга, поддерживающие производство речи, опосредуют аудиовизуальное восприятие речи». Кора головного мозга. 17 (10): 2387–2399. Дои:10.1093 / cercor / bhl147. ЧВК  2896890. PMID  17218482.
  25. ^ Meister, I.G .; Wilson, S.M .; Deblieck, C .; Wu, A.D .; Якобони, М. (2007). «Важнейшая роль премоторной коры в восприятии речи». Текущая биология. 17 (19): 1692–1696. Дои:10.1016 / j.cub.2007.08.064. ЧВК  5536895. PMID  17900904.
  26. ^ Pulvermuller, F .; Huss, M .; Kherif, F .; Москосо дель Прадо Мартин Ф; Hauk, O .; Штыров Ю. (2006). «Моторная кора отображает артикуляционные особенности звуков речи». Труды Национальной академии наук. 103 (20): 7865–7870. Дои:10.1073 / pnas.0509989103. ЧВК  1472536. PMID  16682637.
  27. ^ d'Ausilio, A .; Pulvermüller, F .; Salmas, P .; Bufalari, I .; Begliomini, C .; Фадига, Л. (2009). «Моторная соматотопия восприятия речи». Текущая биология. 19 (5): 381–385. Дои:10.1016 / j.cub.2009.01.017. PMID  19217297.
  28. ^ Ассанео, М. Флоренсия; Поппель, Дэвид (2018). «Связь между слуховой и моторной корой ограничена по частоте: свидетельство внутреннего речево-моторного ритма». Достижения науки. 4 (2): eaao3842. Дои:10.1126 / sciadv.aao3842. ЧВК  5810610. PMID  29441362.
  29. ^ Rizzolatti, G .; Крейгеро, Л. (2004). "Зеркало-нейронная система". Ежегодный обзор нейробиологии. 27: 169–192. Дои:10.1146 / annurev.neuro.27.070203.144230. PMID  15217330. PDF
  30. ^ Hommel, B .; Müsseler, J .; Aschersleben, G .; Принц, В. (2001). «Теория кодирования событий (TEC): основа для восприятия и планирования действий». Науки о поведении и мозге. 24 (5): 849–878, обсуждение 878–937. Дои:10.1017 / с0140525x01000103. PMID  12239891.
  31. ^ а б Массаро, Д. В. (1997). Восприятие говорящих лиц: от восприятия речи к принципу поведения. Кембридж, Массачусетс: MIT Press. ISBN  978-0-262-13337-1.
  32. ^ Лейн, H (1965). «Моторная теория восприятия речи: критический обзор». Психологический обзор. 72 (4): 275–309. Дои:10,1037 / ч0021986. PMID  14348425.
  33. ^ Tsao, F. M .; Liu, H.M .; Куль, П. К. (2004). «Восприятие речи в младенчестве предсказывает развитие речи на втором году жизни: лонгитюдное исследование». Развитие ребенка. 75 (4): 1067–84. Дои:10.1111 / j.1467-8624.2004.00726.x. PMID  15260865.
  34. ^ MacNeilage, P. F .; Rootes, T. P .; Чейз, Р. А. (1967). «Речеобразование и восприятие у пациента с тяжелыми нарушениями эстетического восприятия и моторного контроля». Журнал исследований речи и слуха. 10 (3): 449–67. Дои:10.1044 / jshr.1003.449. PMID  6081929.
  35. ^ а б Hickok, G .; Поппель, Д. (2007). «Корковая организация обработки речи». Обзоры природы Неврология. 8 (5): 393–402. Дои:10.1038 / nrn2113. PMID  17431404. Страницу 394
  36. ^ Williams, H .; Nottebohm, F. (1985). «Слуховые реакции в голосовых двигательных нейронах птиц: моторная теория для восприятия песен у птиц». Наука. 229 (4710): 279–282. Дои:10.1126 / science.4012321. PMID  4012321.

внешняя ссылка