Шотландский корпус текстов и речи - Scottish Corpus of Texts and Speech - Wikipedia

В Шотландский корпус текстов и речи (Шотландцы) - это текущий проект по созданию корпус современных (после 1940 г.) письменных и устных текстов на Шотландский английский и разновидности Шотландцы. SCOTS доступен в Интернете с ноября 2004 года, и его можно свободно искать и просматривать. К 2015 году он достиг 4,7 миллиона слов.[1]

Проект является совместным проектом Департамента английского языка и проекта STELLA в Университет Глазго. SCOTS финансируется грантом Совет по исследованиям в области искусства и гуманитарных наук.

Разнообразие языков

SCOTS содержит тексты на Шотландский английский и разновидности широкого шотландца, в том числе дорический, Лалланс, городские сорта, такие как Глазго и Островные шотландцы. SCOTS содержит географический распространение текстов, а также демографический распространять. Каждый текст сопровождается обширными метаданные, включая такую ​​информацию, как дату рождения автора, пол, род занятий, место рождения и место жительства, а также подробные сведения о тексте, такие как информация о публикации, аудитория, дата и жанр.

Жанр и режим

SCOTS - это мультимедиа корпус, содержащие письменные и устные тексты, доступные как орфографические транскрипции в сопровождении исходных аудио- или видеофайлов. SCOTS включает в себя большое количество жанры и типы текстов, включая прозу, стихи, деловую и личную переписку, религиозные тексты, парламентские и административные документы, электронную почту, беседы и интервью.

Поиск и анализ

SCOTS можно исследовать различными способами, в зависимости от интересов пользователя. Корпус можно просматривать, например, по имени автора или дате текста, и все тексты могут быть загружены в простой текст формат.

Транскрипции синхронизируются с аудио / видео файлами, которые передаются в потоковом режиме и также могут быть загружены.

Функция расширенного поиска позволяет пользователю создавать более сложные запросы, выбирая из всех полей, доступных в метаданные. Географические результаты нанесены на интерактивную карту, поэтому можно изучить региональные различия.

Результаты расширенного поиска также можно просматривать как KWIC соответствие, которое можно изменить, чтобы выделить коллокационный узоры.

Рекомендации

  1. ^ Копачик, Иоанна (29 апреля 2016 г.). «Венди Андерсон (редактор), язык в Шотландии. Исследования на основе корпуса». Северная Шотландия. 7 (1): 112–117. Дои:10.3366 / nor.2016.0117. ISSN  0306-5278.

внешняя ссылка