Публикации
Родионова А.П., Крижановская Н.Б., Пеллинен Н.А.
Речевой корпус ВепКар как инструмент сохранения диалектной речи прибалтийско-финских народов Карелии
// Ежегодник финно-угорских исследований. Т.17, вып. 3. 2023. C. 343-351
Ключевые слова: Речевой корпус, вепсский язык, карельский язык, корпусная лингвистика, аудио-образцы, разметка текста
Статья посвящена описанию Речевого корпуса прибалтийско-финской речи, созданного на платформе «Открытого корпуса вепсского и карельского языков» (ВепКар), его архитектуре и возможностям. Разработанный сотрудниками Института языка литературы и истории (ИЯЛИ) и Института прикладных математических исследований (ИМПИ) Речевой корпус представляет собой собрание звучащих текстов на разных диалектах карельского и вепсского языков, снабженных транскрипцией, разметкой и переводом на русский язык, а также необходимые для работы поисковые фильтры (поиск по языку/диалекту, месту и году записи, информанту и собирателю, источнику). Актуальность исследования обусловлена необходимостью дальнейшего развития корпуса ВепКар, широко востребованного как в научных исследованиях, так и в процессе развития литературных форм карельского и вепсского языков. Применение современных технологий и методик к накопленному на протяжении многих десятилетий полевому материалу в совокупности с новейшими данными позволит восполнить целый ряд лакун, выявленных лингвистами в данной системе ранее. Для наполнения корпуса аудиозаписями карельской и вепсской речи исследователи используют три основных источника: аудиоколлекции Фонограммархива ИЯЛИ КарНЦ РАН, аудиозаписи передач на ливвиковском наречии карельского языка, а также полевые материалы авторов, записанные в ходе экспедиций. Научная новизна обоснована недостатком речевых корпусов прибалтийско-финских языков. Цифровизация архивных и полевых аудио-образцов карельской и вепсской речи в формате Речевого корпуса в дальнейшем сможет упростить обработку и хранение материалов, позволит ввести в научный оборот и представить в открытый доступ уникальные аудиоматериалы, отражающие состояние карельских и вепсских диалектов начиная с середины прошлого столетия.
Индексируется в РИНЦ, РИНЦ (WS)
Последние изменения: 18 января 2024