Публикации
Крижановский А.А., Крижановская Н.Б., Родионова А.П.
Архитектура корпусного менеджера и разметка текстов корпуса ВепКар
// Электронная письменность народов Российской Федерации: опыт, проблемы и перспективы. Материалы межд. науч. конференции (Уфа, 27-29 ноября 2019 г.). 2019. C. 19-23
Ключевые слова: вепсский язык, карельский язык, корпусная лингвистика, разрешение лексической многозначности, разметка текста
Открытый корпус вепсского и карельского языков (ВепКар) представляет интерес не только для языковедов, но и для диалектологов, поскольку диалектные тексты даны с подробной паспортизацией (указано имя информанта, год и место его рождения, место записи, диалект и так далее). В статье рассмотрен наименее проработанный людиковский подкорпус. Кратко представлена архитектура разработанного корпусного менеджера dictorpus, обслуживающего корпус ВепКар. Описана разметка текстов, семантическая и грамматическая связь между словами в текстах корпуса и словарными статьями. В планы развития корпуса входит семантическая категоризация значений лемм на основе сопоставительно-ономасиологического словаря и разработка морфологического анализатора на основе конечных автоматов.
Индексируется в РИНЦ, Google Scholar

Препринт (544 Kb, скачиваний: 107)

Последние изменения: 24 августа 2021