Публикации
Новак И.П., Крижановская Н.Б., Бойко Т.П., Пеллинен Н.А.
Разработка правил генерации именных словоформ для новописьменных вариантов карельского языка
Ключевые слова: карельский язык, новописьменный язык, корпусная лингвистика, морфология, именное словоизменение, генерация словоформ
Связывание слов текста (токенов) со значениями лемм в словаре корпуса ВепКар существенно облегчает дальнейшую работу по семантической разметке текстов. Для вепсского подкорпуса ВепКар в 2019 г. были разработаны флективные правила, на их основе в корпус была добавлена функция генерации полной парадигмы по базовым словоформам.
При пополнении словарными статьями трёх подкорпусов карельского языка редакторам необходимо вводить большое число словоформ (около 30 для имён и 150 для глаголов), поэтому разработка алгоритма и компьютерной программы генерации словоформ карельского языка оказалась своевременной.
Индексируется в Web of Science, Scopus, РИНЦ, Google Scholar
Последние изменения: 24 августа 2021