Публикации
Крижановский А.А.
Оценка использования корпусов и электронных библиотек в Русском Викисловаре
// Корпусная лингвистика–2011: материалы международной конференции. СПб.: С.-Петербургский гос. университет, 2011. C. 217-222
Ключевые слова: Викисловарь, лексикография, машинно-читаемый словарь, корпусная лингвистика
Корпус является важным инструментом лексикографов при создании словарей. В этой работе оценивается – в каком объёме используются различные корпуса и электронные библиотеки в Русском Викисловаре для иллюстрации значений слов и словосочетаний. Викисловарь – это многофункциональный многоязычный словарь и тезаурус. Численная оценка цитат Русского Викисловаря получена с помощью разработанной компьютерной системы автоматического извлечения данных из Викисловаря. На начало 2011 г. Русский Викисловарь содержал больше 280 тысяч словарных статей, из которых было извлечено и сохранено в базу данных машинно-читаемого словаря 51.5 тысяч цитат, из них 82 % иллюстрируют русские слова. На немецком языке (втором по числу цитат) представлено только 3 % от всех цитат. Анализ данных Викисловаря показал, что для каждой третьей цитаты указан корпус текстов или электронная библиотека, из которого получена цитата. Главным источником оказался Национальный корпус русского языка, на который ссылается 95 % цитат с источниками. На втором месте – электронная Библиотека Максима Мошкова, на которую ссылается 1.3 % цитат с источниками (215 цитат).
Индексируется в РИНЦ

wikt_ruscorpora_14_full.pdf (821 Kb, скачиваний: 69)

Последние изменения: 24 мая 2019