Поляков А. Е.
Грамматический словарь церковнославянского языка (по материалам корпуса).

Ресурс создан при поддержке РФФИ, проект No 17-04-12064-ОГН «Разработка модулей НКРЯ для автоматической разметки и словарной поддержки старорусских и церковнославянских текстов».

Грамматический словарь церковнославянского языка создан на базе корпуса церковнославянских текстов, который является составной частью проекта «Национальный корпус русского языка» (http://ruscorpora.ru/). Церковнославянский корпус включает около 1250 текстов, которые охватывают все основные типы и жанры церковнославянской литературы (богослужебные, святоотеческие, писание, типикон, церковное право). Корпус имеет объем около 4.6 миллиона словоупотреблений и включает около 150 тыс. различных словоформ, которые группируются примерно в 30 тыс. лексем.

Словарь был создан в 2013 году, а в 2015—2017 году он был существенно переработан и исправлен. Были полностью проверены и исправлены лексемы и их грамматические признаки, все словоформы получили грамматическую интерпретацию. Все уникальные и сомнительные формы были проверены по корпусу, были выявлены и исправлены явные ошибки и опечатки в текстах — всего более 2000 ошибок. Обновлена статистика словоформ с учетом изменения состава корпуса и исправленных ошибок. Были проверены грамматические таблицы и уточнен состав словоизменительных типов (парадигм). В настоящее время проводится интеграция грамматического словаря с корпусом церковнославянских текстов.