Традиционный объект интереса на семинаре – это тексты на естественном языке: новостные заметки, посты в социальных сетях, страницы Википедии, научные статьи. Для их анализа исследуются и разрабатываются алгоритмы NLP: выделения именованных сущностей, разрешения кореферентности, выделения терминов, разрешения лексической многозначности и другие. Разработанный на семинаре фреймворк для обработки текстов Texterra доступен через Интернет на сайте. Также ведутся исследования в области обработки изображений и видеоданных.
Научные интересы:
- Обработка естественного языка.
- Базовые задачи обработки естественного языка (морфологический, синтаксический анализ текстов)
- Построение баз знаний.
Научные публикации:
- Публикации в рамках проекта Texterra
- Недумов Я.Р., Турдаков Д.Ю., Майоров В.Д., Овчинников П.Е. Автоматизация процесса нормализации информации при внедрении систем управления основными данными. Программирование. 2013. Т. 39. № 3. С. 3-14.