Традиционный объект интереса на семинаре – это тексты на естественном языке: новостные заметки, посты в социальных сетях, страницы Википедии, научные статьи. Для их анализа исследуются и разрабатываются алгоритмы NLP: выделения именованных сущностей, разрешения кореферентности, выделения терминов, разрешения лексической многозначности и другие. Разработанный на семинаре фреймворк для обработки текстов Texterra доступен через Интернет на сайте. Также ведутся исследования в области обработки изображений и видеоданных.

Научные интересы:

  • Обработка естественного языка.
    • Базовые задачи обработки естественного языка (морфологический, синтаксический анализ текстов)
  • Построение баз знаний.

Научные публикации:

  • Публикации в рамках проекта Texterra
  • Недумов Я.Р., Турдаков Д.Ю., Майоров В.Д., Овчинников П.Е. Автоматизация процесса нормализации информации при внедрении систем управления основными данными. Программирование. 2013. Т. 39. № 3. С. 3-14.