Мы разрабатываем систему, позволяющую пользователю из данных произвольного уровня структурированности пополнять граф знаний и в последствии проводить аналитическую работу над графом.
Существуют два вида поиска:
- полнотекстовый (по неструктурированным данным, пользователи ведут себя как в Google, для нас это поиск по документам)$
- графовый (существуют графовые СУБД, позволяющие выполнять запросы в духе «покажи мне всех друзей моих друзей, которые имеют высшее образование и при этом имеют как минимум 5 общих друзей», для нас это поиск по графу знаний).
В системах обычно работает 1 из 2 вариаций поиска, мы же хотим сделать общий механизм, чтобы можно было выполнять запросы по типу «покажи мне все документы, в которых говорится о награде (текстовая часть) выпускников технических ВУЗов моложе 30 лет (графовая часть)».
Актуальными задачами, которые можно оформить в виде тем работ являются:
- Разработка языкового сервера для языка запросов TQL.
- Модель подсказок для TQL, основанная на истории запросов пользователей системы.
- Модель подсказок для TQL, основанная на содержимом свежих данных, поступивших в систему.