Ru

Анализ мультимодальных данных TopicNet

Разработка инструментов анализа мультимодальных текстовых и транзакционных данных - проект «TopicNet»

Листовка о проекте

Проект не имеет прямых аналогов и направлен на улучшение и повышение доступности инструментов для анализа больших массивов слабо- или неструктурированных мультимодальных (транзакционных, текстовых и визуальных) данных.

topicnetЦелью проекта является создание инструментальной среды «TopicNet» для автоматизированного построения тематических моделей больших массивов данных, что необходимо при создании поисковых и рекомендательных сервисов, анализе новостных потоков СМИ и социальных медиа, поиске в патентных базах и т.д.

«TopicNet» позволит быстро и с минимальным погружением в предметную область строить базовые решения высокой точности в области анализа данных, что откроет большему числу компаний доступ к применению технологий ИИ в своих бизнес-процессах.

«TopicNet» впервые воплотит весь цикл построения и настройки тематических моделей (от предобработки данных, до обучения моделей и сравнения результатов экспериментов) и решит отдельные технологические вызовы в области анализа данных (например, выделение тем в динамическом потоке данных, балансировка тем в несбалансированной коллекции и др.).

image 1_topicnet.png

В результате проекта будет создана среда «TopicNet» в виде:

  • Библиотеки автоматизированного тематического анализа мультимодальных текстовых русскоязычных данных и англоязычных данных с возможностью визуализации тем в потоке информации.
  • Библиотеки предобученных моделей и тематических представлений для разнородных областей человеческих знаний.

Помимо предоставления доступа к среде «TopicNet» в планах коммерциализации – создание на ее базе готовых решений по заказу компаний:

  • система профилирования клиентов банков, финансовых или торговых компаний на основе тематического анализа транзакционных данных;
  • аналитический модуль для обработки обращений клиентов в контактный центр: выявления намерений клиентов, маршрутизации сообщений и др.;
  • аналитический модуль для построения информационно-поисковых сервисов по большим текстовым коллекциям.
Проект реализует Лаборатория машинного интеллекта

Руководитель проекта: заведующий лабораторией, д.ф.-м.н., профессор РАН Воронцов Константин Вячеславович

Партнеры: ПАО «Сбербанк», ООО «1С», АО «МЦ НТТ», Huawei Technologies Co., Ltd.