Уникальная тестовая система основана на использовании нейросетевых технологий и алгоритмов адаптивного тестирования, при этом она обобщила лучшие практики международных языковых экзаменов TOEFL, IELTS, Cambridge English. Благодаря интеграции новейших LLM (Больших языковых моделей) ИИ-платформа выполняет сложный лингвистический анализ и обеспечивает точную и беспристрастную оценку уровня владения языком, исключает «человеческий фактор», а также предоставляет возможность легкого масштабирования.
До внедрения технологического решения была проведена большая работа, связанная с созданием уникальных тестов, вобравших в себя все лучшие практики международных экзаменов (TOEFL, IELTS, Cambridge English) и лингвистических баз данных. Лингвистический блок команды подготовил систему измерительных материалов, собрал аналитику, проведя качественный анализ на основе работ более 10.000 человек, прошедших тестирование. Языковые модели обучались на тестовом материале, проверенном сертифицированными экспертами международного уровня», - сказала Елена Базанова.
Техническая разработка платформы заключалась в создании надежной программной инфраструктуры, объединяющей множество нейросетевых решений и сервисных приложений. Это включало в себя создание Docker-контейнеров для различных микросервисов, разработку HTTP API для взаимодействия с системой и реализацию алгоритмов адаптивного тестирования. Архитектура платформы поддерживает синхронизацию модулей языковой модели и обработку текстовых и аудиоданных. В процессе разработки особое внимание уделялось обеспечению масштабируемости и надежности, а также всестороннему тестированию и валидации для обеспечения точности оценки уровня владения языком», - пояснил ведущий разработчик проекта, аспирант ФПМИ МФТИ Тендай Чикаке.
Еще одна сложность заключалась в реализации алгоритмов адаптивного тестирования, которые точно предсказывают сложность последующих тестовых заданий на основе предыдущих ответов. Обеспечение масштабируемости и надежности при сохранении высокой точности оценок представляло значительные трудности, особенно с учетом того, что в некоторых подсистемах используются устаревшие библиотеки. Кроме того, остается актуальной задача улучшения сбора данных и аннотирования для новых циклов обучения и тонкой настройки», - дополнил Тендай Чикаке.