Как Skyeng использует нейросети, чтобы определять уровень языка студента и строить образовательную траекторию

Компания
Skyeng — крупнейшая в России образовательная компания. Со Skyeng сотрудничают около 15000 высококвалифицированных педагогов, а обучение в сервисе проходят более 150000 учеников. У школы есть собственная образовательная платформа, которая интегрирована с личным словарем и мобильным приложением.


Сентябрь 2024
EdTech
Инструменты
ChatGPT
Другие LLM
Самым действенным способом подтверждения уровня английского сегодня является прохождение экзаменов TOEFL или IELTS. Но подготовка к ним — трудоемкий и не всем доступный процесс. На старте занятий с репетитором уровень определяется с помощью длительного тестирования, а детальный разбор отстающих зон английского языка тоже может занять несколько уроков. Решения, которое позволяло бы быстро и достоверно оценить уровень языковой базы студента и сформировать в соответствии с этим уровнем учебный план, на рынке не было.


Контекст

Разработать инструмент, который поможет оцифровать знания студента до старта обучения, проанализировать слабые места и с опорой на эти данные построить образовательную траекторию учащегося.

Задача

Skyeng занимается оцифровкой образовательных результатов своих студентов уже 10 лет. Благодаря собственным технологиям распознавания речи компании удалось сделать расшифровку большого количества уроков. На их основе была выстроена система анализа словарного запаса, произношения, грамматических и фонетических конструкций.
Накопленная база знаний и инструментов позволила компании создать AI Avatar (протестировать можно здесь) – это голосовой ассистент на базе нейросетей, к которому студент может обратиться за проверкой уровня своего языка прямо на платформе Skyeng. Диалог между студентом и ассистентом происходит в окне чата с помощью голосовых сообщений. Под капотом у AI Аватара – несколько языковых моделей, включая ChatGPT, за управление ходом диалога отвечает система промптов.

Как устроен AI Avatar

Механика тестирования следующая: ассистент, персонаж-андроид из 2049 года, сначала задает студенту базовые вопросы (имя, место проживания), а затем начинает активно поддерживать разговор, уточнять детали, отвечать на встречные вопросы студента и даже импровизировать, рассказывая, как тот или иной аспект жизни устроен в будущем.


Благодаря интеграции с LLM, робот способен поддерживать беседу практически на любую тему (именно поэтому тестирование интересно проходить не один раз), задавая релевантные и порой весьма вдумчивые вопросы.
Распознавание голосового сообщения студента и генерация ответной реплики занимает пару секунд, при этом ассистент удерживает контекст беседы и может ссылаться на детали, упомянутые в разговоре ранее. Задача студента – болтать с ассистентом около 15 минут, пока не будут закрыты этапы в 50, 150, 300, 500, 800 использованных в беседе слов.
Обработка результатов занимает около 5 минут, после чего студент получает развернутый анализ разговора.

Анализ результатов тестирования

Оценка навыка речи от А1 до С2 по пяти параметрам
Развернутый комментарий: что было хорошо, а что стоит исправить
Оценка темпа речи и его сравнение с уровнем носителя языка
Оценка словарного запаса с точностью до 91%

Оценка навыка речи от А1 до С2 по пяти параметрам
Развернутый комментарий: что было хорошо, а что стоит исправить
Оценка темпа речи и его сравнение с уровнем носителя языка
Оценка словарного запаса с точностью до 91%

Ассистент оценивает активный словарный запас пользователя и с помощью элементов предиктивной аналитики предсказывает лексику, грамматику и фонетику, которую может знать студент. При этом AI Avatar анализирует слова по их значению и применению в речи, а не созвучию, потому что различная лексика может использоваться как в простых конструкциях уровня A1–A2, так и в более сложных.
Особенностью решения является распознавание английской речи с учетом акцента носителей русского языка и их ошибок. Это позволяет рекомендательной системе корректнее распознавать речь и уже на ее основе предлагать корректировки.
Skyeng использует собственную ASR-технологию, которая учитывает то, как может говорить ученик на не родном языке.
Также она убирает длительные паузы, распознает созвучные слова (know, no), распознает слова с ошибками в фонетике или грубыми ошибками в грамматике.

Итоги

Тестирование в Avatar AI прошли более 10 тысяч студентов, точность определения уровня языка студента при длительности разговора более 10 минут составляет 90%. Аналогичное тестирование с преподавателем занимает не менее 2-х часов. Помимо аналитики уровня пользователя, Avatar AI, подобно живому преподавателю, разбирает ошибки в речи и предлагает возможные варианты, как можно выразиться лучше.
Уже две школы используют этот тест для проверки знаний своих студентов и создания персонального образовательного трека ученика.


В планах компании — верифицировать Avatar AI в качестве одного из вариантов подтверждения знания языка, сделав его таким же стандартом качества, как IELTS и TOEFL. На основе результатов, которые дало внедрение ассистента на базе LLM планируется улучшать персонализированные траектории студентов с помощью системы тестирования, диагностирующей в моменте освоение студентом тех или иных тем.

Планы

Другие кейсы