LLM-экспансия в Ozon: от помощи операторам КЦ до обработки инцидентов в Jira и создания товарных карточек

Маркетинг
Компания
Ozon – мультикатегорийный маркетплейс с развитой логистической сетью. Компания закрывает самые разные потребности клиентов – от товаров для дома, красоты и здоровья до электроники, одежды и мебели. Продавцы получают не только доступ к многомиллионной базе покупателей, но и инструменты для развития бизнеса. Лучше всего о компании говорят цифры: 370 млн товаров в 20+ категориях, 49 млн активных покупателей, а развивают платформу 5500 IT-специалистов.
Продажи
Июль 2024
Клиентская поддержка
Задача
Chatbots and NLP Team в Ozon работает с подходом AI-driven-development. К любой задаче здесь подходят с позиции, можно ли ее решить с помощью AI. По словам руководителя команды, Дмитрия Васильева, основная фича LLM – это оптимизация и автоматизация рутинных задач.

В Ozon применяется процесс Proof-of-Concept, в рамках которого любой внутренний заказчик может прийти со своей идеей и попросить ее реализовать. Особенность подхода заключается в том, что на ресерч по задаче должно уйти не более 10 рабочих дней. Именно такой подход позволил Chatbots and NLP Team за несколько месяцев протестировать несколько гипотез и внедрить готовые решения в реальные бизнес-процессы.
Инструменты
Своя LLM на базе Mixtral8x7b
Longformer
tf-idf + Cosine Similarity
ruT5
T5Large
BERT
В сервисах поддержки Ozon пользователи всегда общаются с ботом. Если он не справляется, то тикет передается живому человеку. Задача человека — решить вопрос как можно быстрее. Это выгодно и оператору — ведь так он больше заработает, и компании — так как не будет создаваться очередь и пользователи будут довольны. В Ozon решили попробовать повлиять на скорость обработки тикета с помощью LLM и машинного обучения.

Кейс № 1. Помощник оператора

Работа оператора над тикетом всегда состоит из трех этапов:

  1. Определение проблемы пользователя

  2. Решение проблемы

  3. Закрытие тикета
Первые два пункта представляют собой неструктурированные данные, которые довольно сложно анализировать даже человеку: диалог пользователь+бот/пользователь+предыдущий оператор, вычитка инструкций, подготовка ответа.
На первом этапе в Ozon решили саммаризировать диалог до уровня проблемы клиента, а на втором – готовить шаблон ответа пользователю. В обоих случаях была задействована языковая модель.
Кстати, оказалось, что оператор берет ответы на стандартные вопросы не только из инструкций – опытные операторы записывают свои избранные шаблоны ответов в блокнот, так как считают, что персональный подход хорошо влияет на уровень удовлетворенности пользователя.

Так как работа операторов связана с обработкой персональных данных, Ozon не может использовать облачные решения – иначе пришлось бы усложнить процесс согласования такого сервиса, и он все равно не был бы безопасным для пользователя. Поэтому в Ozon используют опенсорс-модели, которые разворачивают на собственном железе. После тщательного анализа выбрали несколько моделей: для саммаризации – ruT5, для подсказок релевантных шаблонов обработанные генеративными моделями текста пропускаются через модели Longformer, tf-idf + Cosine Similarity.

Поиск безопасных решений

За счет внедрения LLM в работу операторов КЦ удалось сократить Average Handling Time (средняя скорость решения тикета) на 20%

Метрика, на которую в Ozon смотрят, – AHT (Average Handling Time, средняя скорость решения тикета). На текущий момент за счет LLM удалось сократить AHT на 20% при покрытии автоматизацией 50-70% в зависимости от направления (LLM-инструменты используются для поддержки покупателей и продавцов).

В планах на 2025 год снизить показатель AHT на 40-50%, при этом увеличить автоматизацию до 90-100%, а также масштабировать решения на другие службы поддержки: агентская поддержка ПВЗ, иностранные селлеры и др.

От метрик к результатам

В Ozon есть настроенный процесс работы с инцидентами. Базово он выглядит так: случилось что-то из ряда вон – создается инцидент – у инцидента есть дежурный, координатор и команда – затем следует решение и закрытие инцидента.

Кейс № 2. Обработка инцидентов

В рамках процесса закрытия задача дежурного в тикете Jira:

  1. Описать таймлайн: выделить важные факты за все время обработки инцидента из треда в корпоративном мессенджере
  2. Подготовить описание инцидента: что случилось, почему случилось, что сделали, чтобы починить, что будем делать дальше
Для классификации важности сообщений в корпоративном мессенджере применяется модель BERT, а для генерации – T5Large. Для обучения использовались исторические тикеты за последние 3 года. По словам Дмитрия, таймлайн модель генерит отлично – дежурные даже не проверяют за ней, а вот с описанием справляется не совсем самостоятельно – иногда галлюцинирует, поэтому коллегам приходится перепроверять.

SMM-специалисты Ozon озвучили проблему, что контента для соцсетей нужно много, а делать его долго. Особенно с учетом того, что нужно соблюдать авторские права на иллюстрации, а изображения для соцсетей должны быть определенных размеров.

Кейс № 3. Генерация изображений для SMM (бот Dreamer)

В рамках процесса Proof-of-Concept был проведен эксперимент с моделью ProteusV0.3 – она базируется на Stable Diffusion, при этом достаточно легковесная, а еще обучена на 10 000 вручную отобранных изображений в высоком разрешении, что позволяет с высоким качеством генерить всё – от кошечек и стульев до человека и самолетов.

Основная проблема оказалась в том, чтобы сгенерить хорошее изображение, нужно написать правильный промпт, а писать правильный промпт нужно уметь. Тогда в Chatbots & NLP Team попросили свою LLM генерить промпт на базе запроса человека – результаты генераций стали ожидаемо хорошими, картинки пошли в прод. Далее в планах научить модель генерировать изображения в стилистике Ozon, а также увеличить размерную сетку.

Промпт как препятствие

Пользовательский промпт: Медведь с балалайкой, на фоне самолеты в небе

Сгенерированный промпт: A realistic painting of a bear playing the balalaika in front of an airplane flying through a clear blue sky High Contrast, Vibrant Colors, Soft Lighting 4K 8K HDR High resolution
В Ozon миллионы карточек товаров, и с каждым днем их становится все больше и больше. Маркетплейс должен максимально качественно и быстро работать с контентом, чтобы покупатели могли найти то, что им необходимо, и купить это.

Кейс № 4. Заполнение товарных карточек

А/Б-тесты показывают, что наличие качественного описания товара повышает конверсию по добавлению в корзину на 0,6%, а конверсия в покупку увеличивается на 0,5%. Это небольшие цифры, но на деле – очень хорошие показатели.

На Ozon продаются товары не только от селлеров, но и товары, которые компания сама закупает на склады. Как быть, если ежедневно у тебя появляются тысячи новых товаров, но специалистов по заполнению карточек всего 8 человек?


Задачу провели по процессу Proof-of-Concept. Оказалось, что собственная модель Ozon отлично генерит описания.
Сейчас описания товаров генерятся с помощью LLM, но сотрудники все еще проверяют за ней. В планах дать этот инструмент внешним селлерам, а также дообучить модель на данных Ozon, чтобы не было необходимости перепроверять результат.
Промпт: Ты должен написать продающее описание товара для интернет-магазина. Описание должно быть креативным, понятным и в несколько абзацев, чтобы человек захотел купить товар. Используй наиболее значимые характеристики товара в описании. Убедись, что твой ответ объективен и не основан на стереотипах.
Советы по популяризации LLM среди сотрудников от Ozon
Советы по популяризации LLM среди сотрудников от Ozon

Другие кейсы