Как «Передовые Платежные Решения» создали AI-суфлера, который за 2 секунды подсказывает менеджерам ответы на возражения клиентов

Поделиться кейсом

Generation AI Awards

Надежда Кохтачева

Бизнес-партнер по развитию Департамента бизнес-трансформации, клиентского сервиса и продаж ППР

Финансы

Как «Передовые Платежные Решения» создали AI‑суфлера, который за 2 секунды подсказывает менеджерам ответы на возражения клиентов

«Передовые Платежные Решения» (ППР) — B2B финтех-компания, которая предоставляет бизнесу комплексное решение для управления автопарком, ведения отчетности и контроля расходов. 25 лет назад первым продуктом компании была топливная карта «Вездеход» для контроля расходов водителей на топливо. Сейчас через единый личный кабинет клиенты могут пользоваться экосистемой из 30+ сервисов: оплачивать проезд по платным дорогам, мониторить штрафы, получать аналитику расходов и пр. Продуктами ППР пользуются 100+ тысяч компаний.

TL;DR

 

«Передовые Платежные Решения» создали AI-суфлера, который в реальном времени анализирует разговор менеджера с клиентом и выдает на экран подсказки по продукту и отработке возражений. Систему с нуля построила внутренняя команда из 12 человек, которая до проекта не имела AI-экспертизы.

 

Результат: подсказка за 2 секунды, 70% — точность классификации услуг, 92% — качество распознавания речи.

30+ продуктов, 250 тысяч звонков ежемесячно: зачем понадобился AI‑суфлер

Экосистема ППР растет: продуктов становится больше, в них постоянно расширяется функционал. Вместе с этим увеличивается объем информации, которую должен знать менеджер. Ежемесячно сотрудники продаж и сервиса обрабатывают 250 тысяч звонков.

 

Для B2B-продаж характерен долгий цикл сделки. Поэтому в моменте диалога менеджеру важно всегда вовремя получать релевантную информацию о продуктах и отрабатывать возражения. При этом количество опытных наставников ограничено.

 

 

Бизнес сформулировал три задачи:

1. Ускорить «доращивание» новичков

2. Повысить эффективность работы с возражениями

3. Поднять конверсию в продажу

Так появилась идея AI-cуфлера — ассистента, который в реальном времени анализирует разговор и мгновенно выдает на экран релевантные подсказки по продукту и отработке возражений. 

 

AI-суфлер за счет лучших практик и базы знаний, зашитых в модель, может помочь повысить эффективность продаж, а также сократить время выхода новых сотрудников на KPI, снижая нагрузку на наставников и количество индивидуальных консультаци

Учебный проект, который стал реальным: команда без AI‑экспертизы и 6 месяцев разработки

Проект стартовал необычно. 12 сотрудников, которым были интересны AI-технологии, полгода обучались, прежде чем начать разработку.

 

«Суфлер» задумывался как учебный проект на базе реальных потребностей бизнеса, но вырос в полноценный продукт и стал стартом для развития внутренних AI-проектов компании.

 

Для команды это был стратегический вклад сразу в несколько направлений: рост внутренней AI-экспертизы, экономию на покупке внешних решений и возможность гибко адаптировать систему под свой бизнес-контекст.

Прототип за 3 недели: проверить идею и получить добро от бизнеса

 

Команда сразу пошла через быстрый прототип. За три недели обучили два BERT-классификатора на ~1 500 транскриптах, собрали две базы знаний в JSON, связали их через промпты с облачной GPT и разработали интерфейс на Django.

 

Прототип работал, но с задержкой 10–15 секунд. Для реального разговора это слишком медленно, зато хватило, чтобы защитить идею перед бизнесом и получить добро на полноценную разработку.

Второй этап: оптимизация архитектуры через упрощение


На втором этапе команда оптимизировала архитектуру: отказывалась от тяжелых и долгосрочных решений в пользу более простых. Вначале целились в создание своего аудиоконвейера, дообучение LLM, векторную БД с петлей обратной связи. По оценке это заняло бы 12–18 месяцев. Поэтому решили выбрать более простые решения:

 

  • Fine-tuning → RAG. Для дообучения нужно слишком много идеально размеченных данных. RAG закрыл задачу при минимальных затратах.
  • Своя транскрибация → Voximplant. Нашли готовый модуль у провайдера телефонии — отпала необходимость строить свой аудиоконвейер.
  • Многоклассовый детектор (15+ типов) → бинарный (есть/нет возражение). Резко повысило точность, а детализацию отдали на откуп RAG и LLM.
  • Векторная БД → JSON в памяти. Убрали целый слой инфраструктуры — поиск стал мгновенным.
  • Облачная GPT → локальная Qwen 8B. Облачные модели давали задержку 7–20 секунд и были под запретом ИБ. Локальная 8B-модель уложилась в 2 секунды.
  • Интеграция с CRM → HTML-страница. CRM-интеграция затянулась из-за параллельной миграции. Бэкендер за день написал простую HTML-страницу — это позволило не ждать и запустить пилот.

 

Средняя задержка формирования подсказки — 2 секунды. Система работает синхронно с реальным разговором.

Актуальный стек проекта

 

Система предусматривает полный цикл обработки внутри защищенного периметра компании по требованию информационной безопасности, и использует гибридный AI-подход:

Транскрибация

встроенный модуль Voximplant, провайдера телефонии компании. Качество распознавания речи — от 92%

Классификация

дообученные BERT-модели для быстрого определения услуги и наличия возражения

Генерация подсказки

RAG-архитектура с базами знаний + локальная Qwen 8B на собственном GPU-сервере

API и хранение

асинхронный FastAPI на Python 3.11, PostgreSQL для промптов и метрик

Сложности: разметка диалогов

Одна из серьезных сложностей проекта — разметка диалогов. Для качественной разметки нужна не только технология, но и предметная экспертиза: понять контекст возражения, классифицировать его по сложной схеме и оценить реакцию менеджера. Менеджер-наставник, погруженный в процесс продаж, анализирует данные в разы быстрее, чем разработчики.

 

Полная разметка заняла бы слишком много времени, поэтому команда сфокусировалась на главном: понять, есть ли прямо сейчас в диалоге критическое возражение. Это и привело к замене многоклассового классификатора на бинарный детектор.

Три сценария: как суфлер работает в реальных задачах

«Суфлер» прошел тестовые испытания в нескольких командах продаж и сервиса. Во время телефонного разговора на экране менеджера появляются всплывающие подсказки с текстом возражения клиента и текстом отработки. 

Отработка возражений

клиент говорит «дорого» — система детектирует возражение и тут же выдает на экран 2–3 проверенных аргумента из базы знаний

Подсказки по продукту

если диалог идет про конкретную услугу (например, аналитику расходов), «Суфлер» подсказывает ключевые преимущества и помогает отвечать на частые вопросы, чтобы менеджер мог ответить уверенно.

Онбординг новичков

для новых сотрудников «Суфлер» работает как интерактивный наставник, который страхует в сложных моментах, пока собственного опыта мало

Команда не проводила масштабных тренингов. Механика простая: увидел подсказку → прочитал → использовал (или нет). База знаний постоянно обновляется на основе обратной связи менеджеров и успешных кейсов

Пилот подтвердил: подсказки работают, менеджеры пользуются

2 секунды

средняя задержка формирования подсказки (в 2–3% случаев до 3 секунд)

70%+

точность классификации услуг (для MVP достаточно; команда знает, как довести до 90%)

92%+

качество распознавания речи (зависит от качества связи)

Финальных бизнес-цифр пока нет — для этого нужно накопить чистые данные после полноценного запуска.

От пилота к платформе: что дальше

Сейчас команда сфокусирована на доработке архитектуры и масштабировании.

 

Масштабирование — подключение всех команд продаж и сервиса к «Суфлеру».

 

Интеграция в CRM — встраивание подсказок прямо в интерфейс CRM вместо отдельной HTML-страницы, которая работала на пилоте.

 

Новые сценарии — расширение базы знаний: помощь не только с возражениями, но и с выявлением потребностей и cross-sell.

 

Развитие платформы — команда из 12 человек, которая начинала с учебного проекта, превратилась во внутренний центр AI-компетенций. Накопленная экспертиза и инфраструктура станут основой для других AI-решений в компании.

Итоги

ППР показали, что для создания работающего AI-продукта не обязательно иметь готовую AI-команду. Достаточно мотивированных людей, реальной бизнес-задачи и готовности сознательно упрощать архитектуру ради скорости и результата. AI-суфлер — пока MVP, но он уже работает в бою и помогает менеджерам закрывать возражения клиентов в реальном времени.

Хочу такой кейс