Как «Передовые Платежные Решения» создали AI‑суфлера, который за 2 секунды подсказывает менеджерам ответы на возражения клиентов
«Передовые Платежные Решения» (ППР) — B2B финтех-компания, которая предоставляет бизнесу комплексное решение для управления автопарком, ведения отчетности и контроля расходов. 25 лет назад первым продуктом компании была топливная карта «Вездеход» для контроля расходов водителей на топливо. Сейчас через единый личный кабинет клиенты могут пользоваться экосистемой из 30+ сервисов: оплачивать проезд по платным дорогам, мониторить штрафы, получать аналитику расходов и пр. Продуктами ППР пользуются 100+ тысяч компаний.
TL;DR
«Передовые Платежные Решения» создали AI-суфлера, который в реальном времени анализирует разговор менеджера с клиентом и выдает на экран подсказки по продукту и отработке возражений. Систему с нуля построила внутренняя команда из 12 человек, которая до проекта не имела AI-экспертизы.
Результат: подсказка за 2 секунды, 70% — точность классификации услуг, 92% — качество распознавания речи.
30+ продуктов, 250 тысяч звонков ежемесячно: зачем понадобился AI‑суфлер
Экосистема ППР растет: продуктов становится больше, в них постоянно расширяется функционал. Вместе с этим увеличивается объем информации, которую должен знать менеджер. Ежемесячно сотрудники продаж и сервиса обрабатывают 250 тысяч звонков.
Для B2B-продаж характерен долгий цикл сделки. Поэтому в моменте диалога менеджеру важно всегда вовремя получать релевантную информацию о продуктах и отрабатывать возражения. При этом количество опытных наставников ограничено.
Бизнес сформулировал три задачи:
1. Ускорить «доращивание» новичков
2. Повысить эффективность работы с возражениями
3. Поднять конверсию в продажу
Так появилась идея AI-cуфлера — ассистента, который в реальном времени анализирует разговор и мгновенно выдает на экран релевантные подсказки по продукту и отработке возражений.
AI-суфлер за счет лучших практик и базы знаний, зашитых в модель, может помочь повысить эффективность продаж, а также сократить время выхода новых сотрудников на KPI, снижая нагрузку на наставников и количество индивидуальных консультаци
Учебный проект, который стал реальным: команда без AI‑экспертизы и 6 месяцев разработки
Проект стартовал необычно. 12 сотрудников, которым были интересны AI-технологии, полгода обучались, прежде чем начать разработку.
«Суфлер» задумывался как учебный проект на базе реальных потребностей бизнеса, но вырос в полноценный продукт и стал стартом для развития внутренних AI-проектов компании.
Для команды это был стратегический вклад сразу в несколько направлений: рост внутренней AI-экспертизы, экономию на покупке внешних решений и возможность гибко адаптировать систему под свой бизнес-контекст.
Купить или строить самим: выбор подхода
Перед тем как пойти в собственную разработку, команда провела анализ вендоров AI-решений на рынке.
«Коробочное решение потребовало бы от нас 60–80% тех же усилий по интеграции, адаптации данных и встраиванию в процессы, но лишило бы нас главного — гибкости, скорости изменений и применения накопленной экспертизы. Поэтому мы сознательно выбрали самостоятельную разработку, а также самый простой и контролируемый стек, который может решить задачу сейчас»
Прототип за 3 недели: проверить идею и получить добро от бизнеса
Команда сразу пошла через быстрый прототип. За три недели обучили два BERT-классификатора на ~1 500 транскриптах, собрали две базы знаний в JSON, связали их через промпты с облачной GPT и разработали интерфейс на Django.
Прототип работал, но с задержкой 10–15 секунд. Для реального разговора это слишком медленно, зато хватило, чтобы защитить идею перед бизнесом и получить добро на полноценную разработку.
Второй этап: оптимизация архитектуры через упрощение
На втором этапе команда оптимизировала архитектуру: отказывалась от тяжелых и долгосрочных решений в пользу более простых. Вначале целились в создание своего аудиоконвейера, дообучение LLM, векторную БД с петлей обратной связи. По оценке это заняло бы 12–18 месяцев. Поэтому решили выбрать более простые решения:
- Fine-tuning → RAG. Для дообучения нужно слишком много идеально размеченных данных. RAG закрыл задачу при минимальных затратах.
- Своя транскрибация → Voximplant. Нашли готовый модуль у провайдера телефонии — отпала необходимость строить свой аудиоконвейер.
- Многоклассовый детектор (15+ типов) → бинарный (есть/нет возражение). Резко повысило точность, а детализацию отдали на откуп RAG и LLM.
- Векторная БД → JSON в памяти. Убрали целый слой инфраструктуры — поиск стал мгновенным.
- Облачная GPT → локальная Qwen 8B. Облачные модели давали задержку 7–20 секунд и были под запретом ИБ. Локальная 8B-модель уложилась в 2 секунды.
- Интеграция с CRM → HTML-страница. CRM-интеграция затянулась из-за параллельной миграции. Бэкендер за день написал простую HTML-страницу — это позволило не ждать и запустить пилот.
Средняя задержка формирования подсказки — 2 секунды. Система работает синхронно с реальным разговором.
Актуальный стек проекта
Система предусматривает полный цикл обработки внутри защищенного периметра компании по требованию информационной безопасности, и использует гибридный AI-подход:
Транскрибация
встроенный модуль Voximplant, провайдера телефонии компании. Качество распознавания речи — от 92%
Классификация
дообученные BERT-модели для быстрого определения услуги и наличия возражения
Генерация подсказки
RAG-архитектура с базами знаний + локальная Qwen 8B на собственном GPU-сервере
API и хранение
асинхронный FastAPI на Python 3.11, PostgreSQL для промптов и метрик
Сложности: разметка диалогов
Одна из серьезных сложностей проекта — разметка диалогов. Для качественной разметки нужна не только технология, но и предметная экспертиза: понять контекст возражения, классифицировать его по сложной схеме и оценить реакцию менеджера. Менеджер-наставник, погруженный в процесс продаж, анализирует данные в разы быстрее, чем разработчики.
Полная разметка заняла бы слишком много времени, поэтому команда сфокусировалась на главном: понять, есть ли прямо сейчас в диалоге критическое возражение. Это и привело к замене многоклассового классификатора на бинарный детектор.
«Для решения бизнес-задачи эффективным оказалось движение маленькими, но быстрыми итерациями. Мы сознательно отказывались от важных, но не критичных функций, чтобы сохранить скорость ответа модели»
Три сценария: как суфлер работает в реальных задачах
«Суфлер» прошел тестовые испытания в нескольких командах продаж и сервиса. Во время телефонного разговора на экране менеджера появляются всплывающие подсказки с текстом возражения клиента и текстом отработки.
Отработка возражений
клиент говорит «дорого» — система детектирует возражение и тут же выдает на экран 2–3 проверенных аргумента из базы знаний
Подсказки по продукту
если диалог идет про конкретную услугу (например, аналитику расходов), «Суфлер» подсказывает ключевые преимущества и помогает отвечать на частые вопросы, чтобы менеджер мог ответить уверенно.
Онбординг новичков
для новых сотрудников «Суфлер» работает как интерактивный наставник, который страхует в сложных моментах, пока собственного опыта мало
Команда не проводила масштабных тренингов. Механика простая: увидел подсказку → прочитал → использовал (или нет). База знаний постоянно обновляется на основе обратной связи менеджеров и успешных кейсов
Пилот подтвердил: подсказки работают, менеджеры пользуются
2 секунды
средняя задержка формирования подсказки (в 2–3% случаев до 3 секунд)
70%+
точность классификации услуг (для MVP достаточно; команда знает, как довести до 90%)
92%+
качество распознавания речи (зависит от качества связи)
Финальных бизнес-цифр пока нет — для этого нужно накопить чистые данные после полноценного запуска.
От пилота к платформе: что дальше
Сейчас команда сфокусирована на доработке архитектуры и масштабировании.
Масштабирование — подключение всех команд продаж и сервиса к «Суфлеру».
Интеграция в CRM — встраивание подсказок прямо в интерфейс CRM вместо отдельной HTML-страницы, которая работала на пилоте.
Новые сценарии — расширение базы знаний: помощь не только с возражениями, но и с выявлением потребностей и cross-sell.
Развитие платформы — команда из 12 человек, которая начинала с учебного проекта, превратилась во внутренний центр AI-компетенций. Накопленная экспертиза и инфраструктура станут основой для других AI-решений в компании.
Итоги
ППР показали, что для создания работающего AI-продукта не обязательно иметь готовую AI-команду. Достаточно мотивированных людей, реальной бизнес-задачи и готовности сознательно упрощать архитектуру ради скорости и результата. AI-суфлер — пока MVP, но он уже работает в бою и помогает менеджерам закрывать возражения клиентов в реальном времени.