Продуктовый подход к AI: как ВкусВилл отбирает гипотезы, которые окупаются
Большинство AI-проектов не доходят до масштабирования. Во ВкусВилле это не считают проблемой: команда «Открытых инноваций» изначально строит процесс так, чтобы быстро отбраковывать слабые идеи и вкладываться только в те, что подтверждаются цифрами.
За несколько лет команда выработала подход, в котором гипотезы сначала проверяют с минимальными затратами, а решение о развитии принимают только после пилота. В статье разбираемся, как этот подход работает на примере ИИ-помощника покупателя, который технически работал хорошо, но не стал продуктом.
Контекст рынка: почему AI‑проекты не доходят до отдачи
Бизнес массово не получает отдачи от AI. Отчет MIT «The GenAI Divide: State of AI in Business 2025» зафиксировал: 95% пилотов не дают измеримого эффекта на прибыль. По данным S&P Global Market Intelligence, доля компаний, свернувших большинство AI-инициатив, выросла за год с 17% до 42%. В среднем организация закрывает 46% пилотов до выхода в продакшн.
Причина, по выводам MIT, в процессе внедрения и организационной зрелости; сами модели почти ни при чем. Внедрения через внешних подрядчиков и партнерства окупаются примерно в 67% случаев, втрое чаще внутренней разработки.
Именно поэтому во ВкусВилле стараются вкладываться не в технологии, а в проверку гипотез.
Путь от боли к решению: почему ВкусВилл не внедряет AI ради AI
Любой проект команды «Открытых инноваций» ВкусВилла начинается с проблемы. Иногда боль приносит бизнес, иногда команда сама находит узкие горлышки в процессах. Цель всегда — или увеличить выручку, или сократить расходы.
Дальше команда ищет решение, смотрит, как ту же задачу закрывают конкуренты, смежные отрасли и зарубежные коллеги. Технологическую экспертизу находят на внешнем рынке: сотрудничают с разными подрядчиками — от студенческих команд до больших корпораций. Технология здесь вторична: если боль закрывается без нее, ее закрывают без нее.
Во ВкусВилле мы не запускаем трендовую технологию ради технологии. Если задачу можно закрыть без AI, мы стараемся сделать это. Во всех инициативах для нас важен конечно результат: сколько компания сэкономила или заработала. Сделано ли это за счет дообученной LLM или руками живого сотрудника, не так важно.
Кейс ИИ‑помощника покупателя: дешевая проверка сильной гипотезы
Подход команды нагляднее всего виден на гипотезе, которая не подтвердилась. Команда полтора года вынашивала сильную идею, проверила ее малыми силами и в итоге свернула инициативу без затрат на полноценную разработку.
Проблема. В каталоге ВкусВилла легко потеряться: ассортимент огромный, и по логам сайта пользователь проводил в нем в среднем 26 минут — почти полчаса на один выбор. Ориентир команда взяла в зарубежном ритейле: у Walmart в приложение встроен AI-помощник, который ведет покупателя разговором и подбирает товары под запрос. В июне 2025 года Walmart представил его под именем Sparky и сообщил, что им пользуется около половины аудитории приложения.
Гипотеза. Заменить классический поиск AI-помощником, который подбирает продукт под любой запрос покупателя. В этом случае должен вырасти средний чек корзины.
Во ВкусВилле огромный ассортимент продуктов для здорового питания, который помогает поддерживать привычный образ жизни. Если человек, например, следит за КБЖУ, ему хочется быстро подобрать себе рацион, но открывать каждую карточку вручную и складывать калории слишком долго.
Так родилась идея: вместо обычного поиска создать AI-помощника, который подбирает продукт под любой запрос. Пришел после спортзала — он предложит белковый перекус. Хочется десерт с ягодами, но без лактозы — подберет и его.
Проверка. Гипотезу проверяли поэтапно и минимальным ресурсом:
- Провели дискавери до разработки. Подняли прошлые исследования о том, как покупатели выбирают товары, изучили логи приложения, собрали фокус-группу из полусотни теплых контактов
- Нашли внешнюю команду, которая запромптила ChatGPT и настроила интерфейс сервиса в бренде ВВ. Полноценная разработка «внутри» стоила бы в несколько раз дороже.
- Прогнали 500 типовых запросов, оценили ответы сервиса людьми и другими моделями и получили релевантность 89%
- Не получили возможности развернуть сервис сразу в приложении и проверили гипотезу там, где это было дешевле всего — в офлайн-магазинах. Разместили QR-баннеры и NFC-стикеры в 30 магазинах, где покупатель принимает решение у полки.
Оффлайн дал и наглядную метрику: подбор через помощника занимал около 3 минут против 26 в каталоге, то есть в десять раз быстрее.
Итоги. За три месяца оффлайн-тест дал однозначный ответ:
- Собрал около 370 запусков.
- Показал почти нулевой ретеншн.
- Выявил баннерную слепоту: часть покупателей не замечала рекламных материалов.
Мы верили в продукт. Интервью и логи показывали, что боль долгого и изматывающего выбора существует, а технические тесты говорили о высокой точности работы модели, но, кажется, рынок к такому сервису пока не готов. По крайней мере в гибридном варианте: когда продукт для онлайна тестируется в офлайне. Но даже в тесте в онлайне, который проводила другая команда, мы видим, что пользователи остаются на привычном поиске. Показательный разрыв: на интервью покупатели говорили, что пользовались бы AI-ассистентом постоянно, при этом ретеншн в продукте был нулевым.
Вывод. Тест остановил разорванный путь пользователя: человек подбирал корзину в сервисе, убирал телефон и шел искать физические товары на полке. Возвращаться к сервису в онлайне было незачем. Проверка обошлась малыми силами и дала ясный ответ: сервис для офлайна должен быть другим, и нужно пересобирать пользовательский сценарий. Ради этого и нужна ранняя дешевая проверка.
Читайте также: 5 признаков того, что ваш AI‑проект рискует провалиться еще до запуска.
Как отбирать гипотезы: вера, насмотренность и расчет в деньгах
Каждый продакт ведет свой мини-стек и запускает гипотезы самостоятельно. Ресурс ограничен, поэтому гипотеза оценивается по нескольким фильтрам:
Экспертиза и уверенность продакта
Если проект драйвит менеджера, то вероятность на успех гораздо выше.
Насмотренность команды
Оценка шансов по десяткам прошлых проектов.
Расчет в деньгах
Эффект прикидывают по похожим прошлым тестам, чтобы определить хотя бы порядок цифр.
В команде также есть рабочий принцип: на брейнштормах сразу ищут аргументы, почему идея сработает, а не умрет на старте. Это удерживает команду от токсичного скепсиса и открывает углы, которые иначе не увидеть.
Читайте, как ВкусВилл превращает инициативу сотрудников в продукты. Более 26 AI-проектов за полтора месяца после хакатона
Как проектировать пилот гипотезы, чтобы результату можно было верить
Прежде чем раскатывать AI-решение на всю сеть, команда проверяет гипотезу на пилоте на ограниченном контуре. Это может быть несколько десятков магазинов или какой-нибудь внутренний отдел, тестовый контур зависит от проекта. Решение о полном внедрении принимают по цифрам пилота, поэтому он должен давать результат, которому можно доверять и который повторится на масштабе.
Главное правило — зафиксировать гипотезу и метрики до старта, не подгоняя их по ходу. Берут одну–три ключевые метрики плюс защитные: если следить за десятком показателей, хотя бы один прокрасится случайно, и пилот ничего не докажет.
Полный список требований к пилоту команда свела в чек-лист:
|
Правило |
Что делает команда |
Зачем |
|
Гипотеза и метрики до старта |
Фиксирует формулировку “если сделаем то, то изменится это”, а также цифры заранее, не меняет их по ходу |
Результат нельзя подогнать задним числом |
|
От 1 до 3 ключевых метрик |
Берет максимум три главные плюс защитные |
На десятке метрик что-то точно сдвинется случайно, результаты пилота будут не валидными |
|
Типичные точки для пилота |
Тестирует на магазинах, в которых поведение покупателя похоже на большинство остальных точек |
Иначе результат не повторится при масштабировании |
|
Реальное исполнение на точках |
Следит, что сотрудники каждый день выполняют новые действия |
Иначе пилот идет только на бумаге |
|
Сначала проверка вручную, без технологий |
Проверяет идею вручную до внедрения технологии |
Не платит за разработку раньше, чем подтвержден эффект |
|
Маленькие итерации |
Запуск → замер → правка → повторный замер |
Дешевле одного большого запуска |
Как понять, когда убивать идею AI‑проекта
Решение закрыть гипотезу лучше принимать как можно раньше. Чем дольше живет проект, тем сильнее к нему привязываешься: вложено время и силы, бросить психологически тяжело. Ранний отказ от проекта экономит ресурсы.
Защита от привязанности — внешний человек с холодной головой. Например, аналитик. В среднем ему безразлично, насколько идея гениальна, он смотрит только на цифры до пилота и после него.
К этому подходу команда пришла не сразу: раньше продакты считали аналитику сами, без навыка работать со статистической значимостью. Когда продакт сам считает результат своего теста, тогда легче всего себя обмануть. Поэтому валидацию передали отдельной команде аналитиков, не заинтересованному в исходе.
Как выбрать технологию для AI‑проекта
Технологию выбирают, исходя от окупаемости, а точность модели и новизна фичи идут следом. Сначала эффект проверяют вручную на ограниченном контуре, например на 30 точках, и считают, сколько проект экономит или зарабатывает. Только потом под этот эффект подбирают технологию.
Мы всегда считаем окупаемость. Если гипотезу можно проверить руками, без технологии, — сначала проверяем руками и фиксируем эффект. Дальше наступает этап выбора модели. Например, компьютерное зрение дает высокую точность, но требует дорогой и долгой разметки. VLM работает по текстовому промпту, дешевле, но с меньшей точностью. Дальше встает вопрос баланса: при какой точности эффект с ручного теста уже окупает модель.
Дорогая модель с ручной разметкой откладывает экономию на месяцы, пока размечают данные и обучают. Дешевая VLM стартует быстро, но с меньшей точностью. Вопрос сводится к одному: какой точности достаточно, чтобы эффект с теста перекрыл затраты на модель. Конкретные модели подбирают внешние разработчики, команда задает рамку: уложиться в бюджет, дать нужную точность, остаться масштабируемым.
Читайте кейс, как ВкусВилл с помощью компьютерного зрения сократил списания фруктов и овощей на 14%
Вывод: не стоит внедрять AI ради AI
Команда «Открытых инноваций» ВкусВилла выстроила процесс так, что не полетевшая гипотеза остается для компании дешевым и быстрым выводом, а не долго тянущимся проектом с бесконечными инвестициями. История с AI-помощником это и показывает — сильную идею проверили малыми затратами и закрыли по цифрам, без расходов на полноценную разработку.
Высокая точность модели еще не означает ценность для пользователя. В кейсе ИИ-помощника удалось добиться 89% релевантности ответов, но это не привело к повторному использованию сервиса. Поэтому главный объект проверки — не качество модели, а поведение и путь пользователя, а также экономика решения. Чем раньше это становится понятно, тем дешевле обходится ошибка. Именно поэтому мы стараемся тестировать гипотезы быстро и с минимальными затратами.
Если у вас есть идея для пилота во ВкусВилл, готовый продукт или вы обладаете техническими навыками, например, умеете обучать модели компьютерного зрения или вайбкодить — заполните форму на сайте команды Открытых Инноваций: https://innovation.vkusvill.ru.
Другие материалы
Исследования рынка AI в России и мире
Главные цифры и прогнозы по генеративному AI
Кейсы применения AI в FMCG и агропромышленности
Как мировые производители продуктов применяют генеративный AI в R&D, маркетинге и на производстве
От автоматизации к AI‑агентам: трансформация бизнеса
Как генеративный AI становится рабочим инструментом бизнеса