Как в Samokat.tech автоматизировали работу с контентом и нашли способ в разы сократить затраты

Дизайн
Компания
В Samokat.tech делают IT-решения для ритейла реального времени – строят собственную высоконагруженную платформу с распределенной архитектурой, используют интеллектуальные системы прогнозирования, а все этапы выполнения заказа автоматизируют роботическими системами. Все для того, чтобы товары попадали к нам домой за 15 минут и порой даже быстрее.
Инструменты
SAM
Super Resolution
Stable Diffusion XL
LoRA Stable Diffusion
Real-ESRGAN
Июль 2024
Маркетинг
В начале прошлого лета команда Generative Design получила задачу изучить контур компании и найти точки применения AI. В ходе исследования директорам подразделений и специалистам задавали два главных вопроса: что вы делаете каждый день и что хотите делать с помощью генеративного AI? В результате нашли 25 вариантов применения AI и в качестве первого эксперимента решили научиться генерировать развертку для упаковки товара.

Рисерч, первый эксперимент и... тупик

В Samokat.tech хотели не просто генерировать изображения и помещать их на макеты, а автоматизировать процесс создания упаковки целиком. Чтобы обучить модель, собрали множество разверток упаковок и разметили контентные блоки — под логотип, картинку, название продукта. Потратили два месяца, а в итоге пришли к тому, что задача очень трудоемкая. Причины две: для обучения модели нужно очень много консистентных данных, а собрать их проблематично: сам процесс создания упаковок достаточно креативный, нет единого верного варианта качественного дизайна.


После первой неудачи вернулись на этап исследования. Спрашивали сотрудников: что вас бесит больше всего? сколько сейчас таких случаев в месяц и сколько будет через полгода? сколько мы на этом заработаем или сэкономим? При этом важно учитывать и то, намечается ли рост числа случаев: даже если в текущий момент задач мало, то, может быть, в будущем их станет радикально больше, а значит, искать решение нужно уже сейчас, так как Data Science исследования и продуктивизация моделей занимают месяцы.

Пакетная обработка фото

Рынок диктует свои вводные: бизнес хочет расти в разы, людей в разы больше не нанять, команды и процессы пухнут — все ищут волшебную кнопку.
Так появился Molbert AI — инструмент для пакетной обработки фото, внутренний AI-редактор изображений. С помощью моделей Molbert AI можно удалить или наложить фон, добавить или убрать тень, скачать готовую картинку в нужном формате и разрешении.

Back-end написали на Go/Python, Front — на React. Для сегментации и удаления фона протестировали с десяток моделей классификаций-сегментаций, в том числе SAM, выпущенную Facebook в 2023 году

Оказалось, что большинство не подошли, так как не учитывают домен и специфичность наших данных, не удовлетворяют тому качеству контента, на которое мы ориентируемся.
В итоге выбрали наиболее подходящую сегментационную ML-модель, собрали датасет из 5K+ пар изображений (картинка / картинка без фона) и дообучили модель на нашем домене.

Использовали хитрость с построением пайплайна моделей: если сегментационную маску прогонять через модель Super Resolution, она все дорисовывает X2, то есть добавляет пиксели и дополнительно уточняет маску для вырезания объекта.

Для работы над качеством сгенерированных изображений, улучшений X2, взяли Open-source модель Real-ESRGAN, дополнительно обучать которую не пришлось.
«Финансовый эффект появляется, не когда мы делаем автоматизацию с одним изображением, а когда масштабируем решение на десятки тысяч изображений и адаптируем процессы», — говорит Илья Бердыш, Product Owner, Samokat.tech.


«Мы планируем перейти от внутренних производственных процессов модерации изображений до предоставления сервиса внешним пользователям — продавцам маркетплейса. Работаем над тем, чтобы продавцы могли самостоятельно использовать AI-редактор, например, для изменения фона или обработки фотографий. Также в ближайших планах — начать эксперименты с генерацией видео», — Людмила Пак, руководитель продукта управления контентом, Samokat.tech.

Результат

Клиенты Samokat.tech сегодня — Топ-1-2 заказчиков наружной рекламы в России. Приходится делать очень много однотипных макетов, так как в каждом городе, по каждому носителю есть свои требования от поставщиков к размещению юридической информации, плашки ограничений по возрасту и т.д. Изначально планировалось автоматизировать ресайз также с помощью AI, но оказалось, что в данном случае захардкодить проще и быстрее. Так появился Design Toolkit: Resize — набор решений, интегрированных в привычные инструменты дизайнера, плагин внутри Figma.

Figma Design Toolkit генерирует макеты за 30 секунд и ускоряет работу дизайнера. Он учитывает требования к каждому макету, носителю и собирает макет по требованиям подрядчиков. То, что раньше специалист делал 3-5 дней, а с учетом согласований неделю, теперь занимает 15 минут.


Автоматизация ресайза: не AI единым

В планах Samokat.Tech — инвестировать ресурсы в перспективные направления. Например, активно набирают обороты проекты виртуальных примерочных: одежды, косметики, интерьера, где применяются диффузиозные и классические CV модели для переноса одежды на маски пользователя, позволяя визуализировать интересующую деталь на человеке. Что же касается домена по работе с текстом, то предполагается вести работу по диалогу с пользователем для решения разнообразных потребностей клиента: от выбора смартфона на сайте до получения аналитических метрик эффективности бизнеса.

Планы по масштабированию GenAI

Читайте также «Философия GenAI от Samokat.tech» в разделе Медиатека
Читайте также «Философия GenAI от Samokat.tech» в разделе Медиатека

Другие кейсы