От дизайн-бюро к AI-стартапу: как в presentsimple.ai автоматизировали создание презентаций с помощью генеративного ИИ?

Компания
Presentsimple.ai – сервис для создания презентаций с помощью AI под ключ, который вырос в отдельный стартап из дизайн-бюро «Суперграфика». Появление генеративного AI позволило команде переосмыслить основной продукт и создать новое направление. На данный момент у сервиса 100 тыс пользователей и первые b2b-клиенты на автоматизацию презентаций. внутри бизнеса
Сентябрь 2024
Дизайн
Маркетинг
Инструменты
ChatGPT
YandexGPT
Stable Diffusion
GigaChat
Midjourney
Штат компании – 6 человек, которые ежемесячно получают более 50 заказов на презентации. Подготовка самой простой презентации занимает не менее 2-х часов, а час дизайнера/копирайтера в среднем стоит 1000+ рублей. Команда хотела автоматизировать разработку несложных презентаций, которые невыгодно «делать руками», чтобы освободить ресурсы на заказы, где требуется комплексный подход и креативность дизайнеров.

Задача

На заре AI-бума команда presentsimple.ai, как и многие другие, тестировала возможности ChatGPT – нейросеть выполняла роль копирайтера. Промпт-инжиниринг ограничивался заданием роли и погружением в контекст. Тексты приходилось править вручную, либо делать множество итераций, меняя промпт.
С релизом графических нейросетей – Stable Diffusion и Midjourney – в сервисе появилась возможность генерации картинок. Но и тут не обошлось без проблем – вендоры периодически блокировали доступы для «массовых» аккаунтов, так что функция генерации изображений не всегда была доступна.

Эксперименты с ChatGPT и переезд на отечественные LLM

В связи с AI-пивотом в команде сервиса появился штат программистов и Data scientist, который занимается обучением ИИ-моделей и промпт-инжинирингом.


Со временем presentsimple.ai полностью «переехал» на отечественные нейросети, как для генерации текстов, так и для картинок. Переход получился практически бесшовным за счет того, что разработчики изначально заложили в продукт архитектуру, где зависимость от языковой модели минимальна. К тому же любую LLM все равно дообучают для корректной работы.


Изначально продукт проектировался так, что LLM не стоит во главе угла. Можно легко зашить под капот свежую GPT-4o, а завтра перейти на YandexGPT или GigaChat.

Для того, чтобы AI знал, какими бывают презентации, команда создала около 100 шаблонов под разные задачи и обучила на них нейросеть. Основных направлений пока что три: информативные, питчдеки, маркетинговые презентации. Но AI мало знать тип презентации, нужны детали, а прописывать вручную детальное ТЗ неудобно и долго. К тому же искусственный интеллект может что-то пропустить из контекста или интерпретировать не так.
Решением проблемы стала форма опроса, в которой пользователю задается несколько закрытых вопросов. Ответы автоматически вшиваются в промпт нейросети и накладываются на основные настройки – правила презентаций, которые команда разрабатывала вручную. Получается этакая пирамида промптинга.



Тонкая настройка

1. На старте пользователь прописывает тему презентации и прикрепляет сопутствующие материалы (текст потенциального выступления, например). Далее сервис генерирует структуру презентации и краткое описание слайдов – расписывает на каждом из них, о чем пойдет речь. В примерах ниже вы можете увидеть слайды, которые AI посвятил кейсориуму Generation AI.

Как происходит генерация?

2. После подтверждения структуры пользователь выбирает цвет и шрифт из предложенных альтернатив. На следующем этапе происходит генерация текста, картинок, а также автоматическая верстка прямо на глазах у пользователя.

Картинки, кстати, нейросеть генерирует сама, опираясь на контекст. А промпты для графической модели пишет текстовая модель, которую дообучили под эту задачу. Поэтому пользователю достаточно описать только то, что он хочет получить на картинке – все остальное сделает сервис.


3. После того, как презентация сформирована, пользователь может «провалиться» в каждый слайд и поменять вариант его компоновки. Или дать AI команду изменить текст или картинку, если результат требует доработки. Финальный результат можно скачать в PowerPoint и PDF.


Итоги

В среднем на разработку простой презентации руками дизайнера уходило 3 часа. Нейросетям, чтобы подготовить презентацию по готовой фактуре, нужно 5 минут.

Команда планирует дообучать текстовую языковую модель на базе знаний заказчика, а также добавлять дизайн-код на основании брендбука компании. На выходе получится «кастомизированный» presentsimple, где AI будет знать про продукты и услуги бизнеса и создавать презентации в фирменном стиле. Также в планах – реализовать возможность генерации диаграмм и инфографики.

Курс на кастомизацию

Читайте также «Путь GenAI-стартапа: про инвестиции, команду и рост» в разделе Медиатека
Читайте также «Путь GenAI-стартапа: про инвестиции, команду и рост» в разделе Медиатека

Другие кейсы