Ваша компания использует генеративный AI в продуктах, проектах и бизнес-процессах? Смело рассказывайте о своем опыте на страницах проекта Generation AI! Правила отбора
От дизайн-бюро к AI-стартапу: как в presentsimple.ai автоматизировали создание презентаций с помощью генеративного ИИ?
Компания
Presentsimple.ai – сервис для создания презентаций с помощью AI под ключ, который вырос в отдельный стартап из дизайн-бюро «Суперграфика». Появление генеративного AI позволило команде переосмыслить основной продукт и создать новое направление. На данный момент у сервиса 100 тыс пользователей и первые b2b-клиенты на автоматизацию презентаций. внутри бизнеса
Сентябрь 2024
Дизайн
Маркетинг
Инструменты
ChatGPT
YandexGPT
Stable Diffusion
GigaChat
Midjourney
Штат компании – 6 человек, которые ежемесячно получают более 50 заказов на презентации. Подготовка самой простой презентации занимает не менее 2-х часов, а час дизайнера/копирайтера в среднем стоит 1000+ рублей. Команда хотела автоматизировать разработку несложных презентаций, которые невыгодно «делать руками», чтобы освободить ресурсы на заказы, где требуется комплексный подход и креативность дизайнеров.
Задача
На заре AI-бума команда presentsimple.ai, как и многие другие, тестировала возможности ChatGPT – нейросеть выполняла роль копирайтера. Промпт-инжиниринг ограничивался заданием роли и погружением в контекст. Тексты приходилось править вручную, либо делать множество итераций, меняя промпт.
С релизом графических нейросетей – Stable Diffusion и Midjourney – в сервисе появилась возможность генерации картинок. Но и тут не обошлось без проблем – вендоры периодически блокировали доступы для «массовых» аккаунтов, так что функция генерации изображений не всегда была доступна.
Эксперименты с ChatGPT и переезд на отечественные LLM
В связи с AI-пивотом в команде сервиса появился штат программистов и Data scientist, который занимается обучением ИИ-моделей и промпт-инжинирингом.
Со временем presentsimple.ai полностью «переехал» на отечественные нейросети, как для генерации текстов, так и для картинок. Переход получился практически бесшовным за счет того, что разработчики изначально заложили в продукт архитектуру, где зависимость от языковой модели минимальна. К тому же любую LLM все равно дообучают для корректной работы.
Изначально продукт проектировался так, что LLM не стоит во главе угла. Можно легко зашить под капот свежую GPT-4o, а завтра перейти на YandexGPT или GigaChat.
Для того, чтобы AI знал, какими бывают презентации, команда создала около 100 шаблонов под разные задачи и обучила на них нейросеть. Основных направлений пока что три: информативные, питчдеки, маркетинговые презентации. Но AI мало знать тип презентации, нужны детали, а прописывать вручную детальное ТЗ неудобно и долго. К тому же искусственный интеллект может что-то пропустить из контекста или интерпретировать не так.
Решением проблемы стала форма опроса, в которой пользователю задается несколько закрытых вопросов. Ответы автоматически вшиваются в промпт нейросети и накладываются на основные настройки – правила презентаций, которые команда разрабатывала вручную. Получается этакая пирамида промптинга.
Тонкая настройка
1. На старте пользователь прописывает тему презентации и прикрепляет сопутствующие материалы (текст потенциального выступления, например). Далее сервис генерирует структуру презентации и краткое описание слайдов – расписывает на каждом из них, о чем пойдет речь. В примерах ниже вы можете увидеть слайды, которые AI посвятил кейсориуму Generation AI.
Как происходит генерация?
2. После подтверждения структуры пользователь выбирает цвет и шрифт из предложенных альтернатив. На следующем этапе происходит генерация текста, картинок, а также автоматическая верстка прямо на глазах у пользователя.
Картинки, кстати, нейросеть генерирует сама, опираясь на контекст. А промпты для графической модели пишет текстовая модель, которую дообучили под эту задачу. Поэтому пользователю достаточно описать только то, что он хочет получить на картинке – все остальное сделает сервис.
3. После того, как презентация сформирована, пользователь может «провалиться» в каждый слайд и поменять вариант его компоновки. Или дать AI команду изменить текст или картинку, если результат требует доработки. Финальный результат можно скачать в PowerPoint и PDF.
Итоги
В среднем на разработку простой презентации руками дизайнера уходило 3 часа. Нейросетям, чтобы подготовить презентацию по готовой фактуре, нужно 5 минут.
Команда планирует дообучать текстовую языковую модель на базе знаний заказчика, а также добавлять дизайн-код на основании брендбука компании. На выходе получится «кастомизированный» presentsimple, где AI будет знать про продукты и услуги бизнеса и создавать презентации в фирменном стиле. Также в планах – реализовать возможность генерации диаграмм и инфографики.