Тренды зарубежных стартапов на базе генеративного AI

25 и 26 июня Кейсы, инсайты и лучшие практики GenAI от Авито, Т-Банка, Норникеля, S7, MWS AI, hh.ru и других экспертов на Conversations. Повышение цен с 15 июня!

Купить билет

Поделиться кейсом

Generation AI Awards

Ксения Иванчикова

Редактор Generation AI

Тренды генеративного AI за рубежом: 7 стартапов, которые меняют рынок

Генеративный AI меняет привычные правила игры в самых разных сферах — от дизайна и e-commerce до биотехнологий и геймдева. Его применение уже не ограничивается созданием текстов: сегодня AI может генерировать музыку, рисовать одежду на виртуальных моделях и даже разрабатывать новые белки для фармацевтики.
В статье рассказываем про 7 зарубежных стартапов, которые показывают, как генеративный AI решает конкретные бизнес-задачи: от ускорения программирования до генерации музыки и создания AI-двойника.

Locofy: дизайн-макеты в код

Что это

  • Платформа, которая с помощью AI преобразует дизайн-макеты из Figma или Adobe XD в готовый фронтенд-код для популярных фреймворков вроде React, Next.js, Vue и других.

Как работает

  • Под капотом Locofy — «large design models». Она учитывает паттерны интерфейсов, накопленные при обучении — от классических лендингов до сложных дашбордов — и формирует осмысленные дизайн-блоки, адаптивную верстку и логику переходов между экранами. Генеративный AI здесь не только распознает UI-элементы, но и корректно интерпретирует логику дизайна, помогая максимально приблизиться к рабочему коду.

В чем польза

  • Инструмент ускорит прототипирование MVP, создание лендингов и упростит A/B-тесты. Перенос дизайн-элементов из Figma в код будет точным за счет глубокой семантической разбивки и умения распознавать элементы интерфейса. А значит разработчикам останется доработать бизнес-логику и верхнеуровневые задачи.

Так выглядит процесс генерации кода / Источник: Whitepaper Locofy

Cradle: биотехнологии и дизайн белков

Что это

  • Платформа, где биологи и химики могут с помощью AI-алгоритмов генерировать и оптимизировать белки. Цель проекта — дополнить долгие лабораторные эксперименты подходом in silico и ускорить исследования в области лекарств.

Как работает

  • В основе Cradle лежат большие языковые модели, обученные на массивах белковых последовательностей. Работает это так: пользователь загружает белковую последовательность или формулирует задачу (например, повышение ферментативной активности). Модель анализирует аминокислотный состав, структурные паттерны и уже известные данные о похожих белках. Дальше — генерация новых конструкций, где модель предлагает видоизмененные варианты или новые опции белковых последовательностей. Одновременно она оценивает устойчивость, корректность сворачивания и возможные взаимодействия с целевыми соединениями.

В чем польза

  • Cradle снижает объем ручных экспериментов и позволяет биологам быстро отсеивать нежизнеспособные варианты и концентрироваться на самых перспективных. А значит быстрее выводить на рынок новые препараты.

Путь от ввода белковой последовательности до генерации структуры и свойств / Источник: Cradle

Vizcom: из скетчей в рендеры

Что это

  • Модель для преобразования эскизов в фотореалистичные визуализации. Система объединяет алгоритмы image-to-image трансформации и 3D-рендеринг.

Как работает

  • На вход система получает рукописный скетч, который предварительно анализируется с помощью нейросетей. Затем генеративные модели дополняют изображение реалистичными текстурами, освещением и тенями. А интегрированный 3D-рендеринг позволяет симулировать физику света и глубину.

В чем польза

  • Можно визуализировать концепты гораздо быстрее. А еще автоматизировать генерацию визуальных эффектов и интеграцию с существующими дизайнерскими пайплайнами, снизить вычислительные затраты и обеспечить высокий уровень контроля над параметрами итогового изображения.

Механика работы модели / Источник: vizcom.ai

Botika: генерация изображений с одеждой на AI-моделях

Что это

  • Сервис для создания фото и 3D-изображений моделей в одежде с помощью технологий искусственного интеллекта. Полезен для ритейлеров, дизайнеров и брендов.

Как работает

  • В основе сервиса лежат алгоритмы компьютерного зрения и генеративные нейросети. Пользователь загружает изображения или 3D-модели одежды, а система накладывает их на цифровых моделей и создает реалистичный рендер. Технология учитывает много параметров: освещение, фигуру модели, фактуру и складки ткани. Это помогает сделать конечные изображения близкими к настоящим фотографиям. благодаря чему конечные изображения выглядят как настоящие фотографии.

В чем польза

  • Маркетплейсы и бренды могут быстро обновлять каталоги, показывать сезонные коллекции и проводить рекламные кампании, не организуя полноценные съемки. Это также упрощает эксперименты с вариациями цвета, ткани и стиля, помогая быстрее выводить новые товары на рынок и тестировать спрос.

Пример работы режима On-Model. Слева — исходник, справа — сгенерированная фотография с AI-моделью / Источник: app.botika.io

Tavus: создание цифрового двойника

Что это

  • Платформа для создания цифрового двойника, где можно сгенерировать видео с участием спикера — его образом, голосом, речевыми интонациями и мимикой. Фактически, создается виртуальная копия, способная записывать новые сообщения без участия живого человека.

Как работает

  • Сервис сперва учится на нескольких коротких видеороликах и аудиозаписях: анализирует внешность и голос человека. Затем генерирует видеоролики, где двойник воспроизводит нужный текст. В основе лежит фреймворк Phoenix-2, позволяющий синхронизировать речь, мимику и быстро масштабировать генерацию персонализированного видео. Пользователю остается лишь задать сценарий или текст, а система автоматически создает соответствующий ролик.

В чем польза

  • С помощью модели можно быстрее создавать видеоконтент без реального участия спикера. Например, в продажах и маркетинге можно рассылать персонализированные обращения потенциальным клиентам; в обучающих проектах и внутренней коммуникации — записывать видеоинструкции или приветственные ролики от руководителя.

Панель управления видеогенерации / Источник: tavus.io/

Inworld AI: генерация интерактивных диалогов NPC

Что это

  • Облачный сервис, позволяющий создавать и внедрять в игры и приложения интерактивных персонажей (NPC) с диалоговыми возможностями. Основная идея — оживить NPC с помощью генеративного AI так, чтобы они вели осмысленные разговоры и могли реагировать на действия и реплики игрока в реальном времени.

Как работает

  • В основе Convai лежат большие языковые модели, способные генерировать ответы, учитывая контекст беседы. Разработчики могут загружать в систему сценарии и информацию о лоре вселенной или черты персонажа, чтобы AI мог опираться на информацию при формировании ответа. Convai предоставляет API и SDK для интеграции: игровые студии подключают сервис к движкам (например, Unity или Unreal), определяют триггеры и ключевые фразы, а также регулируют «личность» NPC с учетом лексикона, целей и запланированных сюжетных ветвлений. В некоторых версиях Convai применяется распознавание речи на базе алгоритмов ASR (Automatic Speech Recognition), что дает возможность прямого голосового взаимодействия.

В чем польза

  • Можно ускорить процесс написания диалогов и снизить ручную работу над вариативностью и адаптацией ответов NPC. А еще динамичное поведение персонажей повышает уровень вовлеченности игроков, ведь NPC начинают реагировать более естественно и непредсказуемо, приближаясь к живому общению.

Параметры, которые можно предусмотреть при создании NPC / Исчтоник: convai.com/

PlayAI: генерация голосов и акцентов

Что это

  • Платформа озвучки на основе нейросетевого синтеза речи (Neural Text-to-Speech), которая позволяет конвертировать текст в аудиофайл, имитируя разные голоса, интонации и акценты. Сервис объединяет решения Google, Amazon, Microsoft, IBM и собственные наработки, чтобы достичь максимально естественного звучания.

Как работает

  • В основе лежат глубинные генеративные модели, обученные на большом количестве аудиозаписей. Алгоритм анализирует лингвистические особенности входного текста (фонетику, ударения, паузы) и сопоставляет их с акустическими шаблонами. Затем модель формирует новую звуковую дорожку, подстраивая тон, тембр и ритм под выбранный голос и акцент. Этот процесс учета контекста (пунктуации и соседних слов) позволяет генерировать плавную, естественную речь без механических обрубленных интонаций.

В чем польза

  • Блогеры, медиа и разработчики приложений могут экономить время и деньги на поиске дикторов. А еще это упрощает локализацию контента для разных регионов и позволяет гибко адаптировать голос в зависимости от аудитории или стиля проекта.

В PlayAI можно создать и клон своего голоса / Источник: play.ht/studio/

Читайте также кейс о том, как в presentsimple.ai автоматизировали создание презентаций с помощью генеративного AI

Итог

Генеративный AI уже не просто улучшает процессы, но и формирует основу для новых бизнес-моделей. Стартапы получают возможность быстрее тестировать гипотезы и выводить продукты на рынок с меньшими затратами, а крупные корпорации — автоматизировать рутинные задачи, улучшать клиентский сервис и повышать конкурентоспособность. Инвестиции в AI продолжают расти, а значит применение генеративок в самых разных отраслях только увеличится.