Промпт-инжиниринг и разработка для сервиса генерации сказок

AI-генератор сказок

Цель

Заказчик из Румынии пришел к нам с идеей создать сервис генерации детских сказок. Текст, иллюстрации, аудио-прочтение сказки — все это можно генерировать через искусственный интеллект. Главное — правильно скоординировать работу нескольких нейросетей, «подружить» их между собой, чтобы получить целостный иллюстрированный текст. Мы провели взаимную интеграцию моделей и полностью разработали бэкенд новой платформы. Чтобы вам было интереснее читать этот кейс, мы добавили на страницу иллюстрации. В основе иллюстраций — визуальные и текстовые цитаты из сказки, которую сгенерировал сервис.

Срок

3 мес

Год

2024

Технологии

Как работает платформа

Пользователь заходит на платформу, регистрируется, выбирает тарифный план и оплачивает его. Далее он может создать сказку, указав несколько параметров:

  • Название. Пользователь указывает его сам, и название оказывает влияние на итоговый текст.
  • Локация — волшебный лес, замок принцессы, заколдованное королевство, обычный современный город.
  • Жанр — приключения, комедия, фантастика, для самых маленьких.
  • Персонажи. В этом сервисе героями сказки могут стать ваш ребенок и его любимый хомячок.
  • Количество глав. Одна глава в сказке — это около 5000 символов. Для обладателей подписки на сервис будет доступно до 10 глав в одной сказке. Большой объем текста стал основным челленджем, который мы решили на уровне промпт-инжиринга.

Баннер кейса (мобильная версия)

Библиотека и шеринг

Истории, которые создает пользователь, будут сохраняться в разделе «Библиотека». Здесь вы можете:

  • Читать сказки, не покидая платформы
  • Переводить сгенерированный материал в формат аудиокниги и слушать их
  • Выгружать иллюстрированную сказку в виде pdf
  • Делиться своими историями в в соцсетях

Подписчик платформы всегда может отредактировать текст сказки или перегенерировать главу. Мы понимаем, что результаты работы нейросетей до сих пор могут требовать небольшой корректуры.

Баннер кейса (мобильная версия)

Разработка и промпт-инжиринг

За генерацию текста в нашем проекта отвечает GPT4 Turbo, для создания иллюстраций используем DALL·E 3. Чтобы генерировать сказки из 10 глав, в каждой из которых 5000 символов, мы делаем для каждой главы несколько запросов в GPT. Это было необходимым шагом, так как данная LLM имеет ограничение — до 4000 символов на одно сообщение.

Перед генерацией отдельных глав мы запрашиваем базовое описание сказки и ее сюжета, главных героев и ключевых событий. После этого запрашиваем отдельное краткое описание для каждой главы.

Только после этого мы просим GPT создать для нас отдельные главы. Здесь разделяем процесс еще сильнее, чтобы увеличить скорость генерации: по очереди запрашиваем каждый параграф главы. Нейросеть создает абзацы и главы поэтапно, с учетом полного текста, который был сгенерирован ранее. Также GPT учитывает общее описание сказки и отдельные описания всех глав, в том числе — еще не сгенерированных.

Баннер кейса (мобильная версия)

Генерация изображений

Чтобы сгенерировать релевантные изображения, мы координируем запросы в GPT и DALL·E через бэкенд. В каждой главе есть одна иллюстрация, и она должна соответствовать тексту сказки, не выпадать из общего нарратива. Запросы в DALL·E также учитывают все наши переменные: заданные пользователем параметры, общее описание сказки, описания отдельных глав, тексты и картинки уже сгенерированных глав. Пользователь имеет возможность перегенерировать любую картинку, если остался недоволен результатом.

Баннер кейса (мобильная версия)

Text-to-Speech

После того, как иллюстрированная сказка полностью готова, ее можно превратить в аудиокнигу, не покидая платформу. Для реализации этой возможности мы провели интеграцию с инструментом Google — Cloud Text-to-Speech API. Затем оплатили подписку на этот сервис, благодаря чему смогли предоставить пользователям возможность переключаться между разными голосами. Женский, мужской, милый, строгий, низкий, высокий — выбирайте, какой чтец больше понравится вашим детям.

Баннер кейса (мобильная версия)

Монетизация

Схема монетизации этого веб-сервиса — подписка, сервис оплаты — Stripe. Пользователям будет доступно несколько видов подписки: на месяц, на полгода, на год. В зависимости от тарифного плана пользователи смогут генерировать разное количество сказок. Создание аудиокниги на основе сгенерированной сказки будет оформлено как отдельная платная опция.

Монетизация и платная подписка была необходима, так как AI-инструменты, создающие текст, картинку и аудио, являются платными. Мы обсуждали с клиентом возможность использования более доступных инструментов, но решили, что не будем жертвовать качеством ради бесплатного доступа.

Сразу после запуска платформа будет доступна на английском языке, позже клиент планирует подключить два дополнительных языка, испанский и румынский.

Участники команды

Захар Дорошенко

Менеджер проектов

Ян Борцов

Backend разработчик

Максим Иванов

R&D инженер

Готовы обсудить ваш проект ?

Наши контакты

Заполните форму ниже или напишите на

Email: business@unistory.orgTelegram: @unistoryapp

Мы свяжемся с вами прямо сейчас!

Нажимая на кнопку, вы даете согласие на обработку персональных данных и соглашаетесь с политикой конфиденциальности.

Санкт-Петербург

Фурштатская улица 24, БЦ Кочубей, 191028

Алматы

ул. Розыбакиева 289/1, офис 36, г. Алматы, Казахстан, 050060

Из классной идеи

в безумно отличный продукт

Мы — ТОП-3 в рейтинге ИИ-разработчиков

© 2025 Unistory