AI Video Ad Generator - Система автоматической генерации видео-рекламы с Sora 2
.jpg)

Описание процесса
Автоматизация для создания аутентичных UGC (User-Generated Content) видео-реклам с использованием новейшей модели OpenAI Sora 2. Система анализирует изображение продукта, создает детальный профиль идеального амбассадора, генерирует сценарий 12-секундного "сырого" видео в стиле iPhone-съемки и автоматически создает готовое видео. Весь процесс от загрузки фото продукта до получения профессионального видео занимает всего 5-10 минут, заменяя дни работы целой продакшн-команды.
API ключи и сервисы:
- OpenAI API - GPT-4.1 для анализа и Sora 2 для генерации видео
- Google Gemini 2.5 API - обработка изображений и генерация промптов
- Google Drive OAuth2 - хранение готовых видео
- N8n Form Trigger - интерфейс загрузки
Архитектура системы по блокам
РАЗДЕЛ 1: ИНИЦИАЦИЯ И ПОДГОТОВКА ДАННЫХ
1.1 Form Trigger - Точка входа
Назначение: Веб-форма для загрузки продукта и указания названия
Настройки формы:
- Form Title: "Video Generator"
- Field 1: Product (file, required)
- Field 2: Product Name (text, required)
Интерфейс: Простая форма с drag-and-drop для изображения продукта
1.2 Extract from File - Конвертация изображения
Назначение: Извлечение бинарных данных изображения для обработки
Настройки:
- Operation: binaryToProperty
- Binary Property Name: Product
1.3 Convert to File - Подготовка для AI
Назначение: Конвертация в формат для передачи в AI модели
Настройки:
- Operation: toBinary
- Source Property: data
РАЗДЕЛ 2: AI АНАЛИЗ И СОЗДАНИЕ ПЕРСОНЫ
2.1 analyze_product - Глубокий анализ продукта
Назначение: OpenAI Vision анализирует продукт и создает детальный профиль целевого пользователя
Настройки:
- Model: chatgpt-4o-latest
- Operation: analyze
- Input Type: base64
Мега-промпт для анализа (сокращенно):
// РОЛЬ И ЦЕЛЬ //
Вы — эксперт по кастингу и потребительской психологии...
Ваша единственная задача — проанализировать продукт и создать
детально проработанный профиль идеального человека для UGC рекламы.
// СТРУКТУРА ПРОФИЛЯ //
I. Основная идентичность (имя, возраст, локация, профессия)
II. Внешность и стиль (детальное описание образа)
III. Личность и коммуникация (манера поведения, стиль речи)
IV. Образ жизни (хобби, ценности, болевые точки)
V. Обоснование доверия (почему именно этот человек)
```
Результат: Полноценный профиль персонажа на 500+ слов
2.2 set_model_details - Сохранение профиля
Назначение: Структурирование данных персоны для следующих этапов
Настройки:
- Assignment: prompt = $json.content
РАЗДЕЛ 3: ГЕНЕРАЦИЯ ВИДЕО-СЦЕНАРИЯ
3.1 set_build_video_prompts - Подготовка мастер-промпта
Назначение: Создание детального 12-секундного сценария UGC видео
Ключевые элементы промпта:
```
Мастер-промпт: Сырой 12-секундный UGC видео-сценарий
ЭСТЕТИКА:
✓ Дрожание при съемке с рук
✓ Естественное движение камеры
✓ Реальное освещение и локации
✓ Аутентичные несовершенства
ИЗБЕГАЕМ:
✗ Штативы или стабилизация
✗ Текстовые наложения
✗ Профессиональный монтаж
✗ Чистые фоны
ПОКАДРОВАЯ СТРУКТУРА:
[0-2 сек] Зацепка - середина разговора
[2-9 сек] Демонстрация продукта в действии
[9-12 сек] Естественное завершение
```
3.2 generate_ad_prompts - Создание финального сценария
Назначение: Gemini 2.5 Pro генерирует детальный покадровый сценарий
Настройки:
- Model: gemini-2.5-pro
- Endpoint: generateContent
- Input: Промпт + изображение продукта
Выход: Посекундная разбивка с описанием каждого кадра, движений камеры, диалогов
3.3 Message a model - Очистка промпта
Назначение: GPT-4.1 очищает сгенерированный текст от лишних комментариев
Промпт:
```
Отфильтруй комментарии, оставь только чистый промпт для видео
РАЗДЕЛ 4: ПОДГОТОВКА ПЕРВОГО КАДРА
4.1 generate_frame - Адаптация под формат
Назначение: Gemini адаптирует изображение продукта под вертикальный формат 9:16
Настройки:
- Model: gemini-2.5-flash-image-preview
- Специальный промпт: Адаптация под соотношение сторон с сохранением композиции
Техника: Интеллектуальное расширение фона без искажений
4.2 set_frame_result - Извлечение результата
Назначение: Парсинг ответа Gemini для получения base64 изображения
Выражение:
javascript
$json.candidates[0].content.parts.filter(item => item.inlineData).first().inlineData.data
4.3 get_frame_image + resize_image
Назначение: Финальная подготовка первого кадра
Параметры resize:
- Width: 720px
- Height: 1280px
- Option: ignoreAspectRatio
РАЗДЕЛ 5: ГЕНЕРАЦИЯ ВИДЕО ЧЕРЕЗ SORA
5.1 generate_video - Запуск Sora 2
Назначение: Отправка запроса на генерацию видео в OpenAI Sora
Параметры API:
- Endpoint: https://api.openai.com/v1/videos
- Model: sora-2
- Duration: 12 seconds
- Size: 720x1280 (вертикальный формат)
- Input: Первый кадр + детальный промпт
Формат запроса:
json
{
"prompt": "[Детальный сценарий видео]",
"model": "sora-2",
"seconds": 12,
"size": "720x1280",
"input_reference": "[base64 первого кадра]"
}
```
5.2 Цикл мониторинга статуса
Компоненты:
1. delay (Wait) - Ожидание 15 секунд
2. get_video_status - Проверка статуса генерации
3. check_status (If) - Проверка completed/processing
4. Цикл - Возврат к delay если не готово
Логика:
```
generate_video → delay → get_video_status → check_status
↑___________________________|
```
5.3 get_video - Скачивание готового видео
Назначение: Получение финального видео после завершения генерации
Endpoint: https://api.openai.com/v1/videos/{id}/content
РАЗДЕЛ 6: СОХРАНЕНИЕ РЕЗУЛЬТАТА
6.1 upload_video - Загрузка в Google Drive
Назначение: Автоматическое сохранение готового видео
Настройки:
- Name: Video #{runIndex + 1}
- Drive: ваш гугл драйв
- Folder: ваша папка
- Credentials: Google Drive OAuth2
Необходимые сервисы и их настройка
OpenAI настройка:
- API ключ с доступом к:
- GPT-4.1 или GPT-4o
- ChatGPT Vision API
- Sora 2 API (требуется специальный доступ)
- Лимиты:
- Sora 2: проверьте квоты на генерацию видео
- Рекомендуемый баланс: $50+ для тестирования
Google Gemini настройка:
- Получение API ключа:
- Google AI Studio
- Включить Gemini 2.5 Flash и Pro
- Настройка в N8n:
- HTTP Header Authentication
- Header: x-goog-api-key
Google Drive настройка:
- OAuth2 подключение:
- Создать проект в Google Console
- Включить Drive API
- Настроить OAuth2 credentials
Возможности системы
Типы генерируемого контента:
- UGC стиль видео:
- Обзоры продуктов
- Распаковки
- Первые впечатления
- Туториалы использования
- Сравнения "до/после"
- Форматы и стили:
- iPhone селфи-видео
- Зеркальные съемки
- POV демонстрации
- Lifestyle контент
- Testimonial видео
Уникальные особенности:
- Гиперреалистичность - имитация настоящей съемки на телефон
- Персонализация - уникальный персонаж для каждого продукта
- Аутентичность - естественные дефекты и несовершенства
- Скорость - 5-10 минут vs дни продакшена
Примеры использования
1: Косметический продукт
Вход: Фото сыворотки для лица
AI анализ создает персону:
- Женщина 28 лет, графический дизайнер
- Минималистичный стиль, натуральная красота
- Говорит быстро, с энтузиазмом
Результат: 12-секундное видео утренней рутины с естественным освещением из окна ванной
2: Технический гаджет
Вход: Фото беспроводных наушников
AI анализ создает персону:
- Мужчина 32 года, разработчик
- Кэжуал стиль, очки, борода
- Спокойная, техничная манера речи
Результат: Видео распаковки на захламленном рабочем столе с кодом на мониторе сзади
3: Продукт питания
Вход: Фото протеинового батончика
AI анализ создает персону:
- Женщина 25 лет, фитнес-тренер
- Спортивная одежда, высокий хвост
- Энергичная, мотивирующая подача
Результат: Видео перекуса после тренировки в раздевалке спортзала
Расширенные настройки и оптимизация
Тонкая настройка промптов:
- Региональная адаптация:
- Акценты и диалекты
- Локальные референсы
- Культурные особенности
- Платформенная оптимизация:
- TikTok: более динамичный монтаж
- Instagram Reels: эстетичность
- YouTube Shorts: информативность
- Таргетинг по аудитории:
- Gen Z: быстрый темп, мемы
- Millennials: аутентичность, истории
- Gen X: практичность, детали
Продвинутые техники:
- A/B тестирование:
- Разные персоны для одного продукта
- Вариации сценариев
- Различные локации и освещение
- Серийное производство:
- Batch обработка продуктов
- Автоматическая генерация серий
- Кросс-продуктовые кампании
Интеграции и расширения
Возможные дополнения:
- Social Media Publishing:
- Автопостинг в TikTok/Instagram
- Планировщик публикаций
- Хештег-генератор
- Performance Tracking:
- Подключение к Meta Ads
- Google Analytics интеграция
- ROI калькулятор
- Brand Safety:
- Модерация контента
- Brand guidelines проверка
- Compliance фильтры
- Multimodal генерация:
- Добавление музыки/звуков
- Субтитры и captions
- Многоязычные версии
Практическая ценность
Для малого бизнеса:
- Доступный видео-маркетинг без бюджета на продакшн
- Быстрый запуск кампаний для новых продуктов
- Тестирование креативов с минимальными затратами
Для агентств:
- Масштабирование производства без увеличения команды
- Персонализация под клиентов в промышленных масштабах
- Инновационное предложение для клиентов
Для e-commerce:
- Видео для каждого SKU в каталоге
- Динамическая генерация под сезоны/акции
- Локализация контента для разных рынков
Результат работы системы
Эта автоматизация представляет собой полноценную видео-студию в облаке, которая за считанные минуты создает контент уровня профессиональной съемки. Комбинация анализа продукта через AI, генерации аутентичных сценариев и использования передовой технологии Sora 2 делает возможным то, что еще год назад казалось фантастикой - мгновенное создание реалистичных видео без актеров, студий и оборудования.
Пример работы автоматизации:
