хочу обсудить проект
Готово! Мы ответим вам в течении одного рабочего дня
Что-то пошло не так. Попробуйте еще раз
Назад
1k+ участников
Вступить в Telegram
n8n
11.09.2025

Pocket Photo Editor - Карманный AI фоторедактор в Telegram

Описание процесса

Данная автоматизация представляет собой полноценный AI-powered фоторедактор, работающий через Telegram интерфейс. Система принимает фотографии и текстовые команды от пользователей, использует интеллектуального AI агента для понимания запросов, выполняет различные операции с изображениями (редактирование, объединение, поиск), интегрируется с Google Drive для хранения файлов и предоставляет персонализированный опыт через память диалогов.

API ключи и сервисы:

  1. Telegram Bot API - для интерфейса пользователя (бот: Photo editing 2)
  2. OpenAI API Key - для AI агента (gpt-4.1-mini)
  3. Google Gemini 2.5 Flash API - для редактирования изображений
  4. Google Drive OAuth2 - для хранения и поиска файлов (аккаунт 13)
  5. Sub-workflows - Edit Image и Combine Image для специфических операций

Архитектура системы по блокам

РАЗДЕЛ 1: ОБРАБОТКА СООБЩЕНИЙ

1.1 Telegram Trigger - Мониторинг сообщений

Назначение: Отслеживает все входящие сообщения от пользователей

1.2 Switch - Классификация типа сообщения

Назначение: Разделяет сообщения на фотографии и текст для разной обработки

Условия Switch:

  • Output 0 "Photo": $json.message.photo exists (есть фотография)
  • Output 1 "Text": $json.message.text exists (есть текст)

РАЗДЕЛ 2: ОБРАБОТКА ФОТОГРАФИЙ

2.1 Download File - Загрузка фото из Telegram

Назначение: Скачивает отправленную пользователем фотографию

Настройки:

  • Resource: file
  • File ID: {{ $json.message.photo[3].file_id }} (высокое разрешение)
  • Credentials: Photo editing 2

Почему индекс [3]: Telegram предоставляет несколько размеров фото, индекс [3] обычно соответствует самому высокому разрешению.

2.2 Upload file - Сохранение в Google Drive

Назначение: Автоматически сохраняет загруженное фото в Google Drive

Настройки:

  • Name: {{ $now.format('yyyy-MM-dd') }} (название по дате)
  • Drive ID: My Drive
  • Folder ID: ваш фолдер айди
  • Credentials: ваши credentials

2.3 Set Text - Подготовка контекста

Назначение: Формирует сообщение для AI агента с информацией о загруженном файле

Текст сообщения:

Пользователь только что отправил фотографию. Вот ID этого файла в Google Drive: {{ $json.id }}

РАЗДЕЛ 3: AI АГЕНТ - ЯДРО СИСТЕМЫ

3.1 Photoshop Agent - Главный AI помощник

Назначение: Интеллектуальный агент, который понимает запросы пользователей и выполняет операции с изображениями

Подключенные компоненты:

  • OpenAI Chat Model (gpt-4.1-mini) - основная языковая модель
  • Simple Memory - память диалогов с каждым пользователем
  • Change Name - инструмент изменения имени файла
  • Combine Images - инструмент объединения изображений
  • Search Raw Files - поиск загруженных пользователем файлов
  • Search AI Images - поиск AI-генерированных изображений
  • Edit Image - инструмент редактирования изображений

Системный промпт:

# Обзор

Вы являетесь личным помощником. Ваша задача — использовать доступные вам инструменты, чтобы помочь пользователю в выполнении его запроса.

## Инструменты

Change Name — используйте этот инструмент, чтобы изменить имя фотографии. Для изменения имени необходимо знать идентификатор файла.

Combine Images — используйте этот инструмент, чтобы объединить два изображения.

Search Raw Files — используйте этот инструмент, чтобы найти файлы изображений, которые пользователь загрузил ранее.

Search AI Images — используйте этот инструмент для поиска изображений, созданных с помощью искусственного интеллекта, в создании которых вы помогали пользователю.

Edit Image — используйте этот инструмент для редактирования изображения.

## Инструкции

1) Если пользователь отправляет фотографию, спросите его, как назвать эту фотографию, сказав: «Как вы хотите, чтобы я назвал эту фотографию в вашем Google Drive?». Затем, когда он ответит, измените имя с помощью инструмента «Change Name».

3.2 Simple Memory - Персонализированная память

Назначение: Сохраняет контекст диалога для каждого пользователя отдельно

Настройки:

  • Session ID Type: customKey
  • Session Key: {{ $('Telegram Trigger').item.json.message.chat.id }} (уникальный ID чата)
  • Context Window Length: 10 (последние 10 сообщений)

Преимущества: Каждый пользователь имеет свою историю, AI помнит предыдущие операции и может ссылаться на ранее обработанные изображения.

РАЗДЕЛ 4: ИНСТРУМЕНТЫ AI АГЕНТА

4.1 Change Name - Переименование файлов

Назначение: Позволяет AI изменять названия файлов в Google Drive

Настройки Google Drive Tool:

  • Operation: update
  • File ID: {{ $fromAI('File_to_Update') }} (получает от AI)
  • New Updated File Name: {{ $fromAI('New_Updated_File_Name') }} (получает от AI)

4.2 Search Raw Files - Поиск пользовательских файлов

Назначение: Ищет файлы, которые пользователь загрузил ранее

Настройки:

  • Resource: fileFolder
  • Return All: true
  • Folder ID: ваш фолдер айди
  • What To Search: files
  • Options Fields: [id, name, webViewLink]

4.3 Search AI Images - Поиск AI-созданных изображений

Назначение: Ищет изображения, созданные с помощью AI инструментов

Настройки: Аналогично Search Raw Files, но с фокусом на AI-генерированный контент.

4.4 Edit Image - Редактирование изображений

Назначение: Вызывает sub-workflow для редактирования изображений

Входные параметры для sub-workflow:

  • imageTitle: Название нового изображения
  • imagePrompt: Инструкции по редактированию
  • imageID: ID редактируемого изображения

4.5 Combine Images - Объединение изображений

Назначение: Вызывает sub-workflow для объединения двух изображений

Входные параметры для sub-workflow:

  • prompt: Инструкции по объединению
  • image1: ID первого изображения
  • image2: ID второго изображения
  • imageTitle: Название результата

РАЗДЕЛ 5: SUB-WORKFLOWS

5.1 Edit Image Sub-Workflow

Процесс:

Принцип тот же как и в автоматизации Photo AD System 

  1. When Executed by Another Workflow - получает параметры
  2. Download file - скачивает исходное изображение из Google Drive
  3. Extract from File - конвертирует в Base64
  4. generate_image - редактирует через Gemini 2.5 Flash
  5. Convert to File - конвертирует результат обратно
  6. Upload file - сохраняет в Google Drive
  7. Result - возвращает ссылку на результат

Промпт для Gemini:

Edit the photo by this instruction: {{ imagePrompt }}. 

The edited image must be in high quality! 

And do not make any comments just send the edited photo.

5.2 Combine Image Sub-Workflow

Процесс:

Принцип тот же как и в инструменте ранее

  1. Edit Fields - создает массив из двух ID изображений
  2. Split Out - разделяет для индивидуальной обработки
  3. Download file - скачивает оба изображения
  4. Extract from File - конвертирует в Base64
  5. Aggregate - объединяет данные для одного запроса
  6. generate_image - объединяет через Gemini с двумя изображениями
  7. Convert to File + Upload file - сохраняет результат

РАЗДЕЛ 6: ОТВЕТЫ ПОЛЬЗОВАТЕЛЮ

6.1 Respond - Отправка ответов

Назначение: Отправляет ответы AI агента обратно пользователю

Настройки:

  • Chat ID: {{ $('Telegram Trigger').item.json.message.chat.id }}
  • Text: {{ $json.output }} (ответ от AI агента)
  • Additional Fields:
    • appendAttribution: false
    • parse_mode: HTML (поддержка форматирования)

Схема подключений нод

Основной поток:

  1. Telegram TriggerSwitch

Поток фотографий:

  1. Switch (Photo) → Download FileUpload fileSet TextPhotoshop Agent

Поток текста:

  1. Switch (Text) → Photoshop Agent

Финальный ответ:

  1. Photoshop AgentRespond

AI подключения:

  • OpenAI Chat Model + Simple MemoryPhotoshop Agent
  • Change Name + Search Raw Files + Search AI Images + Edit Image + Combine ImagesPhotoshop Agent

Необходимые сервисы и их настройки

Настройка Telegram Bot:

  • Создайте бота через @BotFather
  • Получите токен для "Photo editing 2"
  • Настройте права на получение фото и сообщений

Настройка Google Drive:

  • Создайте папку "Фото для автоматизации"
  • ID папки: 12RfFF5HacWvSDe2nLCyZW7C2xje8avuJ
  • Настройте OAuth2 для Google Drive account 13
  • Права на чтение, запись, изменение файлов

Настройка AI сервисов:

  • OpenAI API для gpt-4.1-mini (основной агент)
  • Google Gemini 2.5 Flash для редактирования изображений
  • Настройка биллинга для обоих сервисов

Создание Sub-Workflows:

  • Edit Image
  • Combine Image 
  • Настройка Execute Workflow Trigger для каждого

Возможности системы

Операции с изображениями:

  • Автоматическое сохранение фотографий в Google Drive
  • Редактирование изображений по текстовым инструкциям
  • Объединение двух изображений в одно
  • Переименование файлов по запросу пользователя
  • Поиск ранее загруженных файлов

AI возможности:

  • Понимание естественного языка - команды на русском языке
  • Контекстная память - помнит предыдущие операции
  • Интеллектуальный выбор инструментов - сам определяет нужную операцию
  • Персонализация - отдельная память для каждого пользователя

Интеграции:

  • Telegram интерфейс - простота использования через мессенджер
  • Google Drive хранилище - надежное облачное хранение
  • AI обработка - современные технологии редактирования
  • Модульная архитектура - легко добавлять новые функции

Примеры использования

Сценарий 1: Загрузка и именование фото

👤 Пользователь: [отправляет фото]

🤖 AI: Как вы хотите, чтобы я назвал эту фотографию в вашем Google Drive?

👤 Пользователь: "Отпуск в Париже"

🤖 AI: Готово! Фотография сохранена как "Отпуск в Париже"

Сценарий 2: Редактирование изображения

👤 Пользователь: Измени цвет неба на закатный в моей последней фотографии

🤖 AI: [ищет последнюю фотографию, редактирует через Gemini]

🤖 AI: Изображение отредактировано! Вот ссылка: [ссылка на Google Drive]

Сценарий 3: Объединение изображений

👤 Пользователь: Объедини фото "Отпуск в Париже" и "Эйфелева башня"

🤖 AI: [находит оба изображения, объединяет]

🤖 AI: Изображения объединены! Создано новое изображение "Париж коллаж"

Применение системы

Для личного использования:

  • Быстрое редактирование фото прямо в Telegram
  • Организация фотоархива с умными названиями
  • Творческие эксперименты с объединением изображений
  • Мобильный доступ к продвинутым AI инструментам

Для малого бизнеса:

  • Обработка товарных фото для интернет-магазина
  • Создание коллажей для соцсетей
  • Быстрая ретушь без Photoshop навыков
  • Командная работа через общий Google Drive

Для контент-креаторов:

  • Обработка контента на ходу
  • Эксперименты с визуалами для соцсетей
  • Создание уникальных изображений через AI
  • Архивирование работ с удобной организацией

Результат работы системы

Что получается:

  • Карманный AI фоторедактор с голосовым управлением
  • Интеллектуальное облачное хранилище изображений
  • Персонализированный помощник с памятью диалогов
  • Модульная система для расширения функций
  • Простой интерфейс для сложных операций

Метрики эффективности:

  • Время обработки: 30-60 секунд на операцию
  • Качество редактирования: профессиональное AI качество
  • Удобство использования: интерфейс мессенджера
  • Персонализация: индивидуальная память для каждого пользователя

Преимущества перед традиционными редакторами:

  • Доступность - работает на любом устройстве с Telegram
  • Простота - команды естественным языком вместо сложного интерфейса
  • AI помощь - понимает намерения без точных инструкций
  • Облачность - все файлы автоматически сохраняются и синхронизируются
  • Память - помнит предыдущие операции и может ссылаться на них

ROI и практическая ценность:

  • Экономия на ПО - замена дорогих графических редакторов
  • Ускорение workflow - операции за секунды вместо минут
  • Снижение порога входа - не нужны навыки работы с графикой
  • Мобильность - полноценное редактирование на смартфоне

Эта система превращает Telegram в мощный AI-powered фоторедактор с персональным помощником и облачным хранилищем!

Читайте также

No items found.

напишите нам, и мы покажем путь к эффективности