Pocket Photo Editor - Карманный AI фоторедактор в Telegram
.jpg)

Описание процесса
Данная автоматизация представляет собой полноценный AI-powered фоторедактор, работающий через Telegram интерфейс. Система принимает фотографии и текстовые команды от пользователей, использует интеллектуального AI агента для понимания запросов, выполняет различные операции с изображениями (редактирование, объединение, поиск), интегрируется с Google Drive для хранения файлов и предоставляет персонализированный опыт через память диалогов.
API ключи и сервисы:
- Telegram Bot API - для интерфейса пользователя (бот: Photo editing 2)
- OpenAI API Key - для AI агента (gpt-4.1-mini)
- Google Gemini 2.5 Flash API - для редактирования изображений
- Google Drive OAuth2 - для хранения и поиска файлов (аккаунт 13)
- Sub-workflows - Edit Image и Combine Image для специфических операций
Архитектура системы по блокам
РАЗДЕЛ 1: ОБРАБОТКА СООБЩЕНИЙ
1.1 Telegram Trigger - Мониторинг сообщений
Назначение: Отслеживает все входящие сообщения от пользователей
1.2 Switch - Классификация типа сообщения
Назначение: Разделяет сообщения на фотографии и текст для разной обработки
Условия Switch:
- Output 0 "Photo": $json.message.photo exists (есть фотография)
- Output 1 "Text": $json.message.text exists (есть текст)

РАЗДЕЛ 2: ОБРАБОТКА ФОТОГРАФИЙ

2.1 Download File - Загрузка фото из Telegram
Назначение: Скачивает отправленную пользователем фотографию
Настройки:
- Resource: file
- File ID: {{ $json.message.photo[3].file_id }} (высокое разрешение)
- Credentials: Photo editing 2
Почему индекс [3]: Telegram предоставляет несколько размеров фото, индекс [3] обычно соответствует самому высокому разрешению.
2.2 Upload file - Сохранение в Google Drive
Назначение: Автоматически сохраняет загруженное фото в Google Drive
Настройки:
- Name: {{ $now.format('yyyy-MM-dd') }} (название по дате)
- Drive ID: My Drive
- Folder ID: ваш фолдер айди
- Credentials: ваши credentials
2.3 Set Text - Подготовка контекста
Назначение: Формирует сообщение для AI агента с информацией о загруженном файле
Текст сообщения:
Пользователь только что отправил фотографию. Вот ID этого файла в Google Drive: {{ $json.id }}
РАЗДЕЛ 3: AI АГЕНТ - ЯДРО СИСТЕМЫ

3.1 Photoshop Agent - Главный AI помощник
Назначение: Интеллектуальный агент, который понимает запросы пользователей и выполняет операции с изображениями
Подключенные компоненты:
- OpenAI Chat Model (gpt-4.1-mini) - основная языковая модель
- Simple Memory - память диалогов с каждым пользователем
- Change Name - инструмент изменения имени файла
- Combine Images - инструмент объединения изображений
- Search Raw Files - поиск загруженных пользователем файлов
- Search AI Images - поиск AI-генерированных изображений
- Edit Image - инструмент редактирования изображений
Системный промпт:
# Обзор
Вы являетесь личным помощником. Ваша задача — использовать доступные вам инструменты, чтобы помочь пользователю в выполнении его запроса.
## Инструменты
Change Name — используйте этот инструмент, чтобы изменить имя фотографии. Для изменения имени необходимо знать идентификатор файла.
Combine Images — используйте этот инструмент, чтобы объединить два изображения.
Search Raw Files — используйте этот инструмент, чтобы найти файлы изображений, которые пользователь загрузил ранее.
Search AI Images — используйте этот инструмент для поиска изображений, созданных с помощью искусственного интеллекта, в создании которых вы помогали пользователю.
Edit Image — используйте этот инструмент для редактирования изображения.
## Инструкции
1) Если пользователь отправляет фотографию, спросите его, как назвать эту фотографию, сказав: «Как вы хотите, чтобы я назвал эту фотографию в вашем Google Drive?». Затем, когда он ответит, измените имя с помощью инструмента «Change Name».
3.2 Simple Memory - Персонализированная память
Назначение: Сохраняет контекст диалога для каждого пользователя отдельно
Настройки:
- Session ID Type: customKey
- Session Key: {{ $('Telegram Trigger').item.json.message.chat.id }} (уникальный ID чата)
- Context Window Length: 10 (последние 10 сообщений)
Преимущества: Каждый пользователь имеет свою историю, AI помнит предыдущие операции и может ссылаться на ранее обработанные изображения.
РАЗДЕЛ 4: ИНСТРУМЕНТЫ AI АГЕНТА

4.1 Change Name - Переименование файлов
Назначение: Позволяет AI изменять названия файлов в Google Drive
Настройки Google Drive Tool:
- Operation: update
- File ID: {{ $fromAI('File_to_Update') }} (получает от AI)
- New Updated File Name: {{ $fromAI('New_Updated_File_Name') }} (получает от AI)
4.2 Search Raw Files - Поиск пользовательских файлов
Назначение: Ищет файлы, которые пользователь загрузил ранее
Настройки:
- Resource: fileFolder
- Return All: true
- Folder ID: ваш фолдер айди
- What To Search: files
- Options Fields: [id, name, webViewLink]
4.3 Search AI Images - Поиск AI-созданных изображений
Назначение: Ищет изображения, созданные с помощью AI инструментов
Настройки: Аналогично Search Raw Files, но с фокусом на AI-генерированный контент.
4.4 Edit Image - Редактирование изображений
Назначение: Вызывает sub-workflow для редактирования изображений
Входные параметры для sub-workflow:
- imageTitle: Название нового изображения
- imagePrompt: Инструкции по редактированию
- imageID: ID редактируемого изображения
4.5 Combine Images - Объединение изображений
Назначение: Вызывает sub-workflow для объединения двух изображений
Входные параметры для sub-workflow:
- prompt: Инструкции по объединению
- image1: ID первого изображения
- image2: ID второго изображения
- imageTitle: Название результата
РАЗДЕЛ 5: SUB-WORKFLOWS
5.1 Edit Image Sub-Workflow

Процесс:
Принцип тот же как и в автоматизации Photo AD System
- When Executed by Another Workflow - получает параметры
- Download file - скачивает исходное изображение из Google Drive
- Extract from File - конвертирует в Base64
- generate_image - редактирует через Gemini 2.5 Flash
- Convert to File - конвертирует результат обратно
- Upload file - сохраняет в Google Drive
- Result - возвращает ссылку на результат
Промпт для Gemini:
Edit the photo by this instruction: {{ imagePrompt }}.
The edited image must be in high quality!
And do not make any comments just send the edited photo.
5.2 Combine Image Sub-Workflow

Процесс:
Принцип тот же как и в инструменте ранее
- Edit Fields - создает массив из двух ID изображений
- Split Out - разделяет для индивидуальной обработки
- Download file - скачивает оба изображения
- Extract from File - конвертирует в Base64
- Aggregate - объединяет данные для одного запроса
- generate_image - объединяет через Gemini с двумя изображениями
- Convert to File + Upload file - сохраняет результат
РАЗДЕЛ 6: ОТВЕТЫ ПОЛЬЗОВАТЕЛЮ
6.1 Respond - Отправка ответов

Назначение: Отправляет ответы AI агента обратно пользователю
Настройки:
- Chat ID: {{ $('Telegram Trigger').item.json.message.chat.id }}
- Text: {{ $json.output }} (ответ от AI агента)
- Additional Fields:
- appendAttribution: false
- parse_mode: HTML (поддержка форматирования)
Схема подключений нод
Основной поток:
- Telegram Trigger → Switch
Поток фотографий:
- Switch (Photo) → Download File → Upload file → Set Text → Photoshop Agent
Поток текста:
- Switch (Text) → Photoshop Agent
Финальный ответ:
- Photoshop Agent → Respond
AI подключения:
- OpenAI Chat Model + Simple Memory → Photoshop Agent
- Change Name + Search Raw Files + Search AI Images + Edit Image + Combine Images → Photoshop Agent
Необходимые сервисы и их настройки
Настройка Telegram Bot:
- Создайте бота через @BotFather
- Получите токен для "Photo editing 2"
- Настройте права на получение фото и сообщений
Настройка Google Drive:
- Создайте папку "Фото для автоматизации"
- ID папки: 12RfFF5HacWvSDe2nLCyZW7C2xje8avuJ
- Настройте OAuth2 для Google Drive account 13
- Права на чтение, запись, изменение файлов
Настройка AI сервисов:
- OpenAI API для gpt-4.1-mini (основной агент)
- Google Gemini 2.5 Flash для редактирования изображений
- Настройка биллинга для обоих сервисов
Создание Sub-Workflows:
- Edit Image
- Combine Image
- Настройка Execute Workflow Trigger для каждого
Возможности системы
Операции с изображениями:
- Автоматическое сохранение фотографий в Google Drive
- Редактирование изображений по текстовым инструкциям
- Объединение двух изображений в одно
- Переименование файлов по запросу пользователя
- Поиск ранее загруженных файлов
AI возможности:
- Понимание естественного языка - команды на русском языке
- Контекстная память - помнит предыдущие операции
- Интеллектуальный выбор инструментов - сам определяет нужную операцию
- Персонализация - отдельная память для каждого пользователя
Интеграции:
- Telegram интерфейс - простота использования через мессенджер
- Google Drive хранилище - надежное облачное хранение
- AI обработка - современные технологии редактирования
- Модульная архитектура - легко добавлять новые функции
Примеры использования
Сценарий 1: Загрузка и именование фото
👤 Пользователь: [отправляет фото]
🤖 AI: Как вы хотите, чтобы я назвал эту фотографию в вашем Google Drive?
👤 Пользователь: "Отпуск в Париже"
🤖 AI: Готово! Фотография сохранена как "Отпуск в Париже"
Сценарий 2: Редактирование изображения
👤 Пользователь: Измени цвет неба на закатный в моей последней фотографии
🤖 AI: [ищет последнюю фотографию, редактирует через Gemini]
🤖 AI: Изображение отредактировано! Вот ссылка: [ссылка на Google Drive]
Сценарий 3: Объединение изображений
👤 Пользователь: Объедини фото "Отпуск в Париже" и "Эйфелева башня"
🤖 AI: [находит оба изображения, объединяет]
🤖 AI: Изображения объединены! Создано новое изображение "Париж коллаж"
Применение системы
Для личного использования:
- Быстрое редактирование фото прямо в Telegram
- Организация фотоархива с умными названиями
- Творческие эксперименты с объединением изображений
- Мобильный доступ к продвинутым AI инструментам
Для малого бизнеса:
- Обработка товарных фото для интернет-магазина
- Создание коллажей для соцсетей
- Быстрая ретушь без Photoshop навыков
- Командная работа через общий Google Drive
Для контент-креаторов:
- Обработка контента на ходу
- Эксперименты с визуалами для соцсетей
- Создание уникальных изображений через AI
- Архивирование работ с удобной организацией
Результат работы системы
Что получается:
- Карманный AI фоторедактор с голосовым управлением
- Интеллектуальное облачное хранилище изображений
- Персонализированный помощник с памятью диалогов
- Модульная система для расширения функций
- Простой интерфейс для сложных операций
Метрики эффективности:
- Время обработки: 30-60 секунд на операцию
- Качество редактирования: профессиональное AI качество
- Удобство использования: интерфейс мессенджера
- Персонализация: индивидуальная память для каждого пользователя
Преимущества перед традиционными редакторами:
- Доступность - работает на любом устройстве с Telegram
- Простота - команды естественным языком вместо сложного интерфейса
- AI помощь - понимает намерения без точных инструкций
- Облачность - все файлы автоматически сохраняются и синхронизируются
- Память - помнит предыдущие операции и может ссылаться на них
ROI и практическая ценность:
- Экономия на ПО - замена дорогих графических редакторов
- Ускорение workflow - операции за секунды вместо минут
- Снижение порога входа - не нужны навыки работы с графикой
- Мобильность - полноценное редактирование на смартфоне
Эта система превращает Telegram в мощный AI-powered фоторедактор с персональным помощником и облачным хранилищем!