1k+ участников

Вступить в Telegram

n8n

•

11.09.2025

Pocket Photo Editor - Карманный AI фоторедактор в Telegram

Описание процесса

Данная автоматизация представляет собой полноценный AI-powered фоторедактор, работающий через Telegram интерфейс. Система принимает фотографии и текстовые команды от пользователей, использует интеллектуального AI агента для понимания запросов, выполняет различные операции с изображениями (редактирование, объединение, поиск), интегрируется с Google Drive для хранения файлов и предоставляет персонализированный опыт через память диалогов.

API ключи и сервисы:

Telegram Bot API - для интерфейса пользователя (бот: Photo editing 2)
OpenAI API Key - для AI агента (gpt-4.1-mini)
Google Gemini 2.5 Flash API - для редактирования изображений
Google Drive OAuth2 - для хранения и поиска файлов (аккаунт 13)
Sub-workflows - Edit Image и Combine Image для специфических операций

Архитектура системы по блокам

РАЗДЕЛ 1: ОБРАБОТКА СООБЩЕНИЙ

1.1 Telegram Trigger - Мониторинг сообщений

Назначение: Отслеживает все входящие сообщения от пользователей

1.2 Switch - Классификация типа сообщения

‍

Назначение: Разделяет сообщения на фотографии и текст для разной обработки

Условия Switch:

Output 0 "Photo": $json.message.photo exists (есть фотография)
Output 1 "Text": $json.message.text exists (есть текст)

РАЗДЕЛ 2: ОБРАБОТКА ФОТОГРАФИЙ

2.1 Download File - Загрузка фото из Telegram

Назначение: Скачивает отправленную пользователем фотографию

Настройки:

Resource: file
File ID: {{ $json.message.photo[3].file_id }} (высокое разрешение)
Credentials: Photo editing 2

Почему индекс [3]: Telegram предоставляет несколько размеров фото, индекс [3] обычно соответствует самому высокому разрешению.

2.2 Upload file - Сохранение в Google Drive

Назначение: Автоматически сохраняет загруженное фото в Google Drive

Настройки:

Name: {{ $now.format('yyyy-MM-dd') }} (название по дате)
Drive ID: My Drive
Folder ID: ваш фолдер айди
Credentials: ваши credentials

2.3 Set Text - Подготовка контекста

Назначение: Формирует сообщение для AI агента с информацией о загруженном файле

Текст сообщения:

Пользователь только что отправил фотографию. Вот ID этого файла в Google Drive: {{ $json.id }}

‍

РАЗДЕЛ 3: AI АГЕНТ - ЯДРО СИСТЕМЫ

3.1 Photoshop Agent - Главный AI помощник

Назначение: Интеллектуальный агент, который понимает запросы пользователей и выполняет операции с изображениями

Подключенные компоненты:

OpenAI Chat Model (gpt-4.1-mini) - основная языковая модель
Simple Memory - память диалогов с каждым пользователем
Change Name - инструмент изменения имени файла
Combine Images - инструмент объединения изображений
Search Raw Files - поиск загруженных пользователем файлов
Search AI Images - поиск AI-генерированных изображений
Edit Image - инструмент редактирования изображений

Системный промпт:

# Обзор

Вы являетесь личным помощником. Ваша задача — использовать доступные вам инструменты, чтобы помочь пользователю в выполнении его запроса.

‍

## Инструменты

Change Name — используйте этот инструмент, чтобы изменить имя фотографии. Для изменения имени необходимо знать идентификатор файла.

Combine Images — используйте этот инструмент, чтобы объединить два изображения.

Search Raw Files — используйте этот инструмент, чтобы найти файлы изображений, которые пользователь загрузил ранее.

Search AI Images — используйте этот инструмент для поиска изображений, созданных с помощью искусственного интеллекта, в создании которых вы помогали пользователю.

Edit Image — используйте этот инструмент для редактирования изображения.

‍

## Инструкции

1) Если пользователь отправляет фотографию, спросите его, как назвать эту фотографию, сказав: «Как вы хотите, чтобы я назвал эту фотографию в вашем Google Drive?». Затем, когда он ответит, измените имя с помощью инструмента «Change Name».

‍

3.2 Simple Memory - Персонализированная память

Назначение: Сохраняет контекст диалога для каждого пользователя отдельно

Настройки:

Session ID Type: customKey
Session Key: {{ $('Telegram Trigger').item.json.message.chat.id }} (уникальный ID чата)
Context Window Length: 10 (последние 10 сообщений)

Преимущества: Каждый пользователь имеет свою историю, AI помнит предыдущие операции и может ссылаться на ранее обработанные изображения.

РАЗДЕЛ 4: ИНСТРУМЕНТЫ AI АГЕНТА

4.1 Change Name - Переименование файлов

Назначение: Позволяет AI изменять названия файлов в Google Drive

Настройки Google Drive Tool:

Operation: update
File ID: {{ $fromAI('File_to_Update') }} (получает от AI)
New Updated File Name: {{ $fromAI('New_Updated_File_Name') }} (получает от AI)

4.2 Search Raw Files - Поиск пользовательских файлов

Назначение: Ищет файлы, которые пользователь загрузил ранее

Настройки:

Resource: fileFolder
Return All: true
Folder ID: ваш фолдер айди
What To Search: files
Options Fields: [id, name, webViewLink]

4.3 Search AI Images - Поиск AI-созданных изображений

Назначение: Ищет изображения, созданные с помощью AI инструментов

Настройки: Аналогично Search Raw Files, но с фокусом на AI-генерированный контент.

4.4 Edit Image - Редактирование изображений

Назначение: Вызывает sub-workflow для редактирования изображений

Входные параметры для sub-workflow:

imageTitle: Название нового изображения
imagePrompt: Инструкции по редактированию
imageID: ID редактируемого изображения

‍

4.5 Combine Images - Объединение изображений

Назначение: Вызывает sub-workflow для объединения двух изображений

Входные параметры для sub-workflow:

prompt: Инструкции по объединению
image1: ID первого изображения
image2: ID второго изображения
imageTitle: Название результата

‍

РАЗДЕЛ 5: SUB-WORKFLOWS

5.1 Edit Image Sub-Workflow

Процесс:

Принцип тот же как и в автоматизации Photo AD System

When Executed by Another Workflow - получает параметры
Download file - скачивает исходное изображение из Google Drive
Extract from File - конвертирует в Base64
generate_image - редактирует через Gemini 2.5 Flash
Convert to File - конвертирует результат обратно
Upload file - сохраняет в Google Drive
Result - возвращает ссылку на результат

Промпт для Gemini:

Edit the photo by this instruction: {{ imagePrompt }}.

The edited image must be in high quality!

And do not make any comments just send the edited photo.

‍

5.2 Combine Image Sub-Workflow

Процесс:

Принцип тот же как и в инструменте ранее

Edit Fields - создает массив из двух ID изображений
Split Out - разделяет для индивидуальной обработки
Download file - скачивает оба изображения
Extract from File - конвертирует в Base64
Aggregate - объединяет данные для одного запроса
generate_image - объединяет через Gemini с двумя изображениями
Convert to File + Upload file - сохраняет результат

РАЗДЕЛ 6: ОТВЕТЫ ПОЛЬЗОВАТЕЛЮ

6.1 Respond - Отправка ответов

Назначение: Отправляет ответы AI агента обратно пользователю

Настройки:

Chat ID: {{ $('Telegram Trigger').item.json.message.chat.id }}
Text: {{ $json.output }} (ответ от AI агента)
Additional Fields:
- appendAttribution: false
- parse_mode: HTML (поддержка форматирования)

Схема подключений нод

Основной поток:

Telegram Trigger → Switch

Поток фотографий:

Switch (Photo) → Download File → Upload file → Set Text → Photoshop Agent

Поток текста:

Switch (Text) → Photoshop Agent

Финальный ответ:

Photoshop Agent → Respond

AI подключения:

OpenAI Chat Model + Simple Memory → Photoshop Agent
Change Name + Search Raw Files + Search AI Images + Edit Image + Combine Images → Photoshop Agent

Необходимые сервисы и их настройки

Настройка Telegram Bot:

Создайте бота через @BotFather
Получите токен для "Photo editing 2"
Настройте права на получение фото и сообщений

Настройка Google Drive:

Создайте папку "Фото для автоматизации"
ID папки: 12RfFF5HacWvSDe2nLCyZW7C2xje8avuJ
Настройте OAuth2 для Google Drive account 13
Права на чтение, запись, изменение файлов

Настройка AI сервисов:

OpenAI API для gpt-4.1-mini (основной агент)
Google Gemini 2.5 Flash для редактирования изображений
Настройка биллинга для обоих сервисов

Создание Sub-Workflows:

Edit Image
Combine Image
Настройка Execute Workflow Trigger для каждого

Возможности системы

Операции с изображениями:

Автоматическое сохранение фотографий в Google Drive
Редактирование изображений по текстовым инструкциям
Объединение двух изображений в одно
Переименование файлов по запросу пользователя
Поиск ранее загруженных файлов

AI возможности:

Понимание естественного языка - команды на русском языке
Контекстная память - помнит предыдущие операции
Интеллектуальный выбор инструментов - сам определяет нужную операцию
Персонализация - отдельная память для каждого пользователя

Интеграции:

Telegram интерфейс - простота использования через мессенджер
Google Drive хранилище - надежное облачное хранение
AI обработка - современные технологии редактирования
Модульная архитектура - легко добавлять новые функции

Примеры использования

Сценарий 1: Загрузка и именование фото

👤 Пользователь: [отправляет фото]

🤖 AI: Как вы хотите, чтобы я назвал эту фотографию в вашем Google Drive?

👤 Пользователь: "Отпуск в Париже"

🤖 AI: Готово! Фотография сохранена как "Отпуск в Париже"

‍

Сценарий 2: Редактирование изображения

👤 Пользователь: Измени цвет неба на закатный в моей последней фотографии

🤖 AI: [ищет последнюю фотографию, редактирует через Gemini]

🤖 AI: Изображение отредактировано! Вот ссылка: [ссылка на Google Drive]

‍

Сценарий 3: Объединение изображений

👤 Пользователь: Объедини фото "Отпуск в Париже" и "Эйфелева башня"

🤖 AI: [находит оба изображения, объединяет]

🤖 AI: Изображения объединены! Создано новое изображение "Париж коллаж"

‍

Применение системы

Для личного использования:

Быстрое редактирование фото прямо в Telegram
Организация фотоархива с умными названиями
Творческие эксперименты с объединением изображений
Мобильный доступ к продвинутым AI инструментам

Для малого бизнеса:

Обработка товарных фото для интернет-магазина
Создание коллажей для соцсетей
Быстрая ретушь без Photoshop навыков
Командная работа через общий Google Drive

Для контент-креаторов:

Обработка контента на ходу
Эксперименты с визуалами для соцсетей
Создание уникальных изображений через AI
Архивирование работ с удобной организацией

Результат работы системы

Что получается:

Карманный AI фоторедактор с голосовым управлением
Интеллектуальное облачное хранилище изображений
Персонализированный помощник с памятью диалогов
Модульная система для расширения функций
Простой интерфейс для сложных операций

Метрики эффективности:

Время обработки: 30-60 секунд на операцию
Качество редактирования: профессиональное AI качество
Удобство использования: интерфейс мессенджера
Персонализация: индивидуальная память для каждого пользователя

Преимущества перед традиционными редакторами:

Доступность - работает на любом устройстве с Telegram
Простота - команды естественным языком вместо сложного интерфейса
AI помощь - понимает намерения без точных инструкций
Облачность - все файлы автоматически сохраняются и синхронизируются
Память - помнит предыдущие операции и может ссылаться на них

ROI и практическая ценность:

Экономия на ПО - замена дорогих графических редакторов
Ускорение workflow - операции за секунды вместо минут
Снижение порога входа - не нужны навыки работы с графикой
Мобильность - полноценное редактирование на смартфоне

Эта система превращает Telegram в мощный AI-powered фоторедактор с персональным помощником и облачным хранилищем!

‍

напишите нам, и мы покажем путь к эффективности

Связаться с нами

Ольга

@olga_startduck

Pocket Photo Editor - Карманный AI фоторедактор в Telegram

Описание процесса

API ключи и сервисы:

Архитектура системы по блокам

РАЗДЕЛ 1: ОБРАБОТКА СООБЩЕНИЙ

1.1 Telegram Trigger - Мониторинг сообщений

1.2 Switch - Классификация типа сообщения

РАЗДЕЛ 2: ОБРАБОТКА ФОТОГРАФИЙ

2.1 Download File - Загрузка фото из Telegram

2.2 Upload file - Сохранение в Google Drive

2.3 Set Text - Подготовка контекста

РАЗДЕЛ 3: AI АГЕНТ - ЯДРО СИСТЕМЫ

3.1 Photoshop Agent - Главный AI помощник

3.2 Simple Memory - Персонализированная память

РАЗДЕЛ 4: ИНСТРУМЕНТЫ AI АГЕНТА

4.1 Change Name - Переименование файлов

4.2 Search Raw Files - Поиск пользовательских файлов

4.3 Search AI Images - Поиск AI-созданных изображений

4.4 Edit Image - Редактирование изображений

4.5 Combine Images - Объединение изображений

РАЗДЕЛ 5: SUB-WORKFLOWS

5.1 Edit Image Sub-Workflow

5.2 Combine Image Sub-Workflow

РАЗДЕЛ 6: ОТВЕТЫ ПОЛЬЗОВАТЕЛЮ

6.1 Respond - Отправка ответов

Схема подключений нод

Основной поток:

Поток фотографий:

Поток текста:

Финальный ответ:

AI подключения:

Необходимые сервисы и их настройки

Настройка Telegram Bot:

Настройка Google Drive:

Настройка AI сервисов:

Создание Sub-Workflows:

Возможности системы

Операции с изображениями:

AI возможности:

Интеграции:

Примеры использования

Сценарий 1: Загрузка и именование фото

Сценарий 2: Редактирование изображения

Сценарий 3: Объединение изображений

Применение системы

Для личного использования:

Для малого бизнеса:

Для контент-креаторов:

Результат работы системы

Что получается:

Метрики эффективности:

Преимущества перед традиционными редакторами:

ROI и практическая ценность:

Читайте также

напишите нам, и мы покажем путь к эффективности