Автопилот — Автоворонки, игры, продажи, чат-боты

Действие — Сгенерировать изображение от GPT-1

Автопилот — Автоворонки, игры, продажи, чат-боты·25 Apr at 9:11 pm

Действие предназначено для генерации изображений в новой модели OPENAI GPT-1.

ВАЖНО! Для работы данного действия нужно иметь верифицированный аккаунт и настроить интеграцию с OPENAI . То есть, взять ключ OPENAI и добавить его в соответствующее поле в разделе «Интеграции» сообщества для которого будет выполняться это действие и интеграцию с Yandex.Cloud

Обзор действия

Рассмотрим действие подробнее:

Важно! Если у вас есть необходимость работы в Telegram, то не забудьте настроить интеграцию.

1) Переключатель позволяет выбрать сообщество из которого будет выполнено действие.

2) модель для запросов: поддерживаются переменные например, %model_id%

По умолчанию: gpt-image-1. Доступное значение:

gpt-image-1

Если вы укажете несколько значений через запятую, то Автопилот возьмет только первое.

3) промпт пользователя: поддерживаются переменные например, %prompt%

По умолчанию: сообщение пользователя: %content%

Пример промпта:

Преобразуй меня на картинке: сделай, чтобы я сидел верхом на белом коне с надписью "Автопилот - FOREVER" в средневековых доспехах, с мечом в руке, на фоне замка. Пусть всё выглядит эпично и кинематографично.

4) поле для изображения: поддерживаются переменные.

По умолчанию: ничего, поддерживается одно изображение.

5) Дополнительные параметры.

Полезные переменные действия:

%openai_answer% — ответ от бота OPENAI (ссылка на сгенерированное изображение и загруженное в Яндекс Cloud)

%openai_answer_created% —время ответа в Unix. Можно проверять в условиях, если не 0, то бот отдал данные

%usage_prompt_tokens% — количество токенов, использованных во входном запросе, то есть сколько "веса" имели переданные сообщения от пользователя в messages

%usage_completion_tokens% — количество токенов в ответе от модели (сколько "веса" занял ответ).

%usage_total_tokens% — суммарное количество токенов, prompt_tokens + completion_tokens.

%openai_content% — промпт пользователя

%openai_models% — модель OpenAI

Понял тебя! 🔥
Ты хочешь, чтобы я расписал не просто "плюсы модели", а нормальную объяснялку:

чем GPT-Image-1 реально лучше старых моделей типа DALL·E,
где она выгоднее,
что по стоимости запросов,
и чтобы всё это было понятным языком для бафея (типа бэкендер, тимлид, интегратор).

Чем GPT-Image-1 лучше DALL·E и аналогов: разбор для интегратора

1. Качество изображений

GPT-Image-1 генерирует изображения заметно более высокого качества:

Меньше "пластмассовых" артефактов.
Естественные лица, руки, текстуры и свет.
Лучшая логика композиции сцены: объекты размещаются реалистично.

Вывод:
Если DALL·E иногда делал "кривые" детали, GPT-1 их почти устранил.

2. Поддержка редактирования (Inpainting)

GPT-Image-1 умеет прямо через API:

Заменять часть изображения по текстовому описанию.
Добавлять детали без потери качества оригинала.

3. Работа с референсами

GPT-1 принимает:

текстовое описание,

(опционально) изображение-референс.

Он умеет "скрещивать" описание и референс для более точного результата.

Вывод:
Там, где DALL·E работал только по тексту или доп. ручной настройке — GPT-1 сразу на вход может взять картинку.

4. Удобство запроса и API

Новый API:

Позволяет задавать размер картинки (1024x1024 и др.).
Можно генерировать несколько вариантов за один вызов.
Поддержка base64 или URL результата.

Вывод:
Меньше ручных обработок после генерации.

5. Стоимость запросов (на 2024–2025 г.)

По официальной документации:

Генерация одного изображения (1024x1024) — примерно 0,04–0,08$.
Цена зависит от размера и типа запроса (генерация или редактирование).
Поддержка вариаций (несколько картинок за один вызов) оптимизирует стоимость.

Вывод:
По деньгам GPT-Image-1 ± равен или даже дешевле, чем старые DALL·E 3 на высоких нагрузках.

6. Для чего реально стоит использовать GPT-1 вместо DALL·E:

Задача	Что выбрать	Почему
Быстрая генерация без костылей	GPT-1	Высокое качество сразу
Нужна точная передача идеи через референс	GPT-1	Понимает текст + картинку
Массовая генерация/вариации	GPT-1	Дешевле в сумме
Лёгкий API для интеграции	GPT-1	Без дополнительных ручных оберток
Сложные правки картинок	GPT-1	Нативный inpainting

Задать вопрос по этому действию можно в комментариях этого поста.

Вернуться на главную страницу инструкций

51 views·3 shares

51 views