Действие — Сгенерировать изображение от GPT-1

Действие предназначено для генерации изображений в новой модели OPENAI GPT-1.

ВАЖНО! Для работы данного действия нужно иметь верифицированный аккаунт и настроить интеграцию с OPENAI . То есть, взять ключ OPENAI и добавить его в соответствующее поле в разделе «Интеграции» сообщества для которого будет выполняться это действие и интеграцию с Yandex.Cloud
Обзор действия

Рассмотрим действие подробнее:

Обзор действия
Обзор действия
Важно! Если у вас есть необходимость работы в Telegram, то не забудьте настроить интеграцию.

1) Переключатель позволяет выбрать сообщество из которого будет выполнено действие.

2) модель для запросов: поддерживаются переменные например, %model_id%

По умолчанию: gpt-image-1. Доступное значение:

gpt-image-1

Если вы укажете несколько значений через запятую, то Автопилот возьмет только первое.

3) промпт пользователя: поддерживаются переменные например, %prompt%

По умолчанию: сообщение пользователя: %content%

Пример промпта:

Преобразуй меня на картинке: сделай, чтобы я сидел верхом на белом коне с надписью "Автопилот - FOREVER" в средневековых доспехах, с мечом в руке, на фоне замка. Пусть всё выглядит эпично и кинематографично. 

4) поле для изображения: поддерживаются переменные.

По умолчанию: ничего, поддерживается одно изображение.

5) Дополнительные параметры.

Полезные переменные действия:

  • %openai_answer% — ответ от бота OPENAI (ссылка на сгенерированное изображение и загруженное в Яндекс Cloud)
  • %openai_answer_created% —время ответа в Unix. Можно проверять в условиях, если не 0, то бот отдал данные
  • %usage_prompt_tokens% — количество токенов, использованных во входном запросе, то есть сколько "веса" имели переданные сообщения от пользователя в messages
  • %usage_completion_tokens% — количество токенов в ответе от модели (сколько "веса" занял ответ).
  • %usage_total_tokens% — суммарное количество токенов, prompt_tokens + completion_tokens.
  • %openai_content% — промпт пользователя
  • %openai_models% — модель OpenAI

Понял тебя! 🔥
Ты хочешь, чтобы я расписал не просто "плюсы модели", а нормальную объяснялку:

  • чем GPT-Image-1 реально лучше старых моделей типа DALL·E,
  • где она выгоднее,
  • что по стоимости запросов,
  • и чтобы всё это было понятным языком для бафея (типа бэкендер, тимлид, интегратор).

Чем GPT-Image-1 лучше DALL·E и аналогов: разбор для интегратора

1. Качество изображений

GPT-Image-1 генерирует изображения заметно более высокого качества:

  • Меньше "пластмассовых" артефактов.
  • Естественные лица, руки, текстуры и свет.
  • Лучшая логика композиции сцены: объекты размещаются реалистично.

Вывод:
Если DALL·E иногда делал "кривые" детали, GPT-1 их почти устранил.

2. Поддержка редактирования (Inpainting)

GPT-Image-1 умеет прямо через API:

  • Заменять часть изображения по текстовому описанию.
  • Добавлять детали без потери качества оригинала.

3. Работа с референсами

GPT-1 принимает:

  • текстовое описание,
  • (опционально) изображение-референс.

Он умеет "скрещивать" описание и референс для более точного результата.

Вывод:
Там, где DALL·E работал только по тексту или доп. ручной настройке — GPT-1 сразу на вход может взять картинку.

4. Удобство запроса и API

Новый API:

  • Позволяет задавать размер картинки (1024x1024 и др.).
  • Можно генерировать несколько вариантов за один вызов.
  • Поддержка base64 или URL результата.

Вывод:
Меньше ручных обработок после генерации.

5. Стоимость запросов (на 2024–2025 г.)

По официальной документации:

  • Генерация одного изображения (1024x1024) — примерно 0,04–0,08$.
  • Цена зависит от размера и типа запроса (генерация или редактирование).
  • Поддержка вариаций (несколько картинок за один вызов) оптимизирует стоимость.

Вывод:
По деньгам GPT-Image-1 ± равен или даже дешевле, чем старые DALL·E 3 на высоких нагрузках.

6. Для чего реально стоит использовать GPT-1 вместо DALL·E:

Задача

Что выбрать

Почему

Быстрая генерация без костылей

GPT-1

Высокое качество сразу

Нужна точная передача идеи через референс

GPT-1

Понимает текст + картинку

Массовая генерация/вариации

GPT-1

Дешевле в сумме

Лёгкий API для интеграции

GPT-1

Без дополнительных ручных оберток

Сложные правки картинок

GPT-1

Нативный inpainting

Задать вопрос по этому действию можно в комментариях этого поста.

Вернуться на главную страницу инструкций

46 views·3 shares
46 views