LIVE.SEREJA.TECH · ЗАПИСЬ · 21 АПРЕЛЯ 2026 · ~8 МИН ЧТЕНИЯ

GPT Image 2: как пользоваться, сколько стоит и когда брать вместо Nano Banana 2

gpt-image-2 — новая модель генерации изображений OpenAI (в интерфейсе ChatGPT — ChatGPT Images 2.0), запущенная 21 апреля 2026 одновременно в ChatGPT, Codex и API. Ниже — гайд: как начать на Free / Plus / Pro / API, сколько стоит, что изменилось против gpt-image-1.5, где gpt-image-2 обходит Nano Banana 2 и Midjourney, а где им проигрывает. И запись live-эфира того же дня.

Запись на YouTube ↗

gpt-image-2 — что, как и почём

01 · Как начать пользоваться

gpt-image-2 доступна в ChatGPT и через API под моделью gpt-image-2. В интерфейсе она показывается как ChatGPT Images 2.0. Instant-режим раскатан на всех тарифах, включая Free; Thinking-режим с reasoning и web-search — на Plus, Pro, Business. Enterprise обещают «скоро».

Free

  1. Открыть chat.openai.com и залогиниться.
  2. В чате попросить картинку обычным текстом — Instant включён по умолчанию.
  3. Дневная квота на уровне OpenAI; Thinking-режим недоступен.

Plus — $20 в месяц

  1. Включить Thinking в композере.
  2. Написать «сгенерируй 8 кадров одного персонажа» — модель делает reasoning и web-search.
  3. Консистентность серии до 8 кадров в одном промпте.

Pro — $200 в месяц

  1. Доступны оба режима без жёстких лимитов.
  2. 2K-разрешение, параллельные генерации.
  3. Подходит под продакшн-объём и серии 8 кадров подряд.

API — pay as you go

  1. Ключ на platform.openai.com.
  2. POST /v1/images с model=gpt-image-2, quality=low|medium|high, size=1024x1024…2K, n=1..4.
  3. Цена считается по токенам: image input $8, output $30 за 1M.

02 · Сколько стоит

Подписки ChatGPT

  • Free — $0. Instant-режим, дневная квота на уровне OpenAI.
  • Plus — $20/мес. Instant + Thinking, до 8 консистентных кадров.
  • Pro — $200/мес. Всё без жёстких лимитов + 2K.
  • Business / Enterprise — корпоративные тарифы. Enterprise получает Thinking позже.

API — за изображение

Размер и качествоЦена
1024×1024 · low$0.006
1024×1024 · medium$0.053
1024×1024 · high$0.211
1024×1536 · high$0.165
2K · highпо токенам, калькулятор OpenAI

API — за 1M токенов

Image input — $8, image input (cached) — $2, image output — $30. Text input — $5, text output — $10. Максимум 4 изображения за один API-вызов; до 8 — в Thinking-режиме внутри ChatGPT.

Нюанс. 1024×1024 high в gpt-image-2 дороже, чем в gpt-image-1.5 — $0.211 против $0.133. Если функционал 1.5 хватает, 1.5 по-прежнему доступна в API.

03 · Что нового против gpt-image-1.5

Главный прирост — +316 Elo на Arena Text Rendering, самое большое улучшение среди всех подкатегорий. Не-латинские алфавиты (JP / KR / ZH / HI / BN) теперь рисуются чисто; кириллица заметно стабильнее.

  • +316 Elo на Text Rendering — крупнейший прирост
  • Не-латинские скрипты JP / KR / ZH / HI / BN — качественный шаг вперёд
  • Максимальное разрешение до 2K (в 1.5 — ~1792×1024)
  • Aspect-ratio от 3:1 до 1:3, включая 21:9 и 9:16
  • Thinking-режим: reasoning при генерации, web-search, контекст из загруженных файлов
  • До 8 согласованных кадров одного персонажа или сцены в одном промпте
  • Sweep 7 из 7 подкатегорий T2I LMArena в день запуска

Регрессия одна: 1024×1024 high подорожал с $0.133 до $0.211. Для common-size массовой генерации это +58%.

04 · Бенчмарки LMArena

В день запуска gpt-image-2 сделала чистый sweep всех 7 подкатегорий Text-to-Image. Разрыв с Nano Banana 2 — 242 Elo, крупнейший в истории категории.

  • T2I: gpt-image-2 — 1512, Nano Banana 2 — 1271 (Δ +242)
  • Single-Image Edit: gpt-image-2 — 1513, Nano Banana Pro отстаёт на 125
  • Multi-Image Edit: gpt-image-2 — 1464, Nano Banana 2 отстаёт на 90

Тестирование шло анонимно на Arena под кодовыми названиями maskingtape / gaffertape / packingtape ещё до официального анонса. Источник — публичная доска LMArena на 21 апреля 2026, разбор — officechai.

05 · Сравнение с Nano Banana 2 и Midjourney

Короткий срез, где сейчас кто сильнее:

GPT Image 2 Nano Banana 2 Midjourney
Arena T2I Elo15121271
Текст на картинкесильносреднеслабо
Типографика / кириллицасильносреднеслабо
Макс. разрешение2K (beta)2K2K
Консистентные кадрыдо 8 (Thinking)
Reasoning + web-searchесть (Thinking)
Скоростьсреднеочень быстросредне
Редактированиеестьсильная сторонаограниченно
Фотореализмхорошохорошосильно
Артистический стильсреднесреднесильно
Цена 1024×1024 high$0.211 (API)≈$0.039 (API)подписка

06 · Когда какую модель брать

  • Текст на картинке (в т.ч. кириллица, JP / KR / ZH): gpt-image-2. Arena Text Rendering дал +316 Elo.
  • Single-edit существующей картинки: Nano Banana Pro; gpt-image-2, если нужна серия кадров.
  • Серия 4–8 консистентных кадров персонажа: gpt-image-2 в Thinking-режиме.
  • Фотореализм, кинокадр, артистика: Midjourney.
  • Массовая дешёвая генерация: gpt-image-2 low ($0.006) или gpt-image-1.5 high ($0.133).
  • Плакат, обложка YouTube, карточка Wildberries, типографика: gpt-image-2 без вариантов.
  • Reasoning + web-search + загруженный файл: gpt-image-2 Thinking — единственная опция на 21 апреля 2026.

07 · Вывод

gpt-image-2 — крупный шаг вперёд по типографике, консистентности и reasoning. В продуктовом и коммерческом дизайне это дефолт. Midjourney остаётся в артистике, Nano Banana 2 — в быстром редактинге. Главная претензия к OpenAI — цена на common-size 1024×1024 high выросла на 58%. Если сценарий требует Thinking и 8 кадров — стоит переключаться; если хватало 1.5 — перекатываться не обязательно.

Официальные источники

Частые вопросы

Как называется модель: GPT Image 2, gpt-image-2 или ChatGPT Images 2.0?

API-название — gpt-image-2 (строчные буквы, дефис). Потребительский бренд в ChatGPT — ChatGPT Images 2.0. На этой странице мы пишем «GPT Image 2» для читаемости, но во всех запросах к API используется model=gpt-image-2. Предыдущая версия — gpt-image-1.5 (декабрь 2025).

Где доступна и какие тарифы нужны?

Instant-режим: Free / Plus / Pro / Business / Enterprise и API. Thinking-режим (reasoning + web search + до 8 консистентных кадров): Plus / Pro / Business сегодня, Enterprise — скоро, Free — нет. Surfaces: ChatGPT (web + mobile), Codex, OpenAI API.

Сколько стоит?

Подписки: Free — 0, Plus — $20/мес, Pro — $200/мес. API: 1024×1024 low $0.006, medium $0.053, high $0.211. Широкий формат 1024×1536 high — $0.165. Токены: image input $8 / cached $2 / output $30 за 1M; text input $5 / output $10 за 1M.

Чем отличается от gpt-image-1.5?

+316 Elo на Arena Text Rendering (самый большой прирост), сильно лучше с JP / KR / ZH / HI / BN, максимальное разрешение до 2K (было ~1792×1024), aspect 3:1–1:3, до 8 согласованных кадров в Thinking, reasoning mid-generation, web-search и контекст из файлов. Регрессия: 1024×1024 high подорожал с $0.133 до $0.211.

Что такое Thinking-режим и зачем он?

Режим, в котором модель думает по шагам перед генерацией, может искать в вебе и использовать загруженные файлы как контекст. Даёт до 8 согласованных кадров одного персонажа или сцены в одном промпте. Доступен на Plus / Pro / Business.

Как gpt-image-2 соотносится с Nano Banana 2?

На LMArena T2I gpt-image-2 — 1512, Nano Banana 2 — 1271 (Δ +242, крупнейший отрыв в истории категории). Single-Image Edit: 1513 против Nano Banana Pro с отставанием на 125. Multi-Image Edit: 1464 против Nano Banana 2 с отставанием на 90. Sweep 7 из 7 подкатегорий T2I.

Какие ограничения на один запрос?

До 4 изображений за один API-вызов. До 8 — в Thinking-режиме внутри ChatGPT. Aspect-ratio от 3:1 до 1:3. Максимум 2K; выше — в бете.

Стоит ли брать gpt-image-2 для фотореализма?

Для чисто артистической фотографии Midjourney по-прежнему сильнее. gpt-image-2 выигрывает, когда нужен текст на картинке, консистентные кадры серии, продуктовый и коммерческий дизайн, инфографика, карточки маркетплейсов, editorial-вёрстка.

Какие есть первоисточники?

Анонс OpenAI, страница API pricing, гайд по расчёту стоимости, разбор The Verge и обзор officechai с цифрами Arena. Все пять ссылок — в блоке «Официальные источники» выше.

Что дальше