LIVE.SEREJA.TECH · ЗАПИСЬ · 21 АПРЕЛЯ 2026 · ~8 МИН ЧТЕНИЯ
GPT Image 2: как пользоваться, сколько стоит и когда брать вместо Nano Banana 2
gpt-image-2 — новая модель генерации изображений OpenAI (в интерфейсе ChatGPT — ChatGPT Images 2.0), запущенная 21 апреля 2026 одновременно в ChatGPT, Codex и API. Ниже — гайд: как начать на Free / Plus / Pro / API, сколько стоит, что изменилось против gpt-image-1.5, где gpt-image-2 обходит Nano Banana 2 и Midjourney, а где им проигрывает. И запись live-эфира того же дня.
gpt-image-2 — что, как и почём
01 · Как начать пользоваться
gpt-image-2 доступна в ChatGPT и через API под моделью gpt-image-2. В интерфейсе она показывается
как ChatGPT Images 2.0. Instant-режим раскатан на всех тарифах, включая Free; Thinking-режим с reasoning и
web-search — на Plus, Pro, Business. Enterprise обещают «скоро».
Free
- Открыть chat.openai.com и залогиниться.
- В чате попросить картинку обычным текстом — Instant включён по умолчанию.
- Дневная квота на уровне OpenAI; Thinking-режим недоступен.
Plus — $20 в месяц
- Включить Thinking в композере.
- Написать «сгенерируй 8 кадров одного персонажа» — модель делает reasoning и web-search.
- Консистентность серии до 8 кадров в одном промпте.
Pro — $200 в месяц
- Доступны оба режима без жёстких лимитов.
- 2K-разрешение, параллельные генерации.
- Подходит под продакшн-объём и серии 8 кадров подряд.
API — pay as you go
- Ключ на platform.openai.com.
POST /v1/imagesсmodel=gpt-image-2,quality=low|medium|high,size=1024x1024…2K,n=1..4.- Цена считается по токенам: image input $8, output $30 за 1M.
02 · Сколько стоит
Подписки ChatGPT
- Free — $0. Instant-режим, дневная квота на уровне OpenAI.
- Plus — $20/мес. Instant + Thinking, до 8 консистентных кадров.
- Pro — $200/мес. Всё без жёстких лимитов + 2K.
- Business / Enterprise — корпоративные тарифы. Enterprise получает Thinking позже.
API — за изображение
| Размер и качество | Цена |
|---|---|
| 1024×1024 · low | $0.006 |
| 1024×1024 · medium | $0.053 |
| 1024×1024 · high | $0.211 |
| 1024×1536 · high | $0.165 |
| 2K · high | по токенам, калькулятор OpenAI |
API — за 1M токенов
Image input — $8, image input (cached) — $2, image output — $30. Text input — $5, text output — $10. Максимум 4 изображения за один API-вызов; до 8 — в Thinking-режиме внутри ChatGPT.
Нюанс. 1024×1024 high в gpt-image-2 дороже, чем в gpt-image-1.5 — $0.211 против $0.133. Если функционал 1.5 хватает, 1.5 по-прежнему доступна в API.
03 · Что нового против gpt-image-1.5
Главный прирост — +316 Elo на Arena Text Rendering, самое большое улучшение среди всех подкатегорий. Не-латинские алфавиты (JP / KR / ZH / HI / BN) теперь рисуются чисто; кириллица заметно стабильнее.
- +316 Elo на Text Rendering — крупнейший прирост
- Не-латинские скрипты JP / KR / ZH / HI / BN — качественный шаг вперёд
- Максимальное разрешение до 2K (в 1.5 — ~1792×1024)
- Aspect-ratio от 3:1 до 1:3, включая 21:9 и 9:16
- Thinking-режим: reasoning при генерации, web-search, контекст из загруженных файлов
- До 8 согласованных кадров одного персонажа или сцены в одном промпте
- Sweep 7 из 7 подкатегорий T2I LMArena в день запуска
Регрессия одна: 1024×1024 high подорожал с $0.133 до $0.211. Для common-size массовой генерации это +58%.
04 · Бенчмарки LMArena
В день запуска gpt-image-2 сделала чистый sweep всех 7 подкатегорий Text-to-Image. Разрыв с Nano Banana 2 — 242 Elo, крупнейший в истории категории.
- T2I: gpt-image-2 — 1512, Nano Banana 2 — 1271 (Δ +242)
- Single-Image Edit: gpt-image-2 — 1513, Nano Banana Pro отстаёт на 125
- Multi-Image Edit: gpt-image-2 — 1464, Nano Banana 2 отстаёт на 90
Тестирование шло анонимно на Arena под кодовыми названиями maskingtape /
gaffertape / packingtape ещё до официального анонса. Источник — публичная доска
LMArena на 21 апреля 2026, разбор — officechai.
05 · Сравнение с Nano Banana 2 и Midjourney
Короткий срез, где сейчас кто сильнее:
| GPT Image 2 | Nano Banana 2 | Midjourney | |
|---|---|---|---|
| Arena T2I Elo | 1512 | 1271 | — |
| Текст на картинке | сильно | средне | слабо |
| Типографика / кириллица | сильно | средне | слабо |
| Макс. разрешение | 2K (beta) | 2K | 2K |
| Консистентные кадры | до 8 (Thinking) | — | — |
| Reasoning + web-search | есть (Thinking) | — | — |
| Скорость | средне | очень быстро | средне |
| Редактирование | есть | сильная сторона | ограниченно |
| Фотореализм | хорошо | хорошо | сильно |
| Артистический стиль | средне | средне | сильно |
| Цена 1024×1024 high | $0.211 (API) | ≈$0.039 (API) | подписка |
06 · Когда какую модель брать
- Текст на картинке (в т.ч. кириллица, JP / KR / ZH): gpt-image-2. Arena Text Rendering дал +316 Elo.
- Single-edit существующей картинки: Nano Banana Pro; gpt-image-2, если нужна серия кадров.
- Серия 4–8 консистентных кадров персонажа: gpt-image-2 в Thinking-режиме.
- Фотореализм, кинокадр, артистика: Midjourney.
- Массовая дешёвая генерация: gpt-image-2 low ($0.006) или gpt-image-1.5 high ($0.133).
- Плакат, обложка YouTube, карточка Wildberries, типографика: gpt-image-2 без вариантов.
- Reasoning + web-search + загруженный файл: gpt-image-2 Thinking — единственная опция на 21 апреля 2026.
07 · Вывод
gpt-image-2 — крупный шаг вперёд по типографике, консистентности и reasoning. В продуктовом и коммерческом дизайне это дефолт. Midjourney остаётся в артистике, Nano Banana 2 — в быстром редактинге. Главная претензия к OpenAI — цена на common-size 1024×1024 high выросла на 58%. Если сценарий требует Thinking и 8 кадров — стоит переключаться; если хватало 1.5 — перекатываться не обязательно.
Официальные источники
Частые вопросы
Как называется модель: GPT Image 2, gpt-image-2 или ChatGPT Images 2.0?
API-название — gpt-image-2 (строчные буквы, дефис). Потребительский бренд в ChatGPT — ChatGPT Images 2.0. На этой странице мы пишем «GPT Image 2» для читаемости, но во всех запросах к API используется model=gpt-image-2. Предыдущая версия — gpt-image-1.5 (декабрь 2025).
Где доступна и какие тарифы нужны?
Instant-режим: Free / Plus / Pro / Business / Enterprise и API. Thinking-режим (reasoning + web search + до 8 консистентных кадров): Plus / Pro / Business сегодня, Enterprise — скоро, Free — нет. Surfaces: ChatGPT (web + mobile), Codex, OpenAI API.
Сколько стоит?
Подписки: Free — 0, Plus — $20/мес, Pro — $200/мес. API: 1024×1024 low $0.006, medium $0.053, high $0.211. Широкий формат 1024×1536 high — $0.165. Токены: image input $8 / cached $2 / output $30 за 1M; text input $5 / output $10 за 1M.
Чем отличается от gpt-image-1.5?
+316 Elo на Arena Text Rendering (самый большой прирост), сильно лучше с JP / KR / ZH / HI / BN, максимальное разрешение до 2K (было ~1792×1024), aspect 3:1–1:3, до 8 согласованных кадров в Thinking, reasoning mid-generation, web-search и контекст из файлов. Регрессия: 1024×1024 high подорожал с $0.133 до $0.211.
Что такое Thinking-режим и зачем он?
Режим, в котором модель думает по шагам перед генерацией, может искать в вебе и использовать загруженные файлы как контекст. Даёт до 8 согласованных кадров одного персонажа или сцены в одном промпте. Доступен на Plus / Pro / Business.
Как gpt-image-2 соотносится с Nano Banana 2?
На LMArena T2I gpt-image-2 — 1512, Nano Banana 2 — 1271 (Δ +242, крупнейший отрыв в истории категории). Single-Image Edit: 1513 против Nano Banana Pro с отставанием на 125. Multi-Image Edit: 1464 против Nano Banana 2 с отставанием на 90. Sweep 7 из 7 подкатегорий T2I.
Какие ограничения на один запрос?
До 4 изображений за один API-вызов. До 8 — в Thinking-режиме внутри ChatGPT. Aspect-ratio от 3:1 до 1:3. Максимум 2K; выше — в бете.
Стоит ли брать gpt-image-2 для фотореализма?
Для чисто артистической фотографии Midjourney по-прежнему сильнее. gpt-image-2 выигрывает, когда нужен текст на картинке, консистентные кадры серии, продуктовый и коммерческий дизайн, инфографика, карточки маркетплейсов, editorial-вёрстка.
Какие есть первоисточники?
Анонс OpenAI, страница API pricing, гайд по расчёту стоимости, разбор The Verge и обзор officechai с цифрами Arena. Все пять ссылок — в блоке «Официальные источники» выше.