Недавно в сообществе разработчиков возник конкретный вопрос: «Может ли API gpt-image-2 генерировать сверхширокие панорамы или сверхвысокие вертикальные изображения с соотношением сторон 1:8 или 8:1? Хочу делать растянутые баннеры, панорамные свитки и длинные инфографики». Если отвечать прямо: gpt-image-2 нативно не поддерживает 1:8 / 8:1, предел — это 3:1 (или 1:3). Nano Banana Pro (он же Gemini 3 Pro Image), который часто сравнивают с ним на рынке, также не поддерживает такие форматы, максимум — 21:9.

Это не значит, что решения нет. Для реальных задач с экстремальным соотношением сторон (рекламные баннеры, широкий формат кино, длинная инфографика, вертикальные изображения персонажей в полный рост) основной подход — это «генерация приближенного соотношения + постобработка и склейка». В этой статье мы разберем официальную документацию обеих моделей, чтобы прояснить правила работы с размерами и обходные пути.
5 ключевых различий в возможностях gpt-image-2 и Nano Banana Pro
Сразу к делу. Таблица ниже составлена на основе официальной документации OpenAI и Google DeepMind. Рекомендую использовать её как шпаргалку при выборе модели.
| Параметр | gpt-image-2 | Nano Banana Pro |
|---|---|---|
| Поддержка пропорций | Произвольные (с учетом ограничений по пикселям) | 10 фиксированных значений |
| Максимальная ширина | 3:1 (3840×1280) | 21:9 (ок. 2.33:1) |
| Максимальная высота | 1:3 (1280×3840) | 9:16 (0.5625:1) |
| Шаг пикселей | Кратность 16 px для каждой стороны | Автоматически рассчитывается от resolution |
| Макс. сторона | 3840 px | 4096 px (база по короткой стороне в 4K) |
| Поддержка 1:8 / 8:1 | ❌ Нет | ❌ Нет |
| Обходные пути | Склейка / расширение / кадрирование | Склейка / расширение / кадрирование |
Важно понимать два момента. Во-первых, ни один из API не поддерживает 1:8 / 8:1 нативно, поэтому получить сверхдлинную панораму одним вызовом не получится. Во-вторых, gpt-image-2 лучше справляется с «экстремальными» форматами — 3:1 шире, чем 21:9, а 1:3 уже, чем 9:16. Если ваши задачи укладываются в 21:9, подойдут обе модели, но для всего, что выходит за эти рамки, выбор только один — gpt-image-2.
🎯 Совет по выбору: если вам действительно нужен формат 1:8, ни одна модель не справится в одиночку. Самый практичный подход — генерировать предельные размеры 3:1 / 1:3 через gpt-image-2, а затем дорабатывать их с помощью постобработки (расширение или склейка). Используя сервис-прокси API APIYI (apiyi.com), вы можете вызывать обе модели через один ключ и быстро сравнивать, какая из них лучше подходит для вашего конкретного сценария.
Подробный разбор механизмов поддержки размеров в gpt-image-2
В модели gpt-image-2 компания OpenAI реализовала «размер» как настраиваемый непрерывный параметр, а не как набор фиксированных значений. Это дает разработчикам большую гибкость, но накладывает ряд строгих ограничений, которые необходимо соблюдать.
Официальные правила размеров для gpt-image-2
Документация OpenAI устанавливает для параметра size в gpt-image-2 три уровня жестких ограничений:
| Параметр ограничения | Правило |
|---|---|
| Пиксели одной стороны | Должны быть кратны 16 |
| Максимум одной стороны | 3840 px (примерно 4K) |
| Диапазон общего количества пикселей | 655 360 ~ 8 294 400 px² |
| Соотношение сторон | ≤ 3:1 (или ≥ 1:3) |
| Экспериментальный диапазон | Стабильность снижается при превышении 2560×1440 |
Запрос принимается только при одновременном выполнении всех четырех условий. Иными словами, вы можете задать size = "3840x1280" (3:1, 4,91 млн пикселей, соответствует всем правилам), но size = "4096x512" будет отклонен (превышена длина стороны 3840 и нарушено соотношение сторон 8:1).
Стандартные и пользовательские размеры в gpt-image-2
Помимо произвольных размеров, gpt-image-2 предлагает три «стандартных размера» в качестве быстрых пресетов:
1024x1024(1:1, квадрат)1536x1024(3:2, альбомная ориентация)1024x1536(2:3, портретная ориентация)
С этими тремя вариантами не нужно беспокоиться об ограничениях, они обеспечивают предсказуемую тарификацию и минимальное время генерации. Для 95% производственных задач рекомендуется использовать именно эти пресеты. Пользовательские размеры стоит применять только для специфических задач вроде постеров, баннеров или панорам.
🎯 Совет по стабильности: при вызове gpt-image-2 через сервис-прокси API APIYI (apiyi.com) пользовательский параметр
sizeпередается вышестоящему API напрямую, поэтому поведение полностью идентично прямому подключению к OpenAI. Однако для запросов из «экспериментального диапазона» (>2560×1440) рекомендуется настроить повторные попытки (retry) при ошибках, так как в этом диапазоне иногда могут возвращаться изображения с артефактами.
Почему gpt-image-2 не поддерживает соотношение 1:8?
Верхний предел 3:1 — это жесткое ограничение, заложенное OpenAI еще на этапе обучения модели. Модель не обучалась на экстремальных пропорциях, поэтому принудительный запрос будет отклонен сервером. Даже если вы попробуете size = "3840x480" (8:1), API вернет ошибку 400: "aspect ratio must be at most 3:1". Это не вопрос «модель может, но функция отключена», а вопрос отсутствия такой способности у модели.
С точки зрения архитектуры, экстремальные соотношения сторон создают огромные сложности для качества генерации. Формат 1:8 требует от модели сохранения композиционной целостности, визуального центра и правильной верстки текста на очень узком холсте, что требует специализированных данных для обучения и схем позиционного кодирования. OpenAI выбрала стратегию «сначала довести качество до идеала в рамках 3:1», оставив более экстремальные форматы для экосистемы постобработки.
🎯 Совет по обходным путям: если вам действительно нужен формат 1:8, рекомендуем сначала сгенерировать основу в формате 3:1 с помощью gpt-image-2, а затем через интерфейс редактирования изображений (image edit) на APIYI (apiyi.com) выполнить расширение границ (outpainting), позволяя модели дорисовать контент по бокам. Такой процесс «база + расширение» гораздо лучше сохраняет визуальную согласованность, чем попытка склеить 8 частей сразу.
Подробный разбор механизмов поддержки размеров в Nano Banana Pro
Google DeepMind выбрала для Nano Banana Pro (рыночное название Gemini 3 Pro Image, в сообществе известна как «Nano Banana 2») диаметрально противоположный подход: соотношение сторон фиксировано в виде 10 предустановленных значений, к которым добавляются три уровня разрешения: 1K, 2K и 4K. Разработчику достаточно «выбрать пропорцию + выбрать разрешение», не задумываясь об ограничениях по пикселям.

10 поддерживаемых соотношений сторон в Nano Banana Pro
В таблице ниже представлен полный список поддерживаемых соотношений сторон для Nano Banana Pro. Передача любого другого значения (например, 5:3 или 2:1) приведет к ошибке или автоматическому возврату к 1:1.
| Тип | Соотношение | Значение | Типичное применение |
|---|---|---|---|
| Квадрат | 1:1 | 1.00 | Аватары, соцсети |
| Альбомный | 4:3 / 5:4 / 3:2 | 1.33 / 1.25 / 1.50 | Фото, презентации |
| Широкоформатный | 16:9 / 21:9 | 1.78 / 2.33 | Обложки видео, широкоэкранный контент |
| Портретный | 3:4 / 4:5 / 2:3 | 0.75 / 0.80 / 0.67 | Постеры, карточки товаров |
| Высокий | 9:16 | 0.56 | Обложки для коротких видео |
Самый широкий формат — 21:9 (≈ 2.33:1), самый высокий — 9:16 (≈ 0.56:1). Как бы вы ни настраивали параметр aspect_ratio, выйти за эти рамки не получится. Это означает, что экстремальные пропорции вроде 1:8 (=0.125) или 8:1 (=8.0) полностью отсутствуют в списке поддерживаемых.
Разрешения и расчет пикселей в Nano Banana Pro
Количество пикселей определяется двумя параметрами: aspect_ratio (форма) + resolution (размер). Правило расчета простое:
- Короткая сторона = базовое значение resolution (1K=1024 / 2K=2048 / 4K=4096)
- Длинная сторона = короткая сторона × коэффициент пропорции
Пример: 21:9 + 4K = короткая сторона 4096 × 9/21 ≈ 4096, длинная сторона рассчитывается пропорционально и составляет около 9557 px. Однако система ограничивает максимум: реальная длинная сторона для 4K зависит от общего количества пикселей и времени генерации. Генерация в 21:9 + 4K занимает около 30 секунд, что более чем в два раза медленнее, чем 16:9 + 4K.
🎯 Совет по разрешению: для 95% повседневных задач достаточно разрешения 2K — качество уже отличное, а время генерации оптимально. Только для предпечатной подготовки или рекламных плакатов стоит использовать 4K. При вызове модели через APIYI (apiyi.com) все три уровня разрешения доступны в рамках одного ключа с оплатой по факту использования, что удобно для сравнения результатов.
Сравнительная таблица возможностей gpt-image-2 и Nano Banana Pro по работе с форматами
Мы собрали возможности обеих моделей для разных сценариев использования, чтобы вам было проще принять решение.

Широта охвата соотношений сторон
| Экстремальные форматы | gpt-image-2 | Nano Banana Pro | Примечание |
|---|---|---|---|
| 1:1 (квадрат) | ✅ 1024×1024 | ✅ 1:1 / любое разрешение | Обе модели стабильны |
| 16:9 (видео) | ✅ Любые пиксели | ✅ Фиксированный набор | Поддерживают обе |
| 21:9 (киноформат) | ✅ Любые пиксели | ✅ Фиксированный набор (предел) | Поддерживают обе |
| 3:1 (баннер) | ✅ Пользовательский (предел) | ❌ Не поддерживается | Только gpt-image-2 |
| 1:3 (вертикаль) | ✅ Пользовательский (предел) | ❌ Не поддерживается | Только gpt-image-2 |
| 4:1 / 1:4 и выше | ❌ Превышает лимит 3:1 | ❌ Превышает лимит 21:9 | Нужна постобработка |
| 8:1 / 1:8 | ❌ Не поддерживается | ❌ Не поддерживается | Только склейка |
Гибкость настройки пикселей
gpt-image-2 — это «произвольные пиксели» в чистом виде: достаточно соблюдать три условия (кратность 16, диапазон общего количества пикселей и лимит соотношения сторон). Nano Banana Pro работает по принципу «фиксированного перечисления»: всего 10 вариантов соотношений × 3 уровня разрешения = 30 возможных комбинаций.
Эта разница определяет выбор модели под конкретный рабочий процесс. gpt-image-2 идеальна для задач, где важна точность до пикселя: например, генерация 1920×1080 для идеального совпадения с существующими материалами или пакетная генерация по сетке дизайна (например, 768 или 1280). Nano Banana Pro лучше подходит для сценариев, где «главное — выбрать направление»: разработчику не нужно считать пиксели, достаточно выбрать один из 10 форматов и уровень качества (1K/2K/4K), остальное система сделает сама.
| Сценарий | Рекомендация |
|---|---|
| Нужна произвольная настройка пикселей | gpt-image-2 |
| Нужно высокое разрешение 4K | Nano Banana Pro (3 уровня до 4K) |
| Нужны форматы 3:1 / 1:3 | Только gpt-image-2 |
| Нужны стандартные форматы между 21:9 и 9:16 | Обе модели |
🎯 Гибридная стратегия: многие команды на практике комбинируют обе модели. Стандартные форматы (1:1, 16:9, 9:16) отправляют в Nano Banana Pro для получения качественных изображений в 4K, а для специфических задач вроде баннеров 3:1 или узких вертикалей 1:3 используют gpt-image-2. На платформе APIYI (apiyi.com) обе модели доступны под одним аккаунтом и ключом, тарификация идет по факту вызовов, переключаться между учетными записями не нужно.
Практические решения для экстремальных соотношений сторон 1:8 / 8:1
Хотя обе модели напрямую не поддерживают соотношение 1:8 или 8:1, вы можете добиться нужного результата с помощью комбинированных стратегий. Ниже приведены три проверенных в продакшене метода, которые стоит выбирать в зависимости от ваших задач.
Способ 1: Посегментная генерация + горизонтальная склейка
Самый надежный подход. Разбейте панораму 1:8 на 4 фрагмента 1:2 или 8 фрагментов 1:1, сгенерируйте их по отдельности, а затем соедините с помощью PIL, sharp или Photoshop. Сложность заключается в бесшовной стыковке краев. Рекомендуется добавлять в промпт для каждого сегмента описание стиля (например, «киберпанк-город, дождливая ночь, неоновые огни, кинематографичный кадр») и фиксировать seed — это значительно повысит визуальную согласованность.
from openai import OpenAI
import base64
# Используем сервис-прокси APIYI
client = OpenAI(api_key="sk-xxx", base_url="https://api.apiyi.com/v1")
def gen_segment(prompt, idx):
resp = client.images.generate(
model="gpt-image-2",
prompt=f"{prompt},фрагмент {idx+1}, бесшовная стыковка с соседними частями, единый стиль",
size="1024x1024",
quality="medium",
)
return base64.b64decode(resp.data[0].b64_json)
base = "панорама киберпанк-города, дождливая ночь, неон"
segments = [gen_segment(base, i) for i in range(8)]
# Используем PIL для горизонтальной склейки 8 изображений 1024×1024 → 8192×1024 (т.е. 8:1)
Способ 2: Генерация 3:1 + AI-расширение (Outpainting)
Сгенерируйте базу 3840×1280 (3:1) с помощью gpt-image-2, а затем используйте интерфейс image.edit от OpenAI или возможности редактирования изображений Nano Banana Pro для горизонтального расширения. Повторите процедуру дважды, чтобы достичь 8:1. Этот метод обеспечивает лучшую визуальную целостность, чем простая склейка, но каждое расширение требует отдельного вызова модели, что увеличивает затраты и время обработки.
Способ 3: 21:9 + последующая обрезка
Самый простой и грубый метод. Сгенерируйте изображение 4K 21:9 (около 4096×1755) с помощью Nano Banana Pro, а затем обрежьте верх и низ до нужного соотношения 8:1 (4096×512). Вы потеряете часть вертикального пространства, но сохраните композицию и единство стиля. Отлично подходит для баннеров, рекламных мест и декоративных изображений, где важнее формат, чем полнота контента.
🎯 Совет по склейке: На практике эти методы не исключают друг друга. Рекомендую сначала использовать третий способ для быстрой проверки идеи, а затем, если результат устраивает, переходить к первому или второму для создания финальной версии. Все три метода можно реализовать на платформе APIYI (apiyi.com) с помощью одного API-ключа, что избавляет от необходимости переключаться между аккаунтами.
| Метод | Преимущества | Недостатки | Сценарии использования |
|---|---|---|---|
| Посегментная склейка | Любое соотношение | Возможны дефекты на стыках | Панорамы, длинные инфографики |
| AI-расширение | Лучшая визуальная связность | Дорого и долго | Брендовые постеры, превью для печати |
| Обрезка | Максимальная скорость | Потеря части контента | Баннеры, декоративные элементы |
Рекомендации по выбору размеров для разных бизнес-задач
Сопоставление задач с конкретными моделями и форматами поможет принимать решения быстрее.
| Бизнес-задача | Рекомендуемая модель | Рекомендуемый размер | Примечание |
|---|---|---|---|
| Квадрат для соцсетей / Аватар | Любая | 1:1 + 1K/2K | Приоритет скорости |
| Обложка видео / Баннер | Nano Banana Pro | 16:9 + 2K/4K | 4K подходит для печати |
| Обложка для коротких видео | Nano Banana Pro | 9:16 + 2K | Оптимально для мобильных |
| Кинопостер / Рекламный баннер | Nano Banana Pro | 21:9 + 4K | Ультраширокий формат |
| Длинный баннер / Инфографика | gpt-image-2 | 3:1 (3840×1280) | Макс. кастомный размер |
| Вертикальный свиток / Арт | gpt-image-2 | 1:3 (1280×3840) | Макс. кастомный размер |
| Панорама 1:8 / 8:1 | Склейка | 8 фрагментов 1:1 | Требует постобработки |
| Произвольное соотношение | gpt-image-2 | Кастомное | В рамках ограничений |
🎯 Лучшая практика: Перед запуском в продакшн проведите A/B-тестирование на платформе APIYI (apiyi.com): сгенерируйте по 50 изображений в популярных форматах (1:1, 16:9, 9:16) на обеих моделях, сравните качество и скорость, а затем выберите основную. Один API-ключ покрывает обе модели, поэтому стоимость эксперимента минимальна, зато вы застрахуете себя от ошибок выбора на этапе запуска.
Часто задаваемые вопросы (FAQ)
В1: Что будет, если передать size = "3840×480" (8:1) в gpt-image-2?
API вернет ошибку 400, указывая на то, что соотношение сторон превышает допустимый предел. Соотношение 3:1 — это жесткое ограничение, установленное OpenAI еще на этапе обучения модели, а не параметр, который можно настроить на бэкенде. Даже веб-версия ChatGPT от самой OpenAI не может генерировать изображения 1:8 или 8:1; это возможно только путем постобработки и склейки.
В2: Можно ли передать Nano Banana Pro произвольное соотношение сторон? Например, 5:3?
Нет. Параметр aspect_ratio в Nano Banana Pro принимает только 10 фиксированных значений (1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9). При передаче других значений вы получите ошибку или система вернется к стандартному 1:1. Если вам нужно 5:3 или другое соотношение, рекомендуем генерировать изображение в ближайшем доступном формате (например, 16:9) и затем обрезать его.
В3: Одинаково ли ведут себя параметры при вызове моделей через APIYI (apiyi.com)?
Абсолютно. APIYI (apiyi.com) полностью транслирует параметры size для gpt-image-2 и aspect_ratio + resolution для Nano Banana Pro без каких-либо преобразований. Поведение моделей полностью соответствует официальным эндпоинтам OpenAI и Google. Тарификация также идет по официальным ценам, без дополнительных комиссий за сервис-прокси API.
В4: Являются ли разрешения 1024×1024 и 1536×1024 для gpt-image-2 «стандартными» или это тоже кастомные настройки?
В документации OpenAI эти три размера четко помечены как "standard sizes". Они проходят через оптимизированные пути обработки, что обеспечивает минимальное время вывода и максимальную стабильность. Другие комбинации пикселей, соответствующие ограничениям, тоже будут работать, но могут наблюдаться незначительные различия в поведении (особенно при экстремальных размерах, близких к лимитам). Поэтому для 95% продакшн-задач рекомендуем использовать три стандартных варианта.
В5: Действительно ли режим 4K в Nano Banana Pro выдает 4096px по короткой стороне?
Согласно документации, "короткая сторона равна базовому значению resolution", то есть в режиме 4K короткая сторона составляет 4096px. Однако тесты показывают, что запросы 21:9 + 4K требуют больше времени на генерацию (более 30 секунд), и иногда происходит понижение до 2K с последующим апскейлингом. Если вам критически важно качество, рекомендуем использовать комбинации 16:9 или 1:1 с 4K, избегая сочетания экстремальных пропорций и экстремального разрешения.
В6: Как обеспечить отсутствие «разрывов» при склейке панорамы 1:8?
Три совета: во-первых, используйте один и тот же длинный промпт для всех сегментов с добавлением описания «бесшовное соединение, единый стиль»; во-вторых, зафиксируйте параметр seed (gpt-image-2 это поддерживает), чтобы модель генерировала похожий стиль при одинаковой семантике; в-третьих, используйте интерфейс редактирования изображений, чтобы правый край предыдущего сегмента стал эталонным изображением (reference) для левого края следующего, что обеспечит непрерывность контента. Комбинация этих методов сводит видимые следы склейки к минимуму.
В7: Появятся ли в будущем модели с нативной поддержкой 1:8?
На данный момент от крупных разработчиков не поступало информации о планах по обучению моделей с нативной поддержкой 1:8 / 8:1. Экстремальные пропорции — это серьезный вызов для композиционных способностей модели, требующий специализированных данных и архитектурных изменений. В краткосрочной перспективе (до конца 2026 года) рекомендуем полагаться на постобработку. Если появятся важные обновления, APIYI (apiyi.com) оперативно сообщит об этом в справочном центре.
В8: Можно ли увидеть логи ошибок, связанных с размерами, в панели управления APIYI?
Да. Логи запросов в панели управления APIYI (apiyi.com) полностью сохраняют информацию об ошибках, возвращаемую вышестоящими сервисами, включая сообщения вроде "aspect ratio must be at most 3:1" или "unsupported aspect_ratio". Разработчики могут сразу увидеть причину отказа, не тратя время на самостоятельное воспроизведение запроса, что значительно ускоряет отладку.
Итог: выбирайте модель, исходя из пропорций, а не только качества
Возвращаясь к главному вопросу: API gpt-image-2 не поддерживает 1:8 / 8:1, максимум — 3:1 / 1:3; Nano Banana Pro также не поддерживает такие форматы, максимум — 21:9 / 9:16. Если вашему бизнесу действительно нужны экстремальные форматы вроде 1:8, планируйте процесс постобработки заранее — не стоит рассчитывать, что какой-то API сделает это «из коробки».
Однако в диапазоне до 21:9 обе модели хороши по-своему: Nano Banana Pro предлагает простоту «выбрал модель + выбрал разрешение» и нативный 4K, а gpt-image-2 — гибкость в выборе пикселей и возможность работы с форматом 3:1. Использование 90% трафика в диапазоне, поддерживаемом обеими моделями, и делегирование 10% экстремальных задач постобработке — самый надежный инженерный подход.
🎯 Финальный совет: рекомендуем подключать gpt-image-2 и Nano Banana Pro через APIYI (apiyi.com) — один ключ, один счет. Для стандартных пропорций используйте любую из них, для экстремальных — кастомные размеры gpt-image-2 плюс склейка. Это самый эффективный способ работы с API для генерации изображений в 2026 году.
— Техническая команда APIYI | Мы следим за развитием моделей генерации изображений. Больше глубоких сравнений — в справочном центре APIYI (apiyi.com).
