Recentemente, um desenvolvedor na comunidade fez uma pergunta bem específica: "A API do gpt-image-2 consegue gerar imagens em proporções super longas como 1:8 ou 8:1 para banners esticados, rolos panorâmicos ou infográficos super longos?" Para ser direto: o gpt-image-2 não suporta nativamente 1:8 ou 8:1; o limite extremo é 3:1 (ou 1:3). O Nano Banana Pro (conhecido como Gemini 3 Pro Image), frequentemente comparado no mercado, também não suporta, ficando limitado a 21:9.

Isso não significa que não existam soluções. Para necessidades reais de proporções extremas (banners, telas widescreen, infográficos longos, personagens em corpo inteiro), a prática comum é a "geração de proporção aproximada + pós-processamento de junção". Escolha conforme a flexibilidade que você precisa. Neste artigo, verificamos a documentação oficial de ambos para esclarecer o suporte a tamanhos, regras de pixel e alternativas, ajudando você a evitar erros comuns.
5 Diferenças principais nas capacidades de tamanho entre gpt-image-2 e Nano Banana Pro
Vamos direto ao ponto. A tabela abaixo foi elaborada com base na documentação oficial da OpenAI e do Google DeepMind. Recomendo usá-la como referência para sua escolha.
| Dimensão | gpt-image-2 | Nano Banana Pro |
|---|---|---|
| Suporte a proporções | Qualquer (sujeito a restrições de pixel) | 10 valores fixos |
| Largura máxima | 3:1 (3840×1280) | 21:9 (aprox. 2.33:1) |
| Altura máxima | 1:3 (1280×3840) | 9:16 (0.5625:1) |
| Granularidade de pixel | Múltiplos de 16 px | Calculado automaticamente |
| Lado máximo único | 3840 px | 4096 px (baseado no lado curto) |
| Suporta 1:8 / 8:1 | ❌ Não | ❌ Não |
| Soluções de pós-processamento | Junção / Expansão / Corte | Junção / Expansão / Corte |
Existem dois pontos cruciais ao ler esta tabela. Primeiro, nenhuma das APIs suporta nativamente 1:8 / 8:1; não espere obter uma imagem panorâmica super longa com apenas uma chamada. Segundo, a capacidade de "chegar perto do extremo" do gpt-image-2 é superior — 3:1 é mais largo que 21:9, e 1:3 é mais estreito que 9:16. Se a sua necessidade estiver dentro de 21:9, ambos funcionam; se precisar de mais, apenas o gpt-image-2 é uma opção.
🎯 Sugestão de escolha: Se você realmente precisa de uma proporção 1:8, nenhuma das duas atende diretamente. A prática mais viável é usar o gpt-image-2 para gerar o tamanho limite de 3:1 / 1:3 e realizar um pós-processamento de expansão ou junção. Ao utilizar o serviço proxy de API da APIYI (apiyi.com) para invocar o gpt-image-2 e o Nano Banana Pro com o mesmo token, você pode comparar rapidamente qual modelo melhor se adapta ao seu cenário específico.
Detalhando o mecanismo de suporte a dimensões do gpt-image-2
A OpenAI transformou a "dimensão" no gpt-image-2 em um parâmetro contínuo personalizável, em vez de valores fixos. Isso dá aos desenvolvedores muita liberdade, mas também impõe algumas restrições rígidas que devem ser seguidas.
Regras oficiais de dimensão do gpt-image-2
A documentação da OpenAI estabelece três níveis de restrições rígidas para o parâmetro size no gpt-image-2:
| Dimensão de restrição | Regra |
|---|---|
| Pixels por lado | Deve ser um múltiplo de 16 |
| Máximo por lado | 3840 px (aprox. 4K) |
| Intervalo total de pixels | 655.360 ~ 8.294.400 px² |
| Proporção lado longo/curto | ≤ 3:1 (ou ≥ 1:3) |
| Intervalo experimental | Estabilidade reduzida acima de 2560×1440 |
As quatro condições devem ser atendidas simultaneamente para que a requisição seja aceita. Em outras palavras, você pode definir size = "3840x1280" (3:1, 4,91 milhões de pixels, atende a todas as restrições), mas size = "4096x512" será rejeitado (excede o comprimento lateral de 3840 e a proporção 8:1 ultrapassa o limite).
Três níveis padrão e níveis personalizados do gpt-image-2
Além das dimensões personalizadas, o gpt-image-2 oferece três "tamanhos padrão" como atalhos:
1024x1024(1:1, quadrado)1536x1024(3:2, paisagem)1024x1536(2:3, retrato)
Esses três níveis não exigem preocupação com restrições, possuem cobrança estável e o menor tempo de inferência. Recomenda-se que 95% do tráfego de produção utilize diretamente esses três níveis. Apenas necessidades especiais, como pôsteres, banners ou rolos de imagem superlongos, devem usar dimensões personalizadas.
🎯 Dica de estabilidade: Ao realizar a invocação do modelo gpt-image-2 via APIYI (apiyi.com), o
sizepersonalizado é transmitido integralmente ao provedor, mantendo o comportamento idêntico à conexão direta com a OpenAI. No entanto, sugerimos implementar tentativas de reenvio (retry) para requisições no "intervalo experimental" (>2560×1440), pois esse intervalo ocasionalmente retorna imagens com qualidade inconsistente; uma tentativa antecipada pode aumentar a taxa de sucesso.
Por que o gpt-image-2 não suporta 1:8?
O limite de 3:1 é uma restrição rígida definida pela OpenAI durante a fase de treinamento do modelo — o modelo não foi treinado extensivamente em proporções mais extremas, portanto, forçar essa configuração resultará em rejeição direta pelo servidor. Mesmo que você tente size = "3840x480" (8:1), a API retornará um erro 400: "aspect ratio must be at most 3:1". Isso é diferente de "o modelo suporta, mas está desativado"; ele realmente não possui essa capacidade.
Do ponto de vista do design do modelo, proporções extremas representam um desafio muito maior para a qualidade da geração do que as proporções convencionais. 1:8 significa que o modelo precisa manter a harmonia da composição, o foco visual e o layout do texto em uma tela extremamente estreita, o que requer dados de treinamento e esquemas de codificação de posição específicos. A OpenAI adotou uma estratégia de produto para o gpt-image-2 de "primeiro, tornar a qualidade de imagem dentro do intervalo 3:1 de ponta", deixando proporções mais extremas para o ecossistema de pós-processamento.
🎯 Sugestão de solução: Se você realmente precisa de 1:8, recomendamos usar o gpt-image-2 para gerar uma imagem 3:1 como base e, em seguida, usar a interface de edição de imagem (image edit) via APIYI (apiyi.com) para expandir as laterais. Durante a expansão, o modelo estende o conteúdo existente para os lados. Esse fluxo de "base + expansão" é mais fácil de manter a consistência visual do que tentar costurar 8 partes de uma só vez.
Detalhando o mecanismo de suporte a dimensões do Nano Banana Pro
O Google DeepMind escolheu um design completamente oposto para o Nano Banana Pro (nome comercial Gemini 3 Pro Image, conhecido na comunidade como "Nano Banana 2") — fixando a proporção em 10 valores predefinidos e sobrepondo três níveis de resolução: 1K, 2K e 4K. Os desenvolvedores só precisam "escolher uma proporção + escolher um nível de resolução", sem se preocupar com restrições de pixels.

As 10 proporções suportadas pelo Nano Banana Pro
A tabela abaixo contém a lista completa e única de proporções do Nano Banana Pro. Enviar qualquer outra proporção (como 5:3, 2:1) resultará em erro ou retorno para 1:1.
| Tipo | Proporção | Valor | Uso típico |
|---|---|---|---|
| Quadrado | 1:1 | 1.00 | Avatares, redes sociais |
| Paisagem | 4:3 / 5:4 / 3:2 | 1.33 / 1.25 / 1.50 | Fotos tradicionais, PPT |
| Paisagem (larga) | 16:9 / 21:9 | 1.78 / 2.33 | Capas de vídeo, widescreen |
| Retrato | 3:4 / 4:5 / 2:3 | 0.75 / 0.80 / 0.67 | Pôsteres, detalhes de produtos |
| Retrato (alta) | 9:16 | 0.56 | Capas de vídeos curtos |
A proporção mais larga é 21:9 ≈ 2.33:1, e a mais alta é 9:16 ≈ 0.56:1. Independentemente de como você transmita o parâmetro aspect_ratio, você não sairá desse intervalo. Isso significa que proporções extremas como 1:8 (=0.125) ou 8:1 (=8.0) não são suportadas.
Níveis de resolução e cálculo de pixels do Nano Banana Pro
Os pixels são determinados por dois parâmetros: aspect_ratio (define a forma) + resolution (define o tamanho). A regra de cálculo é muito simples:
- Lado curto = valor base da resolution (1K=1024 / 2K=2048 / 4K=4096)
- Lado longo = lado curto × multiplicador da proporção
Exemplo: 21:9 + 4K = lado curto 4096 × 9/21 ≈ 4096, lado longo conforme a proporção é de aprox. 9557 px. No entanto, o sistema real aplica um controle de limite superior; o lado longo real máximo do nível 4K é limitado pelo total de pixels e pelo tempo de geração. Uma imagem 21:9 + 4K leva cerca de 30 segundos para ser gerada, sendo mais que o dobro do tempo de uma 16:9 + 4K.
🎯 Sugestão de resolução: Para 95% das requisições de produção diária, usar 2K é suficiente; a qualidade da imagem já é excelente e o tempo de geração é razoável. Apenas em cenários com requisitos rígidos, como pré-visualização de impressão ou pôsteres de marca, deve-se utilizar 4K. Ao invocar o modelo nano-banana-pro via APIYI (apiyi.com), todos os três níveis de resolução estão cobertos por uma única chave, com cobrança por uso, facilitando a comparação de resultados.
Comparativo de capacidades de proporção entre gpt-image-2 e Nano Banana Pro
Colocar as capacidades de ambos lado a lado em diferentes cenários de uso torna a tomada de decisão muito mais intuitiva.

Abrangência de proporções
| Proporção Extrema | gpt-image-2 | Nano Banana Pro | Observações |
|---|---|---|---|
| 1:1 (Quadrado) | ✅ 1024×1024 | ✅ 1:1 / Resolução livre | Ambos são muito estáveis |
| 16:9 (Vídeo) | ✅ Pixels personalizados | ✅ Enumeração fixa | Ambos suportam |
| 21:9 (Widescreen) | ✅ Pixels personalizados | ✅ Enumeração fixa (limite) | Ambos suportam |
| 3:1 (Banner) | ✅ Personalizado (limite) | ❌ Não suportado | Exclusivo do gpt-image-2 |
| 1:3 (Vertical) | ✅ Personalizado (limite) | ❌ Não suportado | Exclusivo do gpt-image-2 |
| 4:1 / 1:4 ou mais | ❌ Acima do limite 3:1 | ❌ Acima do limite 21:9 | Ambos exigem pós-processamento |
| 8:1 / 1:8 | ❌ Não suportado | ❌ Não suportado | Ambos exigem montagem |
Flexibilidade de pixels
O gpt-image-2 oferece "pixels arbitrários" reais, desde que atendam a três restrições: múltiplo de 16, intervalo total de pixels e limite de proporção. O Nano Banana Pro utiliza "enumeração fixa", totalizando 10 proporções × 3 níveis de resolução = 30 possibilidades.
Essa diferença define fluxos de trabalho distintos. O gpt-image-2 é ideal para cenários que exigem controle preciso de pixels, como gerar uma imagem 1920×1080 que se alinhe perfeitamente a materiais existentes ou seguir grades de design (como 768, 1280). O Nano Banana Pro é perfeito para cenários onde "o conceito geral é o que importa"; o desenvolvedor não precisa calcular pixels, apenas escolhe entre as 10 proporções e define a resolução (1K/2K/4K), deixando o resto com o sistema.
| Cenário | Recomendação |
|---|---|
| Necessidade de pixels personalizados | gpt-image-2 |
| Necessidade de grandes dimensões (4K) | Nano Banana Pro (3 níveis até 4K) |
| Necessidade de 3:1 / 1:3 | Apenas gpt-image-2 |
| Proporções comuns entre 21:9 e 9:16 | Ambos funcionam |
🎯 Estratégia Híbrida: Na prática, muitas equipes combinam ambos — usam o Nano Banana Pro para proporções comuns (1:1, 16:9, 9:16) em 4K, e recorrem ao gpt-image-2 para banners 3:1 ou formatos verticais 1:3. Na plataforma APIYI (apiyi.com), ambos os modelos compartilham a mesma conta e chave API, com cobrança separada por volume de uso, sem necessidade de trocar de conta.
1:8 / 8:1 Soluções práticas para proporções extremas
Embora nenhuma das duas plataformas suporte nativamente 1:8 ou 8:1, é possível obter resultados equivalentes através de estratégias combinadas. As três soluções abaixo foram validadas em ambientes de produção; escolha a que melhor se adapta ao seu cenário.
Solução 1: Geração segmentada + União horizontal
A abordagem mais robusta. Divida a imagem panorâmica de 1:8 em 4 subimagens de 1:2 ou 8 subimagens de 1:1, gere cada uma individualmente e depois faça a união usando PIL, sharp ou Photoshop. O desafio é garantir que as bordas adjacentes se encaixem perfeitamente; recomendo injetar um comando de estilo consistente em cada segmento (como "cidade cyberpunk, noite chuvosa, luzes de neon, formato cinematográfico") e fixar a seed para melhorar significativamente a consistência.
from openai import OpenAI
import base64
# Usando o serviço proxy de API da APIYI
client = OpenAI(api_key="sk-xxx", base_url="https://api.apiyi.com/v1")
def gen_segment(prompt, idx):
resp = client.images.generate(
model="gpt-image-2",
prompt=f"{prompt},segmento {idx+1}, conexão perfeita com os segmentos anterior e posterior, estilo consistente",
size="1024x1024",
quality="medium",
)
return base64.b64decode(resp.data[0].b64_json)
base = "skyline de cidade cyberpunk, neon em noite chuvosa"
segments = [gen_segment(base, i) for i in range(8)]
# Use o PIL para unir horizontalmente 8 imagens de 1024×1024 → 8192×1024 (ou seja, 8:1)
Solução 2: Geração 3:1 + Expansão por IA
Use o gpt-image-2 para gerar uma base de 3840×1280 (3:1) de uma só vez e, em seguida, utilize a interface image.edit da OpenAI ou os recursos de edição de imagem do Nano Banana Pro para realizar a expansão horizontal. Cada expansão dobra o tamanho; repita duas vezes para atingir 8:1. Esta solução oferece melhor consistência visual do que a simples união, mas cada expansão consome uma invocação do modelo, aumentando o custo e o tempo de processamento.
Solução 3: 21:9 + Recorte posterior
A mais simples e direta. Gere uma imagem 4K 21:9 (aprox. 4096×1755) usando o Nano Banana Pro e, em seguida, recorte as bordas superior e inferior para atingir a proporção alvo de 8:1 (4096×512). Você perderá um pouco de informação vertical, mas manterá a composição e a unidade de estilo. É ideal para banners, espaços publicitários e imagens decorativas onde "o conteúdo não é o mais importante, desde que a proporção esteja correta".
🎯 Dica de união: Na prática, essas três soluções não são excludentes. Recomendo usar a Solução 3 para criar um demo rápido e validar o design; após confirmar o resultado, você pode migrar para a Solução 2 ou 1 para uma versão de alta qualidade. Todos os três métodos podem ser executados com a mesma chave API na plataforma APIYI (apiyi.com), evitando a alternância entre várias contas.
| Solução | Vantagens | Desvantagens | Cenário ideal |
|---|---|---|---|
| União segmentada | Qualquer proporção | Falhas na junção | Panoramas, infográficos longos |
| Expansão por IA | Melhor consistência visual | Custo e tempo elevados | Pôsteres de marca, pré-visualização de impressão |
| Recorte | Mais rápido | Perda de conteúdo | Banners, imagens decorativas |
Sugestões de dimensões para diferentes cenários de negócio
Mapear o cenário para o modelo e a dimensão corretos acelera a tomada de decisão.
| Cenário de negócio | Modelo recomendado | Dimensão recomendada | Observações |
|---|---|---|---|
| Imagem quadrada / Avatar | Qualquer um | 1:1 + 1K/2K | Velocidade em primeiro lugar |
| Capa de vídeo / Banner | Nano Banana Pro | 16:9 + 2K/4K | 4K pronto para impressão |
| Capa de vídeo curto | Nano Banana Pro | 9:16 + 2K | Otimizado para mobile |
| Pôster de filme / Promocional | Nano Banana Pro | 21:9 + 4K | Widescreen extremo |
| Banner longo / Infográfico | gpt-image-2 | 3:1 (3840×1280) | Personalizado máximo |
| Vertical alta / Pintura em rolo | gpt-image-2 | 1:3 (1280×3840) | Personalizado máximo |
| Panorama 1:8 / 8:1 | Solução de união | 8 segmentos 1:1 | Requer pós-processamento |
| Proporção personalizada | gpt-image-2 | Personalizado | Deve seguir restrições |
🎯 Melhor prática: Antes de colocar em produção, recomendo rodar um teste A/B na APIYI (apiyi.com): gere 50 imagens de cada proporção comum (1:1, 16:9, 9:16) em ambos os modelos, compare a qualidade e a velocidade antes de definir qual será o fluxo principal. Usar a mesma chave API para ambos os modelos mantém o custo do experimento baixíssimo, evitando erros de seleção após o lançamento.
Perguntas Frequentes (FAQ)
Q1: O que acontece se eu enviar size = "3840×480" (8:1) para o gpt-image-2?
A API retornará diretamente um erro 400, indicando que a proporção (aspect ratio) excede o limite máximo. A proporção 3:1 é uma restrição rígida definida pela OpenAI durante a fase de treinamento do modelo, não sendo um parâmetro ajustável no backend. Nem mesmo a versão web do ChatGPT da própria OpenAI consegue gerar imagens 1:8 ou 8:1; isso deve ser feito via pós-processamento de montagem (stitching).
Q2: O Nano Banana Pro aceita proporções personalizadas? Por exemplo, 5:3?
Não. O parâmetro aspect_ratio do Nano Banana Pro aceita apenas 10 valores enumerados (1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9). Enviar outras proporções resultará em erro ou retornará ao padrão 1:1. Se você precisar de 5:3 ou outras proporções, recomendamos gerar na mais próxima (como 16:9) e recortar posteriormente.
Q3: Ao chamar os dois modelos via APIYI apiyi.com, o comportamento dos parâmetros é consistente?
Totalmente consistente. A APIYI apiyi.com realiza o encaminhamento completo dos parâmetros size do gpt-image-2 e aspect_ratio + resolution do Nano Banana Pro, sem qualquer conversão. O comportamento é idêntico aos endpoints oficiais da OpenAI/Google. A cobrança é feita de acordo com os preços oficiais, sem taxas adicionais pelo serviço proxy de API.
Q4: Ao usar tamanhos personalizados no gpt-image-2, 1024×1024 e 1536×1024 são realmente "padrões" ou também contam como personalizados?
A documentação da OpenAI rotula explicitamente esses três como "tamanhos padrão" (standard sizes), que utilizam caminhos predefinidos e otimizados, resultando em menor tempo de inferência e maior estabilidade. Outras combinações de pixels que respeitam as restrições também funcionam, mas podem apresentar variações sutis (especialmente em tamanhos extremos próximos ao limite). Por isso, recomendamos que 95% do tráfego de produção priorize os três tamanhos padrão.
Q5: O modo 4K do Nano Banana Pro realmente consegue entregar 4096px no lado menor?
A documentação afirma que o "lado menor é igual ao valor base da resolução", portanto, no modo 4K, o lado menor = 4096px. No entanto, testes mostraram que requisições em 21:9 + 4K disparam tempos de geração mais longos (acima de 30 segundos), ocasionalmente sofrendo um downgrade para 2K antes de realizar o upsampling. Se você exige alta pureza de imagem, recomendamos usar combinações de 16:9 ou 1:1 + 4K, evitando a sobreposição de proporções extremas com resoluções extremas.
Q6: Como garantir que não haja "cortes" entre os segmentos na montagem de uma imagem panorâmica 1:8?
Três dicas: primeiro, todos os segmentos devem compartilhar um comando longo com descrições como "emenda perfeita, estilo consistente"; segundo, fixe o parâmetro seed (o gpt-image-2 suporta isso) para que o modelo gere estilos semelhantes sob a mesma semântica; terceiro, use a interface de edição de imagem para que a borda direita do segmento anterior sirva como referência para a borda esquerda do próximo, forçando a continuidade do conteúdo. A combinação desses três métodos minimiza ao máximo os vestígios visíveis de emenda.
Q7: Haverá modelos com suporte nativo a 1:8 no futuro?
Atualmente, não há informações públicas de grandes fabricantes sobre planos de treinamento nativo para 1:8 / 8:1. Proporções extremas são um grande desafio para a capacidade de composição do modelo, exigindo dados de treinamento especializados e ajustes de arquitetura. A curto prazo (até 2026), recomendamos depender de soluções de pós-processamento. Caso haja atualizações importantes, a APIYI apiyi.com as publicará imediatamente na Central de Ajuda.
Q8: O painel da APIYI exibe logs de erro relacionados a dimensões?
Sim. Os logs de requisição no painel da APIYI apiyi.com retêm integralmente as informações de erro retornadas pelo upstream, incluindo mensagens como "aspect ratio must be at most 3:1" ou "unsupported aspect_ratio". Os desenvolvedores podem ver o motivo da rejeição diretamente nos logs, sem precisar reproduzir a requisição, o que reduz significativamente o tempo de depuração.
Resumo: Escolha o modelo pela proporção antes da qualidade
Voltando à questão central deste artigo: a API do gpt-image-2 não suporta 1:8 / 8:1, chegando no máximo a 3:1 / 1:3; o Nano Banana Pro também não suporta, limitando-se a 21:9 / 9:16. Se o seu negócio realmente precisa de um formato extremo como 1:8, planeje seu fluxo de pós-processamento com antecedência; não espere que uma única API resolva tudo.
No entanto, dentro da faixa de proporções comuns de até 21:9, ambos têm seus pontos fortes: o Nano Banana Pro oferece uma experiência simplificada de "escolha um + escolha um nível" com 4K nativo, enquanto o gpt-image-2 oferece flexibilidade de pixels arbitrários e capacidade para formatos horizontais extremos de 3:1. Manter 90% do tráfego na faixa coberta por ambos e delegar os 10% de necessidades extremas ao pós-processamento é a estratégia de engenharia mais segura.
🎯 Recomendação final: Recomendamos integrar o gpt-image-2 e o Nano Banana Pro através da APIYI apiyi.com, utilizando um único token e uma única fatura. Alterne entre proporções comuns conforme necessário e use o gpt-image-2 com personalização + montagem para proporções extremas. Esta é a forma mais eficiente de integrar APIs de imagem em 2026.
— Equipe Técnica APIYI | Acompanhando continuamente a dinâmica dos modelos de geração de imagens. Veja mais comparações detalhadas na Central de Ajuda da APIYI apiyi.com.
