|

Guia completo para integrar o gpt-image-2 ao ComfyUI: 5 passos para desbloquear o modelo de geração de imagens mais poderoso da OpenAI

Quer integrar o gpt-image-2 diretamente no seu ComfyUI local para realizar geração de imagens, refinamento de máscara e composição de múltiplas imagens, mas está sendo bloqueado pelo ambiente de rede, cotas ou controle de parâmetros dos nós oficiais da OpenAI? Este artigo apresenta o caminho mais curto para você dominar todo o processo: instale um plugin da comunidade, configure um serviço proxy de API e, em 5 minutos, ative o nó gpt-image-2 na sua tela do ComfyUI.

O gpt-image-2 é o modelo de imagem "raciocine antes de gerar" lançado pela OpenAI em 2026. Ele se destaca em layouts de texto denso, infográficos de interface (UI), storyboards de mangá e edição precisa de máscaras, mantendo a estabilidade dos pixels fora da área de edição. No entanto, para integrá-lo aos nós do ComfyUI, os "Partner Nodes" oficiais não são amigáveis para usuários de muitas regiões: ou você depende do Comfy Cloud, ou trava na etapa de autenticação.

O Comfyui-Luck-gpt2.0 é atualmente a solução de integração do gpt-image-2 mais estável na comunidade ComfyUI. Ele oferece dois nós: um para "controle preciso" e outro para "lotes econômicos", permitindo tanto saídas de alta qualidade em 4K quanto a geração de rascunhos em lote por $0,03/imagem. O backend só precisa se conectar a um serviço proxy de API compatível com a interface da OpenAI. Neste artigo, recomendamos o APIYI apiyi.com, que oferece três rotas: api.apiyi.com, vip.apiyi.com e b.apiyi.com, com suporte a Bearer Token pronto para uso.

Ao seguir este tutorial de integração do gpt-image-2 no ComfyUI, você terá:

  • Um nó Luck gpt-image-2 / Luck gpt-2.0 all que pode ser encontrado com um clique duplo na tela do ComfyUI.
  • Um guia rápido de parâmetros cobrindo 1K/2K/4K, 15 proporções de aspecto e refinamento de máscara.
  • Dois exemplos de fluxo de trabalho prontos para uso (geração de texto para imagem em 4K + repintura local com máscara).
  • Uma lista de verificação de problemas comuns para evitar erros frequentes de timeout, 429 e formatos de máscara.

1. Por que integrar o gpt-image-2 no ComfyUI?

1.1 Três novas capacidades que o gpt-image-2 traz ao ComfyUI

Antes do gpt-image-2, criar pôsteres de texto ou infográficos de UI no ComfyUI dependia basicamente de SDXL + ControlNet, o que frequentemente resultava em textos borrados ou layouts distorcidos. O gpt-image-2 é o primeiro modelo de imagem da OpenAI que "raciocina antes de gerar", planejando a composição antes de desenhar, o que se adapta perfeitamente ao cenário do ComfyUI, onde é necessária a colaboração com outros nós:

Capacidade Solução local anterior Após integrar o gpt-image-2
Renderização de texto denso Necessitava de pós-processamento via OCR Gera diretamente listas centralizadas de "7 itens em 11pt Helvetica"
Repintura local (Mask) O Inpaint frequentemente danificava pixels vizinhos "Pixels estáveis" fora da área de edição, sem afetar rostos ou a composição
Consistência de referência Ajuste complexo de parâmetros no IPAdapter Até 5 imagens de referência para manter a consistência do personagem/produto
Resolução ultra-alta Hires.fix exigia ajustes constantes Suporte nativo para saída 1K/2K/4K em uma única etapa

1.2 Por que escolher o Comfyui-Luck-gpt2.0 em vez dos nós oficiais?

O ComfyUI adicionou oficialmente o nó OpenAI GPT-Image via Partner Nodes na v0.19.4, mas ele utiliza a conexão direta com a OpenAI por padrão, o que frequentemente trava no handshake SSL ou em limites de taxa (429) em ambientes com restrições de rede. O valor do Comfyui-Luck-gpt2.0 reside exatamente aqui:

  • Amigável para redes locais: Conecta-se por padrão a um serviço proxy de API compatível com a interface da OpenAI, com o site principal api.apiyi.com + redundância dupla.
  • Parâmetros mais completos: Expõe parâmetros mais finos que o nó oficial, como image_size, quality, output_compression e output_format.
  • Combinação de dois nós: Possui tanto o nó de "controle preciso" quanto o nó econômico "cobrado por imagem".
  • Comando em chinês: O nó reverso possui uma compreensão semântica mais estável para comandos em chinês.

💡 Sugestão de serviço proxy: Este artigo utiliza o APIYI apiyi.com como porta de entrada para o gpt-image-2. Ele suporta tanto o formato Responses API quanto o formato Images API, correspondendo exatamente aos dois tipos de endpoints do Comfyui-Luck-gpt2.0, economizando tempo com adaptações.

1.3 Para quem é este tutorial?

Seu perfil O que você ganhará com este tutorial
Usuário experiente de ComfyUI Inserir um nó de "capa/pôster" de alta qualidade no fluxo de trabalho atual, eliminando a necessidade de retoques no Photoshop
Profissional de fotografia AIGC Refinamento de máscara + múltiplas imagens de referência para replicar a consistência de produtos/modelos
Criador de conteúdo/Blogueiro Saída de capas verticais 2:3 em 4K com um clique, substituindo bancos de imagens externos
Desenvolvedor Usar o ComfyUI como um shell local de Stable Diffusion e realizar testes de integração de API com o gpt-image-2

二、Componentes centrais do ComfyUI para integrar o gpt-image-2

comfyui-gpt-image-2-integration-guide-pt-pt 图示

2.1 Visão geral do plug-in Comfyui-Luck-gpt2.0

O Comfyui-Luck-gpt2.0 é um pacote de nós personalizados de código aberto para o ComfyUI, disponível no repositório GitHub github.com/luckdvr/Comfyui-Luck-gpt2.0. Ele não é um nó único, mas um "conjunto"— após a instalação, ele registrará dois nós independentes no menu de nós do ComfyUI:

Comfyui-Luck-gpt2.0
├── Luck gpt-image-2       # Nó de transferência direta: controle preciso, parâmetro size real
└── Luck gpt-2.0 all       # Nó de transferência reversa: modo econômico, endpoints alternáveis

As interfaces externas de ambos os nós são consistentes e exigem que você forneça:

  1. Um base_url compatível com o protocolo OpenAI (recomendamos a APIYI api.apiyi.com)
  2. Um token no formato Bearer SUA_CHAVE_API
  3. Um comando (prompt) de texto ou entrada de imagem

2.2 Como escolher entre os dois nós: uma tabela para esclarecer

Esta é a tabela mais importante de todo o texto, entenda-a bem antes de continuar:

Dimensão de Comparação Luck gpt-image-2 (Direto) Luck gpt-2.0 all (Reverso)
Modelo backend gpt-image-2 gpt-image-2-all
Posicionamento Controle preciso, alta qualidade Econômico, ideal para chinês
Parâmetro size ✅ Campo size real ❌ Apenas via sugestão no prompt
Opções de resolução AUTO / 1K / 2K / 4K / Custom Dimensões padrão
Aspect Ratio 15 predefinições + WxH custom Via descrição no prompt
Mascaramento (Inpainting) ✅ Suportado ❌ Não suportado
Imagens de referência Até 5 imagens Até 5 imagens
Níveis de qualidade auto / low / medium / high Fixo
Formatos de saída PNG / JPEG / WebP PNG
Troca de endpoint Fixo images_api Alternável entre chat_completions / images_api
Preço de referência Cobrança por token Aprox. $0,03/imagem
Cenários ideais Pôsteres, capas, fotos comerciais, retoques via Mask Rascunhos em lote, conceitos, prompts em chinês

comfyui-gpt-image-2-integration-guide-pt-pt 图示

2.3 Backend API: por que recomendamos a APIYI (apiyi.com)

O Comfyui-Luck-gpt2.0 em si é uma "casca vazia"; quem realmente invoca o gpt-image-2 é o gateway que você define em base_url. Ele exige que o gateway cumpra dois pontos:

  1. Compatibilidade total com o protocolo OpenAI: rotas /v1/images/generations, /v1/responses, /v1/chat/completions completas.
  2. Roteamento nativo para o gpt-image-2: capacidade de identificar model=gpt-image-2 e model=gpt-image-2-all.

🎯 Dica de integração: recomendamos conectar ao gpt-image-2 através da plataforma APIYI (apiyi.com). A plataforma suporta simultaneamente os modos de transferência direta (gpt-image-2) e reversa (gpt-image-2-all), utiliza autenticação via Token Bearer unificada e gerencia a alternância automática entre o site principal api.apiyi.com e as linhas de backup vip.apiyi.com / b.apiyi.com, reduzindo drasticamente a taxa de falhas por instabilidade de saída única durante operações em lote no ComfyUI.

Cenários de aplicação para diferentes domínios:

Domínio Posicionamento Cenário de aplicação
api.apiyi.com Site principal Recomendado por padrão, chamadas diárias de estações de trabalho pessoais no ComfyUI
vip.apiyi.com Linha de alta concorrência Geração em lote, paralelismo de vários nós, filas noturnas
b.apiyi.com Saída de backup Fallback automático em caso de oscilação do site principal

As três linhas compartilham o mesmo conjunto de Chave API; você só precisa alterar uma string no seu nó do Comfyui-Luck-gpt2.0 para alternar entre elas.

III. Passos completos para integrar o gpt-image-2 ao ComfyUI

3.1 Verificação do ambiente prévio

Antes de começar, confirme se o seu ambiente ComfyUI atende aos seguintes requisitos:

Item Requisito Comando de verificação
Versão do ComfyUI Recomendado v0.3+ ou superior Primeira linha do console ao iniciar
Versão do Python 3.10 / 3.11 / 3.12 python3 --version
Git disponível Pode ser chamado diretamente no terminal git --version
Espaço em disco ≥ 500 MB (plugin + dependências) df -h
Rede Acesso ao GitHub + api.apiyi.com curl -I api.apiyi.com

⚠️ Problemas comuns: Usuários de Windows que utilizam pacotes de instalação "um clique" (como a versão de QiuYe), o python3 pode apontar para o Python embutido no pacote. Nesse caso, use .\python_embeded\python.exe em vez disso.

3.2 Instalação do plugin: 4 passos simples

A instalação do plugin para integrar o gpt-image-2 ao ComfyUI requer apenas 4 comandos. Abra o terminal, navegue até a pasta raiz do seu ComfyUI e execute:

# 1. Entre no diretório custom_nodes
cd ComfyUI/custom_nodes

# 2. Clone o repositório Comfyui-Luck-gpt2.0
git clone https://github.com/luckdvr/Comfyui-Luck-gpt2.0.git

# 3. Instale as dependências Python
cd Comfyui-Luck-gpt2.0
python3 -m pip install -r requirements.txt

# 4. Reinicie o ComfyUI

Usuários do pacote portátil para Windows devem substituir o passo 3 por:

cd Comfyui-Luck-gpt2.0
..\..\python_embeded\python.exe -m pip install -r requirements.txt

Após reiniciar, observe se o console exibe logs semelhantes a estes:

[Comfyui-Luck-gpt2.0] Registered node: Luck gpt-image-2
[Comfyui-Luck-gpt2.0] Registered node: Luck gpt-2.0 all

Ao ver as duas linhas de registro bem-sucedido, a etapa de integração do gpt-image-2 no ComfyUI estará concluída.

3.3 Obtendo a chave API do APIYI

  1. Abra o navegador e acesse o site oficial do APIYI em apiyi.com
  2. Registre-se/faça login e acesse o painel de controle → API Keys
  3. Clique em "Criar nova chave". Recomendamos ativar o "Limite de uso" e definir um valor inicial de ¥20–50 para verificação
  4. Copie a string da chave que começa com sk- e guarde-a em um local seguro

🔐 Dica de segurança: Crie uma chave exclusiva para o ComfyUI e defina um limite de uso diário. Como o plugin local salva a chave nos parâmetros do nó, ela pode ser exposta ao exportar o JSON do fluxo de trabalho. Uma chave independente é mais fácil de revogar caso necessário.

3.4 Inserindo nós na tela do ComfyUI

Após abrir o ComfyUI:

  1. Clique duas vezes em uma área vazia da tela para abrir a caixa de busca de nós
  2. Digite Luck gpt-image-2 (para o nó principal) ou Luck gpt-2.0 all
  3. Selecione o nó e o ComfyUI o posicionará onde o seu mouse estiver

Após o nó aparecer, preencha os três campos principais:

Campo Valor Descrição
base_url https://api.apiyi.com/v1 Endereço do servidor (não esqueça do /v1)
api_key sk-xxxxxxxxxxxxxxxx Chave copiada no painel do APIYI
model gpt-image-2 ou gpt-image-2-all Depende do nó, geralmente já vem preenchido

3.5 Primeira geração: fluxo de trabalho mínimo funcional

Vamos usar o Luck gpt-image-2 para gerar uma imagem 1024×1024 simples (texto para imagem) e verificar se a conexão está funcionando:

[Luck gpt-image-2]
  ├── base_url     = https://api.apiyi.com/v1
  ├── api_key      = sk-xxxxxxxx
  ├── prompt       = A minimalist product poster, dark navy background,
  │                  centered title "HELLO 2026" in large Helvetica font,
  │                  tiny stars scattered around
  ├── image_size   = 1K
  ├── aspect_ratio = 1:1
  ├── quality      = medium
  └── output_format = png
      │
      ▼
[Preview Image]

Conecte a saída image do nó Luck gpt-image-2 ao nó Preview Image do ComfyUI e clique em "Queue". Após cerca de 20–40 segundos, o lado direito da tela exibirá um pôster quadrado com o título "HELLO 2026". Se o texto estiver legível e centralizado, você conseguiu integrar o gpt-image-2 ao ComfyUI com sucesso.

🎯 Confirmação: Se falhar, 90% das vezes é porque faltou o /v1 na base_url ou a chave não começa com sk-. Volte ao painel do APIYI, copie a chave novamente e verifique o final da base_url.


IV. Guia rápido de parâmetros do gpt-image-2 no ComfyUI

4.1 Resolução (image_size)

O campo image_size do nó Luck gpt-image-2 define a resolução de saída:

image_size Tamanho real (exemplo 1:1) Uso típico
AUTO Determinação automática pelo modelo Exploração sem restrição de tamanho
1K 1024×1024 Rascunhos, avatares, stickers
2K 2048×2048 Imagens de destaque, capas de blog
4K Até 3840×3840 Pôsteres, impressão, telas grandes
custom LARGURAxALTURA Formatos personalizados, banners longos

Requisitos para o modo custom:

  • Largura e altura devem ser múltiplos de 16
  • O lado maior não pode exceder 3840 px
  • Exemplos recomendados: 1600x900, 2048x1152, 1088x1920

4.2 Proporção (aspect_ratio)

O nó gpt-image-2 suporta 15 predefinições de proporção. As 8 mais comuns:

aspect_ratio Cenário de uso
1:1 Avatares, posts quadrados, fotos de produtos
16:9 Capas de blog, miniaturas do YouTube
9:16 Stories, TikTok, papéis de parede de celular
2:3 Pôsteres de filmes, Pinterest
3:2 Fotografia, proporção de câmera
4:3 Slides, apresentações PPT
21:9 Banners ultra-largos, cabeçalhos web
4:5 Proporção ideal para Instagram

4.3 Nível de qualidade (quality)

quality Velocidade Custo Cenário de uso
auto Médio Médio Deixe o modelo decidir
low Rápido Baixo Rascunhos em lote, prévias
medium Médio Médio Imagens para redes sociais/blogs
high Lento Alto Capas, pôsteres, materiais impressos

Dica: Para proporções muito largas (21:9) ou alta resolução (4K), use sempre quality=high para evitar perda de detalhes.

4.4 Formato de saída e compressão

output_format output_compression Uso
png Ignorado Fundo transparente, pós-processamento
jpeg 85–95 Imagens para artigos
webp 75–85 Sites, foco em dispositivos móveis

output_compression funciona apenas para jpeg/webp (0–100). Valores maiores significam melhor qualidade, porém arquivos maiores.

4.5 Imagem de referência e Máscara

  • Imagem de referência: Conecte até 5 entradas IMAGE. O modelo as usará como âncoras de composição, estilo ou personagem.
  • Máscara: Conecte uma imagem em preto e branco com as mesmas dimensões da primeira imagem de referência. Pixels brancos indicam "editar aqui", pretos indicam "manter estável". Esta é uma das capacidades mais poderosas do gpt-image-2.

🎯 Dica prática: Use o nó LoadImage no ComfyUI para carregar a imagem original e MaskToImage / ImageInvert para criar a máscara. Para fluxos complexos, consulte os exemplos na documentação oficial do APIYI em docs.apiyi.com, que podem ser colados diretamente no seu ComfyUI via Ctrl+V.

V. Três fluxos de trabalho práticos para integrar o gpt-image-2 ao ComfyUI

5.1 Fluxo de trabalho A: Geração de pôsteres de alta qualidade em 4K

Objetivo: Gerar uma capa com aspecto de pôster de filme em 3840×5760 (2:3), com texto nítido e composição centralizada.

[PrimitiveNode: string de comando]
  │
  ▼
[Luck gpt-image-2]
  ├── base_url     = https://api.apiyi.com/v1
  ├── api_key      = sk-xxxx
  ├── prompt       = (do nó anterior)
  ├── image_size   = 4K
  ├── aspect_ratio = 2:3
  ├── quality      = high
  ├── output_format = png
  ├── timeout      = 360
  └── max_retries  = 3
      │
      ▼
[SaveImage: filename_prefix = poster_4k]

Exemplo de comando:

A cinematic poster for a sci-fi novel titled "NEON HORIZON",
dark blue and magenta gradient sky, lone silhouette standing on a cliff,
bold serif title centered at the top, subtle tagline at bottom in small caps,
highly detailed, 35mm film grain.

Pontos-chave:

  • image_size=4K + aspect_ratio=2:3 ≈ 3840×5760
  • quality=high é crucial para a nitidez do texto; configurações inferiores podem causar distorção nos caracteres.
  • O timeout deve ser ≥ 360 segundos, já que a geração em 4K pode levar de 3 a 5 minutos.

5.2 Fluxo de trabalho B: Inpainting com máscara (troca de fundo/ajuste de detalhes)

Objetivo: Substituir o fundo branco puro de uma foto de xícara de café por uma "mesa de mármore", mantendo a xícara e a sombra intactas.

[LoadImage: coffee_cup.png]      [LoadImage: coffee_cup_mask.png]
        │                                  │
        ▼                                  ▼
              [Luck gpt-image-2]
              ├── prompt     = Replace the background with a luxurious
              │                white marble countertop, soft natural
              │                window light from the left
              ├── image_1    = ← coffee_cup.png
              ├── mask       = ← coffee_cup_mask.png  (branco=área de fundo)
              ├── image_size = 2K
              ├── quality    = high
                    │
                    ▼
              [SaveImage]

Regras fundamentais para a máscara:

  1. A imagem da máscara deve ter as mesmas dimensões (largura e altura) da image_1.
  2. Branco (255,255,255) = Área a ser editada.
  3. Preto (0,0,0) = Área a ser preservada.
  4. Tons de cinza = Mistura proporcional (útil para suavizar bordas).

💡 Dica de fidelidade: Aplique um desfoque gaussiano de 3–5 px nas bordas da máscara para evitar o efeito de "recorte colado". O gpt-image-2 lida bem com transições em tons de cinza, sendo ideal para substituir fundos em fotos de produtos.

5.3 Fluxo de trabalho C: Modo econômico para lote de 100 rascunhos conceituais

Objetivo: Projetar 100 conceitos de vestuário para um personagem, a um custo de aproximadamente $0,03 por imagem, mantendo o custo total em torno de $3.

[TextFileReader: 100 comandos]
          │
          ▼ (loop/fila)
[Luck gpt-2.0 all]
  ├── base_url    = https://vip.apiyi.com/v1   ← Rota de alta concorrência
  ├── api_key     = sk-xxxx
  ├── endpoint    = chat_completions
  ├── model       = gpt-image-2-all
  ├── timeout     = 180
  └── max_retries = 3
      │
      ▼
[SaveImage: filename_prefix = concept_###]

Três razões para usar o nó Luck gpt-2.0 all neste cenário:

  • Cobrança por imagem: Cerca de $0,03/imagem, mais previsível do que a cobrança por token.
  • Suporte a comandos em chinês: Ideal para termos específicos como "Hanfu modernizado" ou "Cyberpunk", com maior estabilidade.
  • Troca de endpoint: O modo chat_completions lida melhor com comandos longos.

🎯 Estabilidade em lote: Ao rodar em lote, altere a base_url para vip.apiyi.com, defina max_retries como 3 e timeout como 180 segundos. A rota VIP da APIYI (apiyi.com) distribui automaticamente flutuações temporárias (erros 429/5xx) para saídas de reserva, evitando que tarefas longas travem.


VI. Recursos avançados do gpt-image-2 no ComfyUI

6.1 Pipeline híbrido: gpt-image-2 para base + modelos locais para estilo

O gpt-image-2 é excelente em "composição complexa + tipografia", mas perde para SDXL/Flux em estilos de anime, pixel art ou estilos de artistas específicos. Pipeline recomendado:

[Luck gpt-image-2]  → Gera a composição base (com texto e logo)
        ↓
[VAE Encode]        → Converte de volta para latente
        ↓
[KSampler: Flux/SDXL + LoRA] → Transferência de estilo / Refinamento
        ↓
[Upscaler: 4x-UltraSharp] → Upscaling para 8K

Essa abordagem combina a capacidade do gpt-image-2 de "escrever texto" com a "liberdade de estilo" dos modelos locais.

6.2 Consistência facial com múltiplas imagens de referência

Use as 5 entradas de imagem de referência do Luck gpt-image-2 para aumentar drasticamente a consistência do personagem ou produto:

Posição da referência O que colocar
image_1 Foto frontal clara do objeto
image_2 Vista lateral/traseira
image_3 Detalhes (Logo, textura)
image_4 Atmosfera do cenário
image_5 Referência de tom/luz

No comando, enfatize "manter a identidade do personagem da image_1" ou "usar a direção de luz da image_4" para resultados estáveis.

6.3 Consistência em lote: 8 imagens de uma vez

O gpt-image-2 pode retornar até 8 imagens mantendo a consistência. No nó Luck gpt-image-2, defina o parâmetro n como 8 (em algumas versões chamado de batch_size):

Luck gpt-image-2
  ├── prompt = character turnaround sheet of a cyberpunk girl,
  │            8 different poses, same outfit, same face,
  │            white background, character sheet layout
  └── n = 8

Ideal para:

  • Folhas de personagem (8 ângulos).
  • Variantes de produto (8 cores/embalagens).
  • Storyboards (8 quadros).

6.4 Expondo o fluxo de trabalho do ComfyUI como API

Se você usa o ComfyUI como um "servidor privado", a saída do nó Comfyui-Luck-gpt2.0 pode ser consumida diretamente pela interface /prompt do ComfyUI. Integrando com as rotas da APIYI (apiyi.com), o fluxo fica:

Seu Frontend → ComfyUI HTTP API → Nó Luck gpt-image-2
                                      ↓
                          api.apiyi.com / vip.apiyi.com
                                      ↓
                               OpenAI gpt-image-2

Este é o caminho mais rápido para transformar um "fluxo de trabalho do ComfyUI" em uma "API de imagem externa".

VII. FAQ: Perguntas Frequentes sobre a Integração do gpt-image-2 no ComfyUI

Q1: Instalei o nó, mas não consigo encontrar o Luck gpt-image-2 na tela?

Verifique estes quatro pontos:

  1. O diretório ComfyUI/custom_nodes/Comfyui-Luck-gpt2.0/ existe?
  2. Todas as dependências no requirements.txt foram instaladas com sucesso? (Preste atenção especial ao requests e Pillow)
  3. Há algum erro de ImportError em vermelho no console do ComfyUI ao iniciar?
  4. Você realmente "reiniciou completamente" o ComfyUI? (Apenas atualizar a página com Ctrl+R não conta)

Q2: Recebi um erro 401 Unauthorized ou Invalid API key?

Em 99% dos casos, é um problema com a chave ou com a base_url:

  • A chave deve conter obrigatoriamente o prefixo sk-.
  • A base_url deve terminar com /v1 (não coloque apenas https://api.apiyi.com).
  • Não adicione manualmente Bearer antes da chave; o nó fará a concatenação automaticamente.

Q3: O erro 429 Too Many Requests apareceu?

Você atingiu o limite de taxa. Duas formas de resolver:

  • Curto prazo: Aumente o max_retries para mais de 3, permitindo que o nó aguarde e tente novamente.
  • Longo prazo: Altere a base_url de api.apiyi.com para vip.apiyi.com ou b.apiyi.com. Estas últimas são rotas de alta concorrência ou de backup.

Consulta rápida de códigos de erro:

Código Significado Ação
401 Chave inválida Copie novamente, verifique o prefixo sk-
403 Sem permissão Confirme no painel da APIYI se o modelo está ativado
408 Tempo esgotado Aumente o timeout para 360 segundos
429 Limite de taxa Mude para a rota VIP + aumente os retries
500/502 Instabilidade no servidor Tente novamente 3 vezes ou mude para a rota B

Q4: A geração de imagens em 4K sempre dá timeout?

  • Ajuste o timeout para 480 segundos (o gpt-image-2 em 4K + quality=high pode levar até 6 minutos).
  • max_retries=2 é suficiente; muitas tentativas acumulam muito tempo.
  • Se a rede estiver lenta, prefira image_size=2K e use um nó de Upscaler posteriormente para chegar aos 4K; a sensação de velocidade será maior.

Q5: A máscara não está alinhada na área de edição?

  • Confirme se a máscara e a imagem original têm a mesma largura e altura, sem deslocamento de pixels.
  • Confirme se a máscara está em preto e branco puro, sem canal alfa (transparência).
  • A área branca deve ser (255,255,255); evite tons de cinza.
  • Você pode adicionar um nó ImageThreshold antes do nó de máscara para forçar a binarização.

Q6: É possível usar totalmente offline?

Não. O gpt-image-2 é um Modelo de Linguagem Grande da OpenAI na nuvem e deve ser acessado via gateway. No entanto, você pode usar as três rotas de saída da APIYI (apiyi.com) para obter uma "pseudo-alta disponibilidade": o sistema alterna automaticamente quando a rota principal oscila, proporcionando uma experiência próxima a uma implantação local.

Q7: O texto em chinês no comando (prompt) sai sempre bagunçado?

  • O nó de conversão direta (Luck gpt-image-2) é mais eficiente com textos em inglês.
  • Para comandos em chinês, recomendamos o nó de conversão reversa (Luck gpt-2.0 all), que utiliza o gpt-image-2-all, oferecendo uma compreensão mais estável do idioma.
  • Se precisar usar a conversão direta com chinês, escreva diretamente no comando: render Chinese text "你好世界" em vez de deixar o modelo "adivinhar" o que deve ser escrito.

Q8: Como estimar os custos?

  • Nó de conversão direta (gpt-image-2): Cobrança por token. Uma imagem 2K custa cerca de $0,08–$0,15, e 4K high cerca de $0,25–$0,40.
  • Nó de conversão reversa (gpt-image-2-all): Cobrança por imagem, cerca de $0,03/imagem.
  • Recomendamos ativar o "limite de uso diário" no painel da APIYI (apiyi.com) e rodar de 50 a 100 imagens para estabelecer uma base.

VIII. Resumo da Integração do gpt-image-2 no ComfyUI

Integrar o gpt-image-2 ao ComfyUI significa, essencialmente, ter um Modelo de Linguagem Grande de ponta na nuvem e nós locais precisos em uma única tela. Ao concluir o fluxo deste artigo, você já deve ter:

  1. ✅ Instalado o plugin Comfyui-Luck-gpt2.0 e registrado os dois novos nós.
  2. ✅ Obtido a chave no painel da APIYI apiyi.com e configurado a base_url / api_key.
  3. ✅ Executado o fluxo de trabalho mínimo de texto para imagem, confirmando a conexão.
  4. ✅ Dominado as combinações de parâmetros para 1K/2K/4K, 15 proporções de aspecto, quatro níveis de qualidade e três formatos (PNG/JPEG/WebP).
  5. ✅ Executado pelo menos um dos fluxos de trabalho práticos: texto para imagem 4K, repintura com máscara ou modo econômico em lote.

O maior valor da integração do gpt-image-2 no ComfyUI é transformar o "modelo de imagem de ponta da OpenAI" em um nó comum dentro da tela do ComfyUI. Você não precisa mais alternar entre o navegador e as ferramentas locais; todo o pipeline pode ser encadeado em um único fluxo: gpt-image-2 gera o objeto principal → SDXL estiliza → Upscaler aumenta a resolução → SaveImage salva.

🎯 Sugestão para o próximo passo: Recomendamos que você solicite uma chave de teste na plataforma APIYI apiyi.com (com limite de saldo definido), execute a primeira imagem seguindo o fluxo mínimo da seção 3.5 e, em seguida, expanda para os três fluxos práticos da seção 5. Se tiver problemas com parâmetros, consulte a tabela de consulta rápida na seção 4; para códigos de erro, consulte o FAQ na seção 7. Para fluxos de trabalho JSON mais complexos, consulte a coluna do ecossistema ComfyUI no site de documentação oficial da APIYI: docs.apiyi.com.

Com isso, você possui uma solução completa e pronta para produção de integração do gpt-image-2 no ComfyUI. Divirta-se criando na sua tela do ComfyUI!


Autor: Equipe Técnica da APIYI
Recursos relacionados:

  • Repositório do plugin: github.com/luckdvr/Comfyui-Luck-gpt2.0
  • Site oficial da APIYI: apiyi.com
  • Documentação da APIYI: docs.apiyi.com
  • Site principal da APIYI: api.apiyi.com (Backup: vip.apiyi.com / b.apiyi.com)

Similar Posts