OpenAI 開源 imagegen-demo 深度解讀：4 步接入官轉 gpt-image-2 API

作者注：OpenAI 官方開源了基於 gpt-image-2 的 Photobooth 演示項目，本文深度拆解源碼、流式實現原理，並講解如何通過 apiyi 官轉通道零門檻復現該能力。

OpenAI 官方在 GitHub 上開源了 openai-imagegen-demo 項目，這是配合 gpt-image-2 發佈的 Next.js 演示應用，演示了流式圖像生成、肖像風格化、多風格併發等新模型獨有的能力。項目地址：github.com/openai/openai-imagegen-demo。

這不是又一個 Hello World 示例，源碼裏藏着 OpenAI 官方推薦的 partial_images 漸進式流式輸出模式，以及 /v1/images/edits 端點在多圖編輯場景下的最新用法。

核心價值: 讀完本文，你將徹底理解這份官方 Demo 的架構、關鍵參數、復現步驟，並知道在國內如何通過 apiyi 官轉通道免翻牆、免等待地使用相同的 gpt-image-2 API。

openai-imagegen-demo 核心要點

要點	說明	價值
項目定位	OpenAI 官方開源的 Photobooth 演示，展示 gpt-image-2 肖像風格化	最權威的 gpt-image-2 集成參考
技術棧	Next.js 15 App Router + TypeScript + Tailwind + shadcn/ui	現代 Web 技術棧，生產級可複用
核心端點	`POST /v1/images/edits`，搭配 `stream: true` 與 `partial_images`	官方首個流式圖像生成 Demo
模型	`gpt-image-2`，質量檔 `high`，尺寸 `1024x1536`（2:3 肖像）	強調人像保真、表情還原
授權	MIT License，可自由商用、二次開發	商業項目可直接集成
接入方式	官方需 OpenAI API Key；官轉通道 `apiyi.com` 國內可直連	降低門檻、無需 VPN

imagegen-demo 項目定位詳解

openai-imagegen-demo 本質是一個交互式照相館（Photobooth）：用戶上傳或拍攝一張自拍，選擇最多 4 種預設風格（如針織風、數字藝術、油畫等），應用併發調用 gpt-image-2 的 images/edits 端點，在流式中逐步返回每種風格的成品。

與市面上常見的"文生圖 Demo"不同，這份官方倉庫聚焦在兩個新能力上：圖生圖（image editing） 和 流式漸進輸出（partial_images）。前者解決了"保持人物一致性"這一工程難題，後者讓等待體驗從 30 秒黑屏變成逐幀漸現。

imagegen-demo 項目架構解讀

關鍵源碼剖析

項目核心只有一個 API Route：app/api/photobooth/route.ts，它負責把前端的肖像圖片和風格 prompt 打包後，用流式模式請求 OpenAI 的 /v1/images/edits 端點。關鍵請求體結構如下：

const body = {
  model: "gpt-image-2"，
  prompt: `${style.prompt}\n\n${OPENAI_IMAGE_OUTPUT_REQUIREMENTS}`，
  images: [{ image_url: imageDataUrl }]，
  size: "1024x1536"，
  quality: "high"，
  output_format: "png"，
  stream: true，
  partial_images: 2，
}；

三個細節值得關注：

stream: true + partial_images: 2 是 gpt-image-2 獨有的流式能力，服務端會推送 2 次中間幀再交付最終圖
images 參數 接收單張或多張參考圖的 data URL，支持多圖融合編輯
OPENAI_IMAGE_OUTPUT_REQUIREMENTS 強制要求"肖像 2:3 比例、保持人物姿態與表情"，這是寫好圖像編輯 prompt 的黃金範式

流式事件解析

Route 通過 SSE（Server-Sent Events）監聽官方響應，處理以下三類事件：

image_edit.partial_image：中間幀，向前端推送 style-partial
image_edit.completed：最終成品，向前端推送 style-final
error：拋出異常，前端統一捕獲

前端在 React 側用自定義 hook 維護一個 writeQueue Promise 鏈，確保多風格併發時事件順序不錯亂，這也是該 Demo 最具工程參考價值的部分。

imagegen-demo 快速上手

極簡復現步驟

按照官方 README，完整跑通只需 5 行命令：

git clone https://github.com/openai/openai-imagegen-demo
cd openai-imagegen-demo
cp .env.example .env.local
echo "OPENAI_API_KEY=sk-xxxxx" >> .env.local
npm install && npm run dev

查看通過 apiyi 官轉通道運行的完整 .env.local 配置

# 方案一：使用 OpenAI 官方 API（需境外網絡 + API 配額）
OPENAI_API_KEY="sk-proj-xxxxx"

# 方案二：使用 apiyi 官轉通道（國內直連、免翻牆）
OPENAI_API_KEY="your-apiyi-key"
OPENAI_BASE_URL="https://vip.apiyi.com/v1"

# 可選：組織與項目 ID
OPENAI_ORG_ID=""
OPENAI_PROJECT_ID=""

然後只需把 app/api/photobooth/route.ts 裏硬編碼的 endpointBase 替換爲讀取 process.env.OPENAI_BASE_URL ？？ "https://api.openai.com/v1"，即可無縫切換官方和官轉通道。

const endpointBase = process.env.OPENAI_BASE_URL ？？ "https://api.openai.com/v1"；

const response = await fetch（`${endpointBase}/images/edits`， {
  method: "POST"，
  headers: {
    "Authorization": `Bearer ${apiKey}`，
    "Content-Type": "application/json"，
  }，
  body: JSON.stringify（body），
}）；

接入建議: 國內開發者直接跑 OpenAI 官方 Demo 會遇到三大障礙（網絡、API 配額、支付方式）。推薦通過 API易 apiyi.com 官轉通道獲取兼容 Key，把 OPENAI_BASE_URL 指向 https://vip.apiyi.com/v1 即可在本地一鍵啓動，流式事件和參數完全對齊官方。

imagegen-demo 接入方案對比

接入方案	網絡要求	開通速度	單次價格	SDK 改動量
OpenAI 官方直連	需境外網絡	需綁卡 + 等待審覈	按 token 計費（約 $0.15+/張）	零改動
fal 企業 API	境外訪問	需籤企業協議	按 token 計費	輕度改造
apiyi 官轉通道	國內直連	註冊即用	按 token 透明計費	僅改 base_url
apiyi 官逆通道	國內直連	註冊即用	固定 $0.03 / 張	僅改 model 名

方案解讀

OpenAI 官方直連分析: 官方通道在合規性和 SLA 上保持絕對領先，是 imagegen-demo 的默認目標環境。但國內運行需翻牆、需要國際信用卡、API 額度審覈週期長。相比之下，apiyi 官轉通道在網絡可達性和開通速度上更適合驗證期和國內生產環境。

fal 企業 API 分析: fal 在 2026 年 4 月 21 日同步發佈了 gpt-image-2 的企業端點，在高併發 SLA 上表現出色。但面向企業客戶，獨立開發者接入門檻高。對於想在本地跑通 imagegen-demo 的開發者，apiyi 更輕量。

apiyi 官轉 vs 官逆差異: 官轉意味着 apiyi 透傳你的請求到 OpenAI 官方 API，計費、SLA、功能與官方完全一致，適合商用場景；官逆則是通過逆向 ChatGPT 網頁端實現，價格固定 $0.03/張更便宜，適合原型驗證。兩種通道在 apiyi 平臺並行提供，開發者可按需切換。

對比說明: 上述數據綜合自 OpenAI 官方定價、fal 企業發佈稿以及 docs.apiyi.com 技術文檔，可通過 API易 apiyi.com 實測驗證。

gpt-image-2 關鍵參數詳解（來自 imagegen-demo 源碼）

基於 imagegen-demo 的 lib/constants.ts，以下是官方推薦的 gpt-image-2 默認參數組合：

參數	Demo 默認值	說明	調整建議
model	`gpt-image-2`	當前最新圖像模型	保持不變
size	`1024x1536`	2:3 肖像比例	社媒橫圖改 `1536x1024`
quality	`high`	最高畫質檔	`medium`/`low` 降本
output_format	`png`	支持透明背景	Web 場景可用 `webp` 省流量
stream	`true`	開啓 SSE 流式	實時應用必選
partial_images	`2`	推送 2 次中間幀	最大 3，等待體驗 vs 帶寬權衡

Prompt 工程最佳實踐

Demo 的 OPENAI_IMAGE_OUTPUT_REQUIREMENTS 常量是一段極具參考價值的 prompt 模板：

"portrait orientation （2:3 aspect ratio）， preserve the exact people， poses， facial expressions， and scene composition as faithfully as possible"

這段話揭示了 gpt-image-2 圖像編輯的黃金範式：

顯式指定比例：即使設置了 size 參數，prompt 裏仍要重申比例，提高命中率
強調保真要求：preserve the exact ... 是保持人物一致性的關鍵咒語
列舉保真維度：人物、姿態、表情、場景分別點名，越具體還原度越高

常見問題 FAQ

Q1: openai-imagegen-demo 是什麼項目？

openai-imagegen-demo 是 OpenAI 官方開源在 GitHub 的 Photobooth 演示應用，使用 Next.js 15 + TypeScript + gpt-image-2 實現"上傳肖像 → 選擇風格 → 流式生成多風格圖片"的完整工作流。它是目前最權威的 gpt-image-2 images/edits 端點集成參考，採用 MIT 協議允許商用。

Q2: imagegen-demo 和其他圖像生成 Demo 有什麼區別？

區別主要在兩點：一是使用了 gpt-image-2 全新的 /v1/images/edits 端點做圖生圖（而非傳統 DALL-E 的文生圖），能保持人物一致性；二是啓用了 stream: true + partial_images 流式能力，讓用戶看到圖片逐步渲染的過程，而不是 30 秒黑屏等待。其他社區 Demo 多爲 DALL-E 3 文生圖，不具備這兩大能力。

Q3: imagegen-demo 發佈於什麼時候？

該倉庫隨 OpenAI 在 2026 年 4 月 21 日發佈的 ChatGPT Images 2.0 同步開源。配合 gpt-image-2 模型在 API 和 Codex 中的正式上線，官方希望通過這個 Demo 降低開發者集成門檻，目前 README 仍在持續更新。

Q4: imagegen-demo 最適合哪些應用場景？

主要適合以下四類場景：

社交應用換裝 / 換風格: 用戶上傳自拍生成國風、油畫、賽博朋克版本
電商商品圖風格統一: 批量把產品照轉成品牌統一視覺風格
會議 / 活動 AI 照相館: 線下活動的互動拍照裝置
教學 Demo / 黑客松原型: 快速演示 gpt-image-2 新能力

Q5: 如何通過 API 快速運行 imagegen-demo？

推薦通過 apiyi 官轉通道快速復現：

訪問 API易 apiyi.com 註冊賬號並創建 API Key
Clone 倉庫：git clone https://github.com/openai/openai-imagegen-demo
在 .env.local 寫入 OPENAI_API_KEY 和 OPENAI_BASE_URL=https://vip.apiyi.com/v1
修改 route.ts 讓 endpointBase 讀取 process.env.OPENAI_BASE_URL
npm install && npm run dev 即可在 localhost:3000 看到效果

apiyi 支持 gpt-image-2、Nano Banana Pro、Flux 等多種主流圖像模型的統一接入，方便在本地快速對比和切換。

Q6: imagegen-demo 的 partial_images 參數如何工作？

partial_images 指定服務端在最終圖返回前推送多少次中間幀。Demo 默認值爲 2，意味着單次生成會經歷"首次草圖 → 二次優化 → 最終成品"三個階段。每個中間幀都通過 SSE 事件 image_edit.partial_image 推送，前端可實時渲染，避免 30 秒長等待的黑屏體驗。該參數最大支持 3，但中間幀越多會增加帶寬開銷。

Q7: 國內開發者如何零門檻跑通 imagegen-demo？

國內直接運行官方 Demo 會遇到三大障礙：網絡訪問 OpenAI API、需要國際信用卡綁卡、API 配額審覈週期長。通過 apiyi 官轉通道可一次性解決：

在 apiyi.com 註冊賬號，支持支付寶 / 微信充值
獲取兼容 OpenAI 協議的 API Key
在 .env.local 設置 OPENAI_BASE_URL=https://vip.apiyi.com/v1
route.ts 讀取該環境變量，其他代碼零改動

整個過程約 5 分鐘，無需翻牆，計費與 OpenAI 官方透明對齊。

Q8: imagegen-demo 有哪些已知限制？

客觀說明當前限制：

單圖生成時長: 高質量檔（quality: high）單張約 20-30 秒，批量需併發優化
人物一致性非 100%: 複雜姿態或多人場景仍可能出現輕微變形
成本考量: OpenAI 官方按 token 計費，單張高質量約 $0.15 起，批量場景建議改用 medium 質量或使用 apiyi 官逆通道（$0.03/張）
風格預設有限: Demo 僅內置 ~10 種風格，需要自行擴展 lib/styles.ts
移動端拍照兼容性: iOS Safari 攝像頭權限在首次訪問時可能需手動授權

openai-imagegen-demo 核心要點 Key Takeaways

OpenAI 官方開源: 配合 gpt-image-2 發佈的權威 Demo，MIT 協議可商用
聚焦圖生圖能力: 使用 /v1/images/edits 端點，保持人物一致性的工程範式
流式渲染黑科技: stream: true + partial_images: 2 把等待從黑屏變爲漸進渲染
Next.js 15 全棧: App Router + SSE 架構是圖像生成應用的現代最佳實踐
國內接入捷徑: 通過 API易 apiyi.com 官轉通道，修改一個 base_url 即可直連
Prompt 黃金範式: preserve the exact ... 是保真度關鍵咒語，值得抄進自己項目
官轉 vs 官逆雙通道: 商用選官轉（與 OpenAI 對齊），驗證選官逆（固定 $0.03/張）

總結

openai-imagegen-demo 是理解 gpt-image-2 新能力的最佳入口，核心價值有三：

權威參考: 官方親手寫的集成範式，參數、prompt、流式架構一次看齊
生產級代碼: Next.js 15 + SSE + 多風格併發，可直接複用到自己項目
國內可復現: 通過 apiyi 官轉通道，國內開發者 5 分鐘跑通官方 Demo

如果你想立即嘗試 gpt-image-2 的流式圖像編輯能力，推薦直接通過 API易 apiyi.com 獲取兼容 Key，克隆 openai-imagegen-demo 並把 OPENAI_BASE_URL 指向 https://vip.apiyi.com/v1，即可在本地還原 OpenAI 官方演示效果。

📚 參考資料

OpenAI imagegen-demo 官方倉庫: 完整源碼、README 與安裝文檔
- 鏈接: github.com/openai/openai-imagegen-demo
- 說明: 第一手源碼與安裝指南，瞭解 gpt-image-2 集成範式的權威起點
OpenAI 官方 gpt-image-2 API 文檔: 模型參數、端點、計費說明
- 鏈接: developers.openai.com/api/docs/models/gpt-image-2
- 說明: 查閱所有支持的參數、價格、限流規則
OpenAI ChatGPT Images 2.0 發佈頁: 新模型能力介紹
- 鏈接: openai.com/index/introducing-chatgpt-images-2-0/
- 說明: 瞭解 gpt-image-2 的設計思路、核心能力和使用場景
apiyi gpt-image-2 官轉通道文檔: 國內直連接入指南
- 鏈接: docs.apiyi.com/en/api-capabilities/gpt-image-2-all/overview
- 說明: 獲取兼容 Key、base_url 配置和價格詳情

作者: APIYI 技術團隊
技術交流: 歡迎在評論區分享你的 imagegen-demo 實戰案例，更多文檔可訪問 API易 docs.apiyi.com 文檔中心

OpenAI 開源 imagegen-demo 深度解讀：4 步接入官轉 gpt-image-2 API

openai-imagegen-demo 核心要點

imagegen-demo 項目定位詳解

imagegen-demo 項目架構解讀

關鍵源碼剖析

流式事件解析

imagegen-demo 快速上手

極簡復現步驟

imagegen-demo 接入方案對比

方案解讀

gpt-image-2 關鍵參數詳解（來自 imagegen-demo 源碼）

Prompt 工程最佳實踐

常見問題 FAQ

openai-imagegen-demo 核心要點 Key Takeaways

總結

延伸閱讀 Related Articles

📚 參考資料

掌握 Grok 4.20 Beta 4 Agents 多代理協作系統的 5 大核心能力

gpt-image-2-vip 尺寸完全指南:30 檔分辨率組合 + $0.03 統一定價詳解

GPT Image 2 上線了嗎? 2026-04-17 最新彙總: 灰度測試中 5大能力曝光

掌握 Grok Imagine 3 種生成模式：Quality、Speed 與即將上線的 Pro 模式完整解讀

解決 Nano Banana Pro API 報錯 The model is overloaded 的 5 種方法

掌握 Seedance 2.0 的5種使用方式：從即夢體驗到 API 接入完整教程

openai-imagegen-demo 核心要點

imagegen-demo 項目定位詳解

imagegen-demo 項目架構解讀

關鍵源碼剖析

流式事件解析

imagegen-demo 快速上手

極簡復現步驟

imagegen-demo 接入方案對比

方案解讀

gpt-image-2 關鍵參數詳解（來自 imagegen-demo 源碼）

Prompt 工程最佳實踐

常見問題 FAQ

openai-imagegen-demo 核心要點 Key Takeaways

總結

延伸閱讀 Related Articles

📚 參考資料

Similar Posts