作者注:OpenAI 官方開源了基於 gpt-image-2 的 Photobooth 演示項目,本文深度拆解源碼、流式實現原理,並講解如何通過 apiyi 官轉通道零門檻復現該能力。
OpenAI 官方在 GitHub 上開源了 openai-imagegen-demo 項目,這是配合 gpt-image-2 發佈的 Next.js 演示應用,演示了流式圖像生成、肖像風格化、多風格併發等新模型獨有的能力。項目地址:github.com/openai/openai-imagegen-demo。
這不是又一個 Hello World 示例,源碼裏藏着 OpenAI 官方推薦的 partial_images 漸進式流式輸出模式,以及 /v1/images/edits 端點在多圖編輯場景下的最新用法。
核心價值: 讀完本文,你將徹底理解這份官方 Demo 的架構、關鍵參數、復現步驟,並知道在國內如何通過 apiyi 官轉通道免翻牆、免等待地使用相同的 gpt-image-2 API。

openai-imagegen-demo 核心要點
| 要點 | 說明 | 價值 |
|---|---|---|
| 項目定位 | OpenAI 官方開源的 Photobooth 演示,展示 gpt-image-2 肖像風格化 | 最權威的 gpt-image-2 集成參考 |
| 技術棧 | Next.js 15 App Router + TypeScript + Tailwind + shadcn/ui | 現代 Web 技術棧,生產級可複用 |
| 核心端點 | POST /v1/images/edits,搭配 stream: true 與 partial_images |
官方首個流式圖像生成 Demo |
| 模型 | gpt-image-2,質量檔 high,尺寸 1024x1536(2:3 肖像) |
強調人像保真、表情還原 |
| 授權 | MIT License,可自由商用、二次開發 | 商業項目可直接集成 |
| 接入方式 | 官方需 OpenAI API Key;官轉通道 apiyi.com 國內可直連 |
降低門檻、無需 VPN |
imagegen-demo 項目定位詳解
openai-imagegen-demo 本質是一個交互式照相館(Photobooth):用戶上傳或拍攝一張自拍,選擇最多 4 種預設風格(如針織風、數字藝術、油畫等),應用併發調用 gpt-image-2 的 images/edits 端點,在流式中逐步返回每種風格的成品。
與市面上常見的"文生圖 Demo"不同,這份官方倉庫聚焦在兩個新能力上:圖生圖(image editing) 和 流式漸進輸出(partial_images)。前者解決了"保持人物一致性"這一工程難題,後者讓等待體驗從 30 秒黑屏變成逐幀漸現。

imagegen-demo 項目架構解讀
關鍵源碼剖析
項目核心只有一個 API Route:app/api/photobooth/route.ts,它負責把前端的肖像圖片和風格 prompt 打包後,用流式模式請求 OpenAI 的 /v1/images/edits 端點。關鍵請求體結構如下:
const body = {
model: "gpt-image-2",
prompt: `${style.prompt}\n\n${OPENAI_IMAGE_OUTPUT_REQUIREMENTS}`,
images: [{ image_url: imageDataUrl }],
size: "1024x1536",
quality: "high",
output_format: "png",
stream: true,
partial_images: 2,
};
三個細節值得關注:
stream: true+partial_images: 2是 gpt-image-2 獨有的流式能力,服務端會推送 2 次中間幀再交付最終圖images參數 接收單張或多張參考圖的 data URL,支持多圖融合編輯OPENAI_IMAGE_OUTPUT_REQUIREMENTS強制要求"肖像 2:3 比例、保持人物姿態與表情",這是寫好圖像編輯 prompt 的黃金範式
流式事件解析
Route 通過 SSE(Server-Sent Events)監聽官方響應,處理以下三類事件:
image_edit.partial_image:中間幀,向前端推送style-partialimage_edit.completed:最終成品,向前端推送style-finalerror:拋出異常,前端統一捕獲
前端在 React 側用自定義 hook 維護一個 writeQueue Promise 鏈,確保多風格併發時事件順序不錯亂,這也是該 Demo 最具工程參考價值的部分。
imagegen-demo 快速上手
極簡復現步驟
按照官方 README,完整跑通只需 5 行命令:
git clone https://github.com/openai/openai-imagegen-demo
cd openai-imagegen-demo
cp .env.example .env.local
echo "OPENAI_API_KEY=sk-xxxxx" >> .env.local
npm install && npm run dev
查看通過 apiyi 官轉通道運行的完整 .env.local 配置
# 方案一:使用 OpenAI 官方 API(需境外網絡 + API 配額)
OPENAI_API_KEY="sk-proj-xxxxx"
# 方案二:使用 apiyi 官轉通道(國內直連、免翻牆)
OPENAI_API_KEY="your-apiyi-key"
OPENAI_BASE_URL="https://vip.apiyi.com/v1"
# 可選:組織與項目 ID
OPENAI_ORG_ID=""
OPENAI_PROJECT_ID=""
然後只需把 app/api/photobooth/route.ts 裏硬編碼的 endpointBase 替換爲讀取 process.env.OPENAI_BASE_URL ?? "https://api.openai.com/v1",即可無縫切換官方和官轉通道。
const endpointBase = process.env.OPENAI_BASE_URL ?? "https://api.openai.com/v1";
const response = await fetch(`${endpointBase}/images/edits`, {
method: "POST",
headers: {
"Authorization": `Bearer ${apiKey}`,
"Content-Type": "application/json",
},
body: JSON.stringify(body),
});
接入建議: 國內開發者直接跑 OpenAI 官方 Demo 會遇到三大障礙(網絡、API 配額、支付方式)。推薦通過 API易 apiyi.com 官轉通道獲取兼容 Key,把
OPENAI_BASE_URL指向https://vip.apiyi.com/v1即可在本地一鍵啓動,流式事件和參數完全對齊官方。
imagegen-demo 接入方案對比

| 接入方案 | 網絡要求 | 開通速度 | 單次價格 | SDK 改動量 |
|---|---|---|---|---|
| OpenAI 官方直連 | 需境外網絡 | 需綁卡 + 等待審覈 | 按 token 計費(約 $0.15+/張) | 零改動 |
| fal 企業 API | 境外訪問 | 需籤企業協議 | 按 token 計費 | 輕度改造 |
| apiyi 官轉通道 | 國內直連 | 註冊即用 | 按 token 透明計費 | 僅改 base_url |
| apiyi 官逆通道 | 國內直連 | 註冊即用 | 固定 $0.03 / 張 | 僅改 model 名 |
方案解讀
OpenAI 官方直連分析: 官方通道在合規性和 SLA 上保持絕對領先,是 imagegen-demo 的默認目標環境。但國內運行需翻牆、需要國際信用卡、API 額度審覈週期長。相比之下,apiyi 官轉通道在網絡可達性和開通速度上更適合驗證期和國內生產環境。
fal 企業 API 分析: fal 在 2026 年 4 月 21 日同步發佈了 gpt-image-2 的企業端點,在高併發 SLA 上表現出色。但面向企業客戶,獨立開發者接入門檻高。對於想在本地跑通 imagegen-demo 的開發者,apiyi 更輕量。
apiyi 官轉 vs 官逆差異: 官轉意味着 apiyi 透傳你的請求到 OpenAI 官方 API,計費、SLA、功能與官方完全一致,適合商用場景;官逆則是通過逆向 ChatGPT 網頁端實現,價格固定 $0.03/張更便宜,適合原型驗證。兩種通道在 apiyi 平臺並行提供,開發者可按需切換。
對比說明: 上述數據綜合自 OpenAI 官方定價、fal 企業發佈稿以及
docs.apiyi.com技術文檔,可通過 API易 apiyi.com 實測驗證。
gpt-image-2 關鍵參數詳解(來自 imagegen-demo 源碼)
基於 imagegen-demo 的 lib/constants.ts,以下是官方推薦的 gpt-image-2 默認參數組合:
| 參數 | Demo 默認值 | 說明 | 調整建議 |
|---|---|---|---|
| model | gpt-image-2 |
當前最新圖像模型 | 保持不變 |
| size | 1024x1536 |
2:3 肖像比例 | 社媒橫圖改 1536x1024 |
| quality | high |
最高畫質檔 | medium/low 降本 |
| output_format | png |
支持透明背景 | Web 場景可用 webp 省流量 |
| stream | true |
開啓 SSE 流式 | 實時應用必選 |
| partial_images | 2 |
推送 2 次中間幀 | 最大 3,等待體驗 vs 帶寬權衡 |
Prompt 工程最佳實踐
Demo 的 OPENAI_IMAGE_OUTPUT_REQUIREMENTS 常量是一段極具參考價值的 prompt 模板:
"portrait orientation (2:3 aspect ratio), preserve the exact people, poses, facial expressions, and scene composition as faithfully as possible"
這段話揭示了 gpt-image-2 圖像編輯的黃金範式:
- 顯式指定比例:即使設置了
size參數,prompt 裏仍要重申比例,提高命中率 - 強調保真要求:
preserve the exact ...是保持人物一致性的關鍵咒語 - 列舉保真維度:人物、姿態、表情、場景分別點名,越具體還原度越高

常見問題 FAQ
Q1: openai-imagegen-demo 是什麼項目?
openai-imagegen-demo 是 OpenAI 官方開源在 GitHub 的 Photobooth 演示應用,使用 Next.js 15 + TypeScript + gpt-image-2 實現"上傳肖像 → 選擇風格 → 流式生成多風格圖片"的完整工作流。它是目前最權威的 gpt-image-2 images/edits 端點集成參考,採用 MIT 協議允許商用。
Q2: imagegen-demo 和其他圖像生成 Demo 有什麼區別?
區別主要在兩點:一是使用了 gpt-image-2 全新的 /v1/images/edits 端點做圖生圖(而非傳統 DALL-E 的文生圖),能保持人物一致性;二是啓用了 stream: true + partial_images 流式能力,讓用戶看到圖片逐步渲染的過程,而不是 30 秒黑屏等待。其他社區 Demo 多爲 DALL-E 3 文生圖,不具備這兩大能力。
Q3: imagegen-demo 發佈於什麼時候?
該倉庫隨 OpenAI 在 2026 年 4 月 21 日發佈的 ChatGPT Images 2.0 同步開源。配合 gpt-image-2 模型在 API 和 Codex 中的正式上線,官方希望通過這個 Demo 降低開發者集成門檻,目前 README 仍在持續更新。
Q4: imagegen-demo 最適合哪些應用場景?
主要適合以下四類場景:
- 社交應用換裝 / 換風格: 用戶上傳自拍生成國風、油畫、賽博朋克版本
- 電商商品圖風格統一: 批量把產品照轉成品牌統一視覺風格
- 會議 / 活動 AI 照相館: 線下活動的互動拍照裝置
- 教學 Demo / 黑客松原型: 快速演示 gpt-image-2 新能力
Q5: 如何通過 API 快速運行 imagegen-demo?
推薦通過 apiyi 官轉通道快速復現:
- 訪問 API易 apiyi.com 註冊賬號並創建 API Key
- Clone 倉庫:
git clone https://github.com/openai/openai-imagegen-demo - 在
.env.local寫入OPENAI_API_KEY和OPENAI_BASE_URL=https://vip.apiyi.com/v1 - 修改 route.ts 讓
endpointBase讀取process.env.OPENAI_BASE_URL npm install && npm run dev即可在localhost:3000看到效果
apiyi 支持 gpt-image-2、Nano Banana Pro、Flux 等多種主流圖像模型的統一接入,方便在本地快速對比和切換。
Q6: imagegen-demo 的 partial_images 參數如何工作?
partial_images 指定服務端在最終圖返回前推送多少次中間幀。Demo 默認值爲 2,意味着單次生成會經歷"首次草圖 → 二次優化 → 最終成品"三個階段。每個中間幀都通過 SSE 事件 image_edit.partial_image 推送,前端可實時渲染,避免 30 秒長等待的黑屏體驗。該參數最大支持 3,但中間幀越多會增加帶寬開銷。
Q7: 國內開發者如何零門檻跑通 imagegen-demo?
國內直接運行官方 Demo 會遇到三大障礙:網絡訪問 OpenAI API、需要國際信用卡綁卡、API 配額審覈週期長。通過 apiyi 官轉通道可一次性解決:
- 在
apiyi.com註冊賬號,支持支付寶 / 微信充值 - 獲取兼容 OpenAI 協議的 API Key
- 在
.env.local設置OPENAI_BASE_URL=https://vip.apiyi.com/v1 route.ts讀取該環境變量,其他代碼零改動
整個過程約 5 分鐘,無需翻牆,計費與 OpenAI 官方透明對齊。
Q8: imagegen-demo 有哪些已知限制?
客觀說明當前限制:
- 單圖生成時長: 高質量檔(
quality: high)單張約 20-30 秒,批量需併發優化 - 人物一致性非 100%: 複雜姿態或多人場景仍可能出現輕微變形
- 成本考量: OpenAI 官方按 token 計費,單張高質量約 $0.15 起,批量場景建議改用
medium質量或使用 apiyi 官逆通道($0.03/張) - 風格預設有限: Demo 僅內置 ~10 種風格,需要自行擴展
lib/styles.ts - 移動端拍照兼容性: iOS Safari 攝像頭權限在首次訪問時可能需手動授權
openai-imagegen-demo 核心要點 Key Takeaways
- OpenAI 官方開源: 配合 gpt-image-2 發佈的權威 Demo,MIT 協議可商用
- 聚焦圖生圖能力: 使用
/v1/images/edits端點,保持人物一致性的工程範式 - 流式渲染黑科技:
stream: true+partial_images: 2把等待從黑屏變爲漸進渲染 - Next.js 15 全棧: App Router + SSE 架構是圖像生成應用的現代最佳實踐
- 國內接入捷徑: 通過 API易 apiyi.com 官轉通道,修改一個 base_url 即可直連
- Prompt 黃金範式:
preserve the exact ...是保真度關鍵咒語,值得抄進自己項目 - 官轉 vs 官逆雙通道: 商用選官轉(與 OpenAI 對齊),驗證選官逆(固定 $0.03/張)
總結
openai-imagegen-demo 是理解 gpt-image-2 新能力的最佳入口,核心價值有三:
- 權威參考: 官方親手寫的集成範式,參數、prompt、流式架構一次看齊
- 生產級代碼: Next.js 15 + SSE + 多風格併發,可直接複用到自己項目
- 國內可復現: 通過 apiyi 官轉通道,國內開發者 5 分鐘跑通官方 Demo
如果你想立即嘗試 gpt-image-2 的流式圖像編輯能力,推薦直接通過 API易 apiyi.com 獲取兼容 Key,克隆 openai-imagegen-demo 並把 OPENAI_BASE_URL 指向 https://vip.apiyi.com/v1,即可在本地還原 OpenAI 官方演示效果。
延伸閱讀 Related Articles
如果你對 gpt-image-2 和 openai-imagegen-demo 感興趣,推薦繼續閱讀:
- 📘 gpt-image-2 Reverse API 哪裏有?3 分鐘接入 apiyi 官逆通道 – 瞭解官逆通道 $0.03/張的低成本方案
- 📊 gpt-image-2 vs Nano Banana Pro 圖像模型橫評 – 對比主流圖像模型的能力差異
- 🚀 gpt-image-2 應用場景 6 大行業落地指南 – 探索電商、教育、社媒等真實使用案例
📚 參考資料
-
OpenAI imagegen-demo 官方倉庫: 完整源碼、README 與安裝文檔
- 鏈接:
github.com/openai/openai-imagegen-demo - 說明: 第一手源碼與安裝指南,瞭解 gpt-image-2 集成範式的權威起點
- 鏈接:
-
OpenAI 官方 gpt-image-2 API 文檔: 模型參數、端點、計費說明
- 鏈接:
developers.openai.com/api/docs/models/gpt-image-2 - 說明: 查閱所有支持的參數、價格、限流規則
- 鏈接:
-
OpenAI ChatGPT Images 2.0 發佈頁: 新模型能力介紹
- 鏈接:
openai.com/index/introducing-chatgpt-images-2-0/ - 說明: 瞭解 gpt-image-2 的設計思路、核心能力和使用場景
- 鏈接:
-
apiyi gpt-image-2 官轉通道文檔: 國內直連接入指南
- 鏈接:
docs.apiyi.com/en/api-capabilities/gpt-image-2-all/overview - 說明: 獲取兼容 Key、base_url 配置和價格詳情
- 鏈接:
作者: APIYI 技術團隊
技術交流: 歡迎在評論區分享你的 imagegen-demo 實戰案例,更多文檔可訪問 API易 docs.apiyi.com 文檔中心
