GPT-Image-1 API 使用指南：三大端点详解

站长注：全面剖析 OpenAI GPT-Image-1 API 的图像生成、图像编辑和蒙版编辑三大功能，帮助开发者快速掌握 AI 图像生成技术

OpenAI 的 GPT-Image-1 API 为开发者提供了强大的 AI 图像生成能力，通过三种不同的端点模式满足多样化的创意需求。本文将详细解析这三个端点的用法，帮助开发者快速上手并应用到实际项目中。

欢迎免费试用 API易，3 分钟跑通 API 调用 www.apiyi.com
支持 OpenAI 全系列模型（包括图像生成模型），从文本到图像一站式解决方案
注册可送 1.1 美金额度起，约 300万 Tokens 额度体验。立即免费注册
加站长个人微信：8765058，发送你《大模型使用指南》等资料包，并加赠 1 美金额度。

GPT-Image-1 API 背景介绍

GPT-Image-1 是 OpenAI 推出的新一代图像生成模型，它在 DALL-E 的基础上进行了全面升级，为用户提供更高质量、更准确的图像生成能力。与之前的模型相比，GPT-Image-1 能够更好地理解复杂文本提示，生成更符合用户期望的图像内容，并支持多种操作模式。

OpenAI 通过 API 提供了三种主要的图像处理端点，分别是图像生成(Generate Images)、图像编辑(Edit Images)以及基于蒙版的图像编辑(Edit with Mask)。这三个端点共同构成了一个全面的图像创作系统，让开发者能够根据不同需求选择合适的功能。

gpt-image-1-api-guide 图示

GPT-Image-1 API 核心功能

端点一：图像生成功能

图像生成是 GPT-Image-1 API 最基础也是最常用的功能。通过这个端点，开发者可以基于文本描述生成全新的图像。这个过程完全从零开始，不需要任何参考图像，只需提供详细的文本提示词。

使用图像生成端点的基本代码示例：

from openai import OpenAI
import base64
client = OpenAI()

prompt = """
一幅儿童书插画，描绘一位兽医正在用听诊器听小水獭的心跳。
"""

result = client.images.generate(
    model="gpt-image-1",
    prompt=prompt
)

image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存图像到文件
with open("otter.png", "wb") as f:
    f.write(image_bytes)

在这个例子中，我们使用 Python OpenAI 库调用 images.generate 方法，指定模型为 "gpt-image-1"，并提供一段描述性文本作为提示词。API 返回的是 Base64 编码的图像数据，我们将其解码后保存为 PNG 文件。

值得注意的是，通过设置 n 参数，我们可以在一次请求中生成多张图像。例如，将 n=3 添加到请求中，API 会返回三个不同的图像变体，让开发者有更多选择。

端点二：图像编辑功能

图像编辑端点让开发者能够：

编辑已有图像
使用参考图像生成新图像
将多个图像元素组合创建新的图像

这个功能特别适合需要基于已有视觉元素创建新内容的场景。例如，我们可以上传多个产品图片，然后生成这些产品的组合展示图。

使用图像编辑端点的代码示例：

import base64
from openai import OpenAI
client = OpenAI()

prompt = """
在白色背景上生成一个写有"放松与舒缓"的礼品篮逼真图像，
带有丝带和手写风格字体，包含参考图片中的所有物品。
"""

result = client.images.edit(
    model="gpt-image-1",
    image=[
        open("body-lotion.png", "rb"),
        open("bath-bomb.png", "rb"),
        open("incense-kit.png", "rb"),
        open("soap.png", "rb"),
    ],
    prompt=prompt
)

image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存图像到文件
with open("gift-basket.png", "wb") as f:
    f.write(image_bytes)

在这个例子中，我们提供了四张不同产品的图片作为参考（身体乳液、沐浴炸弹、熏香套装和香皂），并要求 API 创建一个包含所有这些物品的礼品篮图像。API 会分析每个参考图像，理解其内容，然后创建一个新的组合图像。

端点三：蒙版编辑功能

蒙版编辑是 GPT-Image-1 API 提供的最精细的图像编辑功能，允许开发者对图像的特定区域进行修改，同时保持其余部分不变。这种技术也被称为"inpainting"（图像修复）。

使用蒙版编辑功能的代码示例：

from openai import OpenAI
client = OpenAI()

result = client.images.edit(
    model="gpt-image-1",
    image=open("sunlit_lounge.png", "rb"),
    mask=open("mask.png", "rb"),
    prompt="一个阳光充足的室内休息区，带有一个池子，池子里有一只火烈鸟"
)

image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存图像到文件
with open("composition.png", "wb") as f:
    f.write(image_bytes)

在这个示例中，我们提供了两个关键输入：

原始图像：阳光充足的室内休息区图片
蒙版图像：指定需要编辑的区域（池子的一部分）

蒙版图像必须具有透明度通道，透明部分表示需要被替换的区域，而不透明部分则保持不变。通过提示词，我们指定在池子的透明区域添加一只火烈鸟。API 将只修改蒙版中的透明区域，保持其他部分完全不变。

值得注意的是，使用蒙版编辑时，原图和蒙版必须具有相同的尺寸和格式，且蒙版必须包含透明通道。这种精确控制使开发者能够实现更复杂的图像编辑效果。

GPT-Image-1 API 应用场景

GPT-Image-1 API 的三个端点功能可以应用于多种创意和商业场景：

内容创作
- 文章配图自动生成
- 电子书插图创作
- 创意写作视觉辅助
电商与产品展示
- 产品组合展示（如礼品篮）
- 产品放置在不同环境中的效果图
- 产品细节修改与优化
设计辅助
- 快速原型设计
- 品牌视觉元素创作
- 网站和应用界面设计
教育与培训
- 教材插图生成
- 可视化学习材料
- 概念解释图
营销与广告
- 社交媒体图像生成
- 广告创意制作
- 季节性营销素材

gpt-image-1-api-guide 图示

GPT-Image-1 API 开发指南

1. 模型选择

模型服务介绍

本站均为官方源头转发，价格略有优势，聚合各种优秀大模型，使用起来很方便。
企业级专业稳定的OpenAI o1/Deepseek R1/Gemini 等全模型官方同源接口的中转分发。不限速，不过期，不惧封号，按量计费，长期可靠服务；让技术助力科研、公益事业！

当前模型推荐（均为稳定供给）

全部模型和价格请看网站后台 https://www.apiyi.com/account/pricing

OpenAI 图像生成系列
- gpt-image-1：本文重点介绍的最新图像生成模型（推荐指数：⭐⭐⭐⭐⭐）
- gpt-4o-image：基于 GPT-4o 的多模态图像生成
- sora-image：未来高级视频能力延伸
OpenAI 文本模型（辅助提示词工程）
- gpt-4o：综合平衡，适合生成高质量提示词
- o3：更强大的理解能力，生成更精确的图像描述

场景推荐

通用图像生成场景
- 首选：gpt-image-1（高质量、符合预期的图像生成）
- 备选：gpt-4o-image（多模态输入情况下）
专业图像编辑场景
- 首选：gpt-image-1 + 蒙版编辑功能
- 辅助：gpt-4o（生成精确的编辑提示词）
批量图像生成场景
- 首选：gpt-image-1（配合参数 n 设置）
- 经济方案：通过 API易批量调用接口

注意：具体价格请参考 API易价格页面

实践示例

完整的 GPT-Image-1 API 调用示例：

import os
import base64
from openai import OpenAI

# 初始化客户端（使用 API易 的接口）
client = OpenAI(
    api_key="YOUR_APIYI_KEY",
    base_url="https://vip.apiyi.com/v1"  # API易的基础URL
)

# 1. 图像生成示例
def generate_image(prompt, output_file="generated.png"):
    response = client.images.generate(
        model="gpt-image-1",
        prompt=prompt,
        n=1,
        size="1024x1024",
        response_format="b64_json"
    )
    
    image_data = response.data[0].b64_json
    with open(output_file, "wb") as f:
        f.write(base64.b64decode(image_data))
    print(f"图像已保存至 {output_file}")

# 2. 图像编辑示例（多参考图像）
def edit_with_references(prompt, image_files, output_file="edited.png"):
    # 打开所有参考图像
    images = [open(img_file, "rb") for img_file in image_files]
    
    response = client.images.edit(
        model="gpt-image-1",
        image=images,
        prompt=prompt,
        response_format="b64_json"
    )
    
    # 关闭所有文件
    for img in images:
        img.close()
    
    image_data = response.data[0].b64_json
    with open(output_file, "wb") as f:
        f.write(base64.b64decode(image_data))
    print(f"编辑后的图像已保存至 {output_file}")

# 3. 蒙版编辑示例
def edit_with_mask(prompt, image_file, mask_file, output_file="masked.png"):
    with open(image_file, "rb") as img, open(mask_file, "rb") as mask:
        response = client.images.edit(
            model="gpt-image-1",
            image=img,
            mask=mask,
            prompt=prompt,
            response_format="b64_json"
        )
    
    image_data = response.data[0].b64_json
    with open(output_file, "wb") as f:
        f.write(base64.b64decode(image_data))
    print(f"蒙版编辑图像已保存至 {output_file}")

# 使用示例
if __name__ == "__main__":
    # 1. 生成新图像
    generate_image("一只可爱的卡通狐狸在森林中读书，周围有蘑菇和小花", "fox.png")
    
    # 2. 编辑多个参考图像
    edit_with_references(
        "一个产品展示桌，整齐地摆放着所有参考图像中的产品，带有品牌名称'自然护肤'",
        ["product1.png", "product2.png", "product3.png"],
        "showcase.png"
    )
    
    # 3. 使用蒙版编辑
    edit_with_mask(
        "一幅风景画，原始图像的指定区域替换为宁静的湖泊和远处的山脉",
        "landscape.png",
        "landscape_mask.png",
        "edited_landscape.png"
    )

GPT-Image-1 API 最佳实践

提示词工程：编写详细、具体的提示词，包括场景、风格、颜色、构图等细节描述
多次迭代：通过设置参数 n 生成多个选项，或者基于返回结果进一步细化提示词
结合多端点：对于复杂创意，考虑结合使用多个端点，例如先生成基础图像，再用蒙版编辑细节
图像尺寸：根据具体需求选择合适的图像尺寸，平衡质量和响应速度
批处理：对于大量图像生成需求，考虑使用异步处理和队列管理
错误处理：实现健壮的错误处理机制，应对 API 请求限制或失败情况

GPT-Image-1 API 常见问题

问题1：GPT-Image-1 与 DALL-E 有什么区别？
GPT-Image-1 是 OpenAI 的新一代图像生成模型，相比 DALL-E，它提供了更高的图像质量，更准确的提示词理解，以及更多样化的编辑功能。GPT-Image-1 特别增强了对细节的控制能力和对复杂场景的理解能力。

问题2：使用蒙版编辑时有哪些注意事项？
使用蒙版编辑时，需要确保：

原图和蒙版具有完全相同的尺寸和格式
蒙版必须包含 alpha 通道（透明度）
只有蒙版的透明部分会被替换
提示词应该与原图内容保持一定的连贯性，以确保编辑后的图像看起来自然

问题3：如何获得最佳的图像生成效果？

提供详细的提示词描述，包括场景、风格、氛围、视角等
使用积极的描述而非消极的限制（说"要什么"比"不要什么"更有效）
考虑使用风格参考，如"水彩画风格"、"摄影写实风格"等
对于复杂场景，将提示词分解为清晰的组成部分
迭代优化提示词，根据生成结果进行调整

问题4：API 调用限制是什么？
GPT-Image-1 API 的具体调用限制取决于您的 OpenAI 账户等级和配额。通过 API易平台，您可以享受稳定的调用配额和更合理的价格。具体限制请参考当前的服务条款和价格页面。

为什么选择 API易 AI大模型聚合平台

稳定可靠的 GPT-Image-1 供给
- 解决 OpenAI 平台访问限制问题
- API易确保稳定的模型供给
- 无需担心额度用尽问题
丰富的图像模型支持
- 聚合多家 AI 图像生成模型
- 一键切换不同模型（如从 GPT-Image-1 切换到 Gemini 的图像生成）
- 灵活的选择空间
高性能服务
- 不限速调用
- 多节点部署，降低延迟
- 7×24 技术支持
使用便捷
- OpenAI 兼容接口
- 简单快速接入
- 完善的文档和示例
成本优势
- 透明定价
- 按量计费
- 免费额度

提示：当您需要大量图像生成或编辑任务时，可以：

通过 API易持续稳定使用 GPT-Image-1 API

享受不限速的调用体验

获得更稳定的服务保障和技术支持

总结

OpenAI 的 GPT-Image-1 API 通过三个强大的端点—图像生成、图像编辑和蒙版编辑，为开发者提供了全面的 AI 图像创作能力。这些功能不仅可以单独使用，还可以组合应用，创造出更加复杂和精细的图像内容。

无论是内容创作、产品展示、设计辅助还是营销素材制作，GPT-Image-1 API 都能提供强大的支持。通过 API易平台，您可以轻松接入这一强大工具，享受稳定、高效的服务体验。

记住，成功的 AI 图像生成关键在于提示词工程和创意思维。随着实践经验的积累，您将能够充分发挥 GPT-Image-1 API 的潜力，创造出更加令人惊叹的图像内容。

欢迎免费试用 API易，3 分钟跑通 API 调用 www.apiyi.com
支持 OpenAI GPT-Image-1 等全系列模型，让图像生成开发更简单
加站长个人微信：8765058，发送你《大模型使用指南》等资料包，并加赠 1 美金额度。

本文作者：API易团队

欢迎关注我们的更新，持续分享 AI 开发经验和最新动态。

GPT-Image-1 API 使用指南：三大端点详解

GPT-Image-1 API 背景介绍

GPT-Image-1 API 核心功能

端点一：图像生成功能

端点二：图像编辑功能

端点三：蒙版编辑功能

GPT-Image-1 API 应用场景

GPT-Image-1 API 开发指南

1. 模型选择

当前模型推荐（均为稳定供给）

场景推荐

实践示例

GPT-Image-1 API 最佳实践

GPT-Image-1 API 常见问题

为什么选择 API易 AI大模型聚合平台

总结

Claude API 调用完全指南：通过 API易实现 OpenAI 兼容模式的无缝接入

解决 OpenAI field messages is required 错误：Responses API 与 Chat Completions 请求格式详解

6款 OpenAI 小模型完全指南：GPT-4.1-mini、GPT-4.1-nano 等轻量模型场景选型

Nano Banana Pro 如何强制输出 PNG 格式：3 种方法解决图片格式问题

Sora 2 画质大幅回升：OpenAI 算力扩容后的视频清晰度实测对比

Gemini-Exp-1206：AI 大模型竞技场排第一，好在哪？

GPT-Image-1 API 背景介绍

GPT-Image-1 API 核心功能

端点一：图像生成功能

端点二：图像编辑功能

端点三：蒙版编辑功能

GPT-Image-1 API 应用场景

GPT-Image-1 API 开发指南

1. 模型选择

当前模型推荐（均为稳定供给）

场景推荐

实践示例

GPT-Image-1 API 最佳实践

GPT-Image-1 API 常见问题

为什么选择 API易 AI大模型聚合平台

总结

类似文章