GPT-image-1 – OpenAI 推出的最新图像生成模型

GPT-image-1是什么

GPT-image-1是OpenAI推出的原生多模态图像生成模型，基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像，支持多种风格和自定义功能，如图像质量、尺寸、格式、压缩程度等。模型广泛应用在创意设计、电商、教育、营销等领域，例如将草图转化为图形、生成产品展示图、创建品牌视觉资产等。目前已经被包括 Adobe、Figma 在内等主流创意平台采用。

GPT-image-1的主要功能

文本生成图像：根据文本描述生成图像。
图像编辑：对现有图像进行修改或局部编辑。
图像变体：生成图像的不同版本或风格变体。
自定义功能：
- 尺寸：支持多种分辨率，如1024×1024、1024×1536等。
- 质量：低、中、高三种渲染质量可选。
- 格式：支持PNG、JPEG、WebP等格式。
- 压缩：针对JPEG和WebP格式，可设置0-100%的压缩级别。
- 背景：支持透明背景或不透明背景。
API访问：提供API接口，支持开发者将图像生成功能集成到自己的应用或服务中，支持批量生成图像。

GPT-image-1的模型特点

超强指令遵循：精确理解和执行复杂指令，确保生成图像的准确性。
超多艺术风格：支持多种艺术风格，适用于不同创意需求。
精准图像编辑：提供强大的图像编辑能力，用户基于基于文本提示对图像进行精细调整。
丰富的真实世界知识：生成与真实世界相关的图像内容，增强图像的可信度和实用性。
文本一致性生成：在生成图像时，保持文本内容的一致性和连贯性，适用于教育材料、故事书等场景。

GPT-image-1的产品定价

文本输入token（提示文本）：5 美元/100 万枚 token
图像输入token（输入图像）：10 美元/100 万枚 token
图像输出token（生成的图像）：40 美元/100 万枚 token

GPT-image-1的项目地址

项目官网：https://openai.com/index/image-generation-api/

如何使用GPT-image-1

准备工作：放问OpenAI官方网站注册账户。注册完成后，登录账户获取API密钥（API Key）。
安装OpenAI Python库：在Python环境中安装OpenAI的官方库。打开终端或命令提示符，运行以下命令：

pip install openai

配置API密钥：在代码中配置OpenAI API密钥。建议将密钥存储在环境变量中，避免直接暴露在代码中。

import os
import openai

# 设置API密钥
openai.api_key = os.getenv("OPENAI_API_KEY")

调用图像生成API：
- 图像生成：基于文本提示生成图像。以下是一个简单的示例代码：

import openai
import base64

# 初始化OpenAI客户端
client = openai.OpenAI()

# 调用图像生成API
result = client.images.generate(
    model="gpt-image-1",  # 指定模型
    prompt="A futuristic cityscape at sunset with flying cars and neon lights",  # 文本提示
    size="1024x1024",  # 图像尺寸
    quality="high",  # 图像质量
    background="transparent"  # 背景设置为透明
)

# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存图像到本地文件
with open("futuristic_cityscape.png", "wb") as f:
    f.write(image_bytes)

- 图像编辑：对现有图像进行编辑。以下是一个示例代码：

import openai

# 初始化OpenAI客户端
client = openai.OpenAI()

# 调用图像编辑API
result = client.images.edit(
    model="gpt-image-1",  # 指定模型
    image=open("input_image.png", "rb"),  # 上传需要编辑的图像
    mask=open("mask.png", "rb"),  # 上传蒙版图像
    prompt="Replace the sky with a starry night",  # 编辑提示
    size="1024x1024",  # 图像尺寸
    quality="high"  # 图像质量
)

# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存编辑后的图像到本地文件
with open("edited_image.png", "wb") as f:
    f.write(image_bytes)

- 使用参考图像生成新图像：上传多张参考图像生成新的图像。以下是一个示例代码：

import openai

# 初始化OpenAI客户端
client = openai.OpenAI()

# 调用参考图像生成API
result = client.images.edit(
    model="gpt-image-1",  # 指定模型
    image=[
        open("body-lotion.png", "rb"),
        open("bath-bomb.png", "rb"),
        open("incense-kit.png", "rb"),
        open("soap.png", "rb"),
    ],  # 上传参考图像
    prompt="Generate a photorealistic image of a gift basket on a white background labeled "Relax & Unwind" with a ribbon and handwriting-like font, containing all the items in the reference pictures",  # 生成提示
    size="1024x1024",  # 图像尺寸
    quality="high"  # 图像质量
)

# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存生成的图像到本地文件
with open("gift_basket.png", "wb") as f:
    f.write(image_bytes)

GPT-image-1的应用案例

Adobe：集成到Firefly和Express应用中，提供不同图片风格。
Figma：基于简单提示生成和编辑图像，帮助设计师快速获取想法。
HeyGen：增强头像创建和编辑功能。
Wix：帮助用户快速将想法转化为现实。
Photoroom：帮助在线卖家基于产品照片创建工作室品质的视觉效果。

GPT-image-1的应用场景

创意设计：快速将草图转化为高质量图形元素，支持高保真视觉编辑。
电商与营销：生成产品展示图、营销海报和社交媒体图像，提升视觉效果。
品牌设计：创建可编辑的徽标、品牌视觉资产和专业排版。
视频创作：增强视频编辑功能，生成高质量头像和动画效果。
教育与内容创作：生成教学插图和创意内容，辅助教育和创作。

登录账号

GPT-image-1 – OpenAI 推出的最新图像生成模型

Photoroom APP

HeyGen

GPT-image-1是什么

GPT-image-1的主要功能

GPT-image-1的模型特点

GPT-image-1的产品定价

GPT-image-1的项目地址

如何使用GPT-image-1

GPT-image-1的应用案例

GPT-image-1的应用场景

Comment (10)

ZeroMoon_V

PixelDreamer

NovaByte77

PixelDreamer

ZeroMoon_V

EchoX99

ZeroMoon_V

SilentEcho_Z

SilentEcho_Z

SilentEcho_Z

Chapter

Recommended Articles

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

速抢（2核2G）77元/年香港免备案服务器

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

Popular Tags

Popular Authors

AI中国

钛媒体APP

IT之家

人人都是产品经理

AIbase基地

登录账号

GPT-image-1 – OpenAI 推出的最新图像生成模型

Photoroom APP

HeyGen

GPT-image-1是什么

GPT-image-1的主要功能

GPT-image-1的模型特点

GPT-image-1的产品定价

GPT-image-1的项目地址

如何使用GPT-image-1

GPT-image-1的应用案例

GPT-image-1的应用场景

Comment (10)

Chapter

Recommended Articles

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

速抢（2核2G）77元/年香港免备案服务器

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

Popular Tags

Popular Authors

为您推荐