AI热点 3月前 126 浏览次数 10 评论

GPT-image-1 – OpenAI 推出的最新图像生成模型

发布了 7995 文章

GPT-image-1是什么

GPT-image-1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功能,如图像质量、尺寸、格式、压缩程度等。模型广泛应用在创意设计、电商、教育、营销等领域,例如将草图转化为图形、生成产品展示图、创建品牌视觉资产等。目前已经被包括 Adobe、Figma 在内等主流创意平台采用。

GPT-image-1的主要功能

  • 文本生成图像:根据文本描述生成图像。
  • 图像编辑:对现有图像进行修改或局部编辑。
  • 图像变体:生成图像的不同版本或风格变体。
  • 自定义功能
    • 尺寸:支持多种分辨率,如1024×1024、1024×1536等。
    • 质量:低、中、高三种渲染质量可选。
    • 格式:支持PNG、JPEG、WebP等格式。
    • 压缩:针对JPEG和WebP格式,可设置0-100%的压缩级别。
    • 背景:支持透明背景或不透明背景。
  • API访问: 提供API接口,支持开发者将图像生成功能集成到自己的应用或服务中,支持批量生成图像。

GPT-image-1的模型特点

  • 超强指令遵循:精确理解和执行复杂指令,确保生成图像的准确性。
  • 超多艺术风格:支持多种艺术风格,适用于不同创意需求。
  • 精准图像编辑:提供强大的图像编辑能力,用户基于基于文本提示对图像进行精细调整。
  • 丰富的真实世界知识:生成与真实世界相关的图像内容,增强图像的可信度和实用性。
  • 文本一致性生成:在生成图像时,保持文本内容的一致性和连贯性,适用于教育材料、故事书等场景。

GPT-image-1的产品定价

  • 文本输入token(提示文本):5 美元/100 万枚 token
  • 图像输入token(输入图像):10 美元/100 万枚 token
  • 图像输出token(生成的图像)​​:40 美元/100 万枚 token

GPT-image-1的项目地址

  • 项目官网:https://openai.com/index/image-generation-api/

如何使用GPT-image-1

  • 准备工作:放问OpenAI官方网站注册账户。注册完成后,登录账户获取API密钥(API Key)。
  • 安装OpenAI Python库:在Python环境中安装OpenAI的官方库。打开终端或命令提示符,运行以下命令:
pip install openai
  • 配置API密钥:在代码中配置OpenAI API密钥。建议将密钥存储在环境变量中,避免直接暴露在代码中。
import os
import openai

# 设置API密钥
openai.api_key = os.getenv("OPENAI_API_KEY")
  • 调用图像生成API:
    • 图像生成:基于文本提示生成图像。以下是一个简单的示例代码:
import openai
import base64

# 初始化OpenAI客户端
client = openai.OpenAI()

# 调用图像生成API
result = client.images.generate(
    model="gpt-image-1",  # 指定模型
    prompt="A futuristic cityscape at sunset with flying cars and neon lights",  # 文本提示
    size="1024x1024",  # 图像尺寸
    quality="high",  # 图像质量
    background="transparent"  # 背景设置为透明
)

# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存图像到本地文件
with open("futuristic_cityscape.png", "wb") as f:
    f.write(image_bytes)
    • 图像编辑:对现有图像进行编辑。以下是一个示例代码:
import openai

# 初始化OpenAI客户端
client = openai.OpenAI()

# 调用图像编辑API
result = client.images.edit(
    model="gpt-image-1",  # 指定模型
    image=open("input_image.png", "rb"),  # 上传需要编辑的图像
    mask=open("mask.png", "rb"),  # 上传蒙版图像
    prompt="Replace the sky with a starry night",  # 编辑提示
    size="1024x1024",  # 图像尺寸
    quality="high"  # 图像质量
)

# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存编辑后的图像到本地文件
with open("edited_image.png", "wb") as f:
    f.write(image_bytes)
    • 使用参考图像生成新图像:上传多张参考图像生成新的图像。以下是一个示例代码:
import openai

# 初始化OpenAI客户端
client = openai.OpenAI()

# 调用参考图像生成API
result = client.images.edit(
    model="gpt-image-1",  # 指定模型
    image=[
        open("body-lotion.png", "rb"),
        open("bath-bomb.png", "rb"),
        open("incense-kit.png", "rb"),
        open("soap.png", "rb"),
    ],  # 上传参考图像
    prompt="Generate a photorealistic image of a gift basket on a white background labeled "Relax & Unwind" with a ribbon and handwriting-like font, containing all the items in the reference pictures",  # 生成提示
    size="1024x1024",  # 图像尺寸
    quality="high"  # 图像质量
)

# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存生成的图像到本地文件
with open("gift_basket.png", "wb") as f:
    f.write(image_bytes)

GPT-image-1的应用案例

  • Adobe:集成到Firefly和Express应用中,提供不同图片风格。
  • Figma:基于简单提示生成和编辑图像,帮助设计师快速获取想法。
  • HeyGen:增强头像创建和编辑功能。
  • Wix:帮助用户快速将想法转化为现实。
  • Photoroom:帮助在线卖家基于产品照片创建工作室品质的视觉效果。

GPT-image-1的应用场景

  • 创意设计:快速将草图转化为高质量图形元素,支持高保真视觉编辑。
  • 电商与营销:生成产品展示图、营销海报和社交媒体图像,提升视觉效果。
  • 品牌设计:创建可编辑的徽标、品牌视觉资产和专业排版。
  • 视频创作:增强视频编辑功能,生成高质量头像和动画效果。
  • 教育与内容创作:生成教学插图和创意内容,辅助教育和创作。

7995 文章 1244368 浏览次数 950300 粉丝

评论 (10)

User avatar

哇,OpenAI的图生模型太酷了,创意无限!

User avatar

简直是人类的又一次自大,值得期待!

User avatar

这种东西,我还是喜欢手绘!

User avatar

感觉世界要变奇怪了,好有趣!

User avatar

果然,人类的想象力是无穷的!

User avatar

创意无限?我觉得是无限可能,包括灾难!

User avatar

这种东西,我有点害怕,但又好奇

User avatar

厉害了,机器也想当艺术家!

User avatar

感觉像上帝在给我们挠头!

User avatar

这玩意儿简直是脑洞大开,未来可期啊!

睡觉动画