OpenAI最强图像生成API上线

摘要

gpt-image-1图像集成了图像生成、图像编辑和图像变体操作(包括DALL·E 2)三大核心功能。gpt-image
-1提供了多个具有广泛领域的应用潜力,包括模型、电商、设计、教育等。
开发者可以通过API进行图像生成、图像编辑(包括参考展示生成新图和局部编辑)等,代码示例介绍了如何使用API​​​​生成和编辑图像。
-image-1是目前OpenAI最强大的多模态模型,与DALL·E 2和DALL·E 3相比各有优势。按Token支付,文本输入图像Token 5美元/百万,输入Token 10美元/百万,图像输入Token 40美元/百万。

昨晚,OpenAI发布全新图像生成模型gpt-image-1,API向所有开发者开放。

这一次,他们直接把每张图的成本打到了几美分。

 

对于低、中、高质量的方形图像,生成大约花费0.02美元、0.07美元、0.19美元。

gpt-image-1集成了三大核心功能:图像生成、图像编辑、图像变体(包括DALL·E 2)。

与GPT-4o图像生成不同,gpt-image-1最大的特点是,支持各种高级功能的定制。

 

比如,自定义输出图像的质量、尺寸、格式、压缩程度,甚至选择是否需要透明背景,能够满足摄影师创意需求。

它具备了强大的通用能力,不仅能够创作多种图片,还能精准跟随定制风格需求。通过结合世界知识,生成更符合上下文的图像。

 

现在,你就可以在playground中使用gpt-image-1来快速迭代提示词和图像:

 

GPT-4o上线掀起全网吉卜力风潮,并在首周发布全球1.3亿用户,创作了超7亿图片。

gpt-image-1作为OpenAI全新的一个全新的多模态图像模型,随着API的开放,将在未来极大地释放人们的创意。

 
效果一览

 

在官方API文档「探索」区,OpenAI生成了许多gpt-image-1生成图片的演示,效果非常不错。

接下来,就一个主角为快吧。

一句话,让gpt-image-1展示鳄梨酱所需的所有食材。

 

在这个梦幻之境下面,不过用了一个「小作文」提示词才完成的。

 

再看看它的创作者Glorptak,拥有绚丽的体态,半透明的发光,非常可爱。

 

对于模型、电商行业来说,gpt-image-1将成交创作方式。上传一张衣服图、一张人的照片,就可以看到衣服上身的效果了。

 

橄榄油宣传图,也只需找一张背景图,gpt-image-1瞬间完成P图。

 

更神奇的是,上传一张建筑设计图纸,gpt-image-1可以将其对应的3D效果,更加仔细。

 

番茄酱广告,非常有冲击力。

 

设计泉水的瓶身,也是多种矿泉款式的拿捏。

 

生成超写实的3D图标,看着非常有底部。

 

gpt-image-1还能生成粗钢丝样式图解,为回针缝制法每一步配上简洁的说明文字。

 

上传一张CD模板图,让gpt-image-1生成金属乐队黑胶唱片。

 

还有防止各种纹路的图案,也非常有创意。

 

还有动画分镜头脚本——马匹跳跃循环序列,gpt-image-1可实现逐帧解剖动作。

 

上传独立流行音乐人的照片,一张演唱会门票直接设计好了。

 

图片定制输出,精准创意

 

目前,OpenAI GPT Image API提供了丰富的自定义选项,让开发者完全掌控输出效果。

  • 尺寸:支持多种分辨率,比如1024×1024, 1024×1536

  • 质量:可选低、中、高渲染质量

  • 格式:文件输出格式

  • 压缩:针对JPEG和WebP格式,可设置0-100%级别的压缩

  • 背景:透明或不透明

图片生成

 

通过图像生成端点,只需通过一段文本提示,即可生成令人惊叹的图像。

可设置参数n ,一次可生成多张图片(默认情况下,API返回单张图片)。

from openai import OpenAIimport base64client = OpenAI()result = client.images.generate(    model="gpt-image-1",    prompt="Draw a rocket in front of a blackhole in deep space")image_base64 = result.data[0].b64_jsonimage_bytes = base64.b64decode(image_base64)# Save the image to a filewith open("blackhole.png""wb"as f:    f.write(image_bytes)

 

图像编辑

 

而图像编辑功能,可以让创意更进一步。通过图像编辑端点,你可以:

  • 直接编辑现有图片

  • 参考图片生成新图:上传多张参考图片,然后生成新图

  • 局部编辑(inpainting):通过上传图像和蒙版,精准替换指定的区域

参考图像生成新图片

比如,上传四张礼品图片,生成一个包含所有礼品的精美礼品篮的图片。

 

你可以上传一个蒙版来编辑图像,蒙版中的透明区域将被替换,而黑色区域保持不变。

OpenAI 描述建议,您可以使用提示来整个新图像,而不仅仅是被困的区域。

 

蒙版要求:

1.图像和蒙版需要格式一致,尺寸相同,大小不超过25MB。

2. 蒙版需包含Alpha通道,在图像编辑工具中保存蒙版时,务必勾选「保存Alpha通道」。

from openai import OpenAIclient = OpenAI()result = client.images.edit(    model="gpt-image-1",    image=open("sunlit_lounge.png""rb"),    mask=open("mask.png""rb"),    prompt="A sunlit indoor lounge area with a pool containing a flamingo")image_base64 = result.data[0].b64_jsonimage_bytes = base64.b64decode(image_base64)# Save the image to a filewith open("composition.png""wb"as f:    f.write(image_bytes)

 

在自定义中,还需要注意的包括:

方形图片以标准质量生成的速度最快,默认大小为1024×1024。

 

Image API返回base64编码的图像数据,默认格式为 png ,但你也可以请求 jpeg 或 webp。

如果使用jpeg或webp,还可以指定output_compression参数来控制压缩级别(0-100%)。例如,output_compression=50就是把图像压缩50%。

另外,gpt-image-1支持透明背景。要实现缺陷,需将背景参数设置为透明。


模型对比

 

虽然gpt-image-1是目前OpenAI最强大的多模态模型,近期推出的DALL·E 2和DALL·E 3则专为图像生成设计的模型,各有所长。

根据不同的需求和场景,开发者可以灵活使用这些模型API。

 

gpt-image-1使用同样是按Token,文本和图像的Token各有不同的价格:

  • 文本输入Token:5美元/百万token

  • 图片输入代币:10美元/百万代币

  • 图片输出代币:40美元/百万代币

如前所述,在实际应用中,对于低、中和高质量的方形图片,每生成一张图像的费用大约分别为0.02美元、0.07美元和0.19美元。

 

从创意到商业无限可能

 

OpenAI全新Image API的推出,将为各行各业解锁更多创意魔法。

目前,创意工具、电商、教育、企业软件、游戏等行业的领先企业和部分公司,已经将图像生成集成到他们的产品和服务中。

Adobe的创意工具,包括Firefly和Express,将通过gpt-image-1为创作者提供选择和灵活性,方便他们实验不同的美学风格。

 

Figma正在利用gpt-image-1从简单的提示词生成和编辑图像,使设计师能够快速探索创意并直接在Figma中进行视觉迭代。

 

HeyGen 正在使用 gpt-image-1 来增强头像创建,特别是在平台内修改头像编辑。

 

Photoroom正在使用gpt-image-1帮助在线卖家从单一产品照片中瞬间创建工作室级别的视觉效果、生活场景和模特展示图。

 

此外,Canva 已将 gpt-image-1 集成到 Canva AI 和 Magic Studio 工具中,进一步扩展设计生成和编辑能力。

简单的草图,gpt-image-1就可以将其转化为精美的图形元素。同时,它还支持高保真视觉编辑,让2.3亿用户能够用全新的方式将创意变为现实。

专为设计logo而生的GoDaddy,通过集成gpt-image-1,可以轻松创建编辑Logo,从而产生背景并生成专业字体设计。

借助GoDaddy Airo,创意者通过提示即可生成原创产品和品牌内容,并打造体现自身品牌个性的社交媒体和营销素材。

还有HubSpot通过OpenAI图像新模型,成功彻底革新客户制作高质量的社交媒体、邮件营销实现以及页面图片的方式,ik取专业设计经验也能轻松实现。

Instacart正在测试如何利用API生成菜谱和购物清单的图片,以提升用户体验。

视频创作个性化,在集成gpt-image-1后,将支持更强大的内容生成、精细化编辑和高级风格指导,进一步丰富了用户的视频创作体验。

相关新闻

联系我们

联系我们

13276019273

邮件:siyushenqi@gmail.com

工作时间:周一至周五,9:30-18:30,节假日休息

添加微信
添加微信
Telegram
分享本页
返回顶部
私域神器:一站式全网全渠道拓客营销软件
销售热线:173 5412 3667 (←点击添加微信)