ChatGPT 4o图像生成功能重大升级,免费开放基础功能使用
2025年03月26日 09:42
来源: 界面新闻
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布推出4o图像生成功能,OpenAI的CEO奥特曼称GPT-4o为“有史以来最好的模型”,并宣布将全面免费开放基础功能,API调用价格下调50%。

  奥特曼当地时间周二直播活动中宣布,正式推出基于 GPT-4o 模型的原生图像生成功能,不再调用独立的 DALL-E 文生图模型。利用GPT-4o的多模态能力,ChatGPT在图像生成时能更加精确地遵循指示、更精确地渲染图像上的文字,同时支持多轮迭代优化图像时保持角色形象一致。

  从官方给出的示例来看,不管是生成黑板板书,还是印刷体、展示科学常识的绘图,ChatGPT在生成图像文字领域终于从完全不能用,达到接近商用的程度。

  不过,OpenAI承认新图像生成器还存在局限性,会受到模型幻觉影响,在密集文字和非拉丁语文字图像生成方面易出问题。

  ChatGPT在2022年底上线,最初只能生成和编辑文本,不能生成图像。大约一年后,OpenAI发布第三代图像生成模型DALL-E 3,并集成到ChatGPT,但两者一直是互相独立的系统,AI图像生成器“理解提示词能力差”。

  此次推出基于 GPT-4o 模型的原生图像生成功能的举措,被视为应对谷歌Gemini等竞品的技术压力。

  今年阿里巴巴、谷歌先后推出能准确生成文字的文生图模型。其中,谷歌其旗舰模型之一的 Gemini 2.0 Flash 推出实验性原生图像输出功能之后,在社交媒体上迅速传播。但Gemini 2.0 Flash 的图像组件几乎没有防护措施,人们可以去除水印并创建描绘受版权保护角色的图像。

  OpenAI 首席运营官布拉德·莱特卡普在一份声明中表示:“在输出方面,我们尊重艺术家的权利,并且我们有相应的政策来防止我们生成直接模仿任何在世艺术家作品的图像。”

  即日起,所有Plus、Pro、Team及免费用户将陆续在ChatGPT和Sora中体验该功能,企业版与教育版即将接入,Sora平台同步启用。开发者即将通过API调用GPT-4o图像生成功能,接口权限将于未来数周内开放。

(文章来源:界面新闻)

文章来源:界面新闻 责任编辑:43
原标题:ChatGPT 4o图像生成功能重大升级,免费开放基础功能使用
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500