ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展

2025年03月26日04:50:17 科技 9393

财联社3月26日(编辑 史正丞)chatgpt 上线多年后愈发鸡肋的图像生成功能,终于迎来了历史性的升级。

ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻

openai首席执行官奥尔特曼在周二的直播活动中表示,正式推出基于gpt-4o模型的原生图像生成功能——模型直接从文本提示生成图像,不再调用独立的dall-e文生图模型。

ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻

利用gpt-4o的多模态能力,chatgpt在图像生成时能更加精确地遵循指示、更精确地渲染图像上的文字,同时支持多轮迭代优化图像时保持角色形象一致。

chatgpt于2022年底上线,最初只能进行文字聊天。大约一年后,openai发布第三代图像生成模型dall-e 3,并集成到chatgpt,但两者一直是互相独立的系统。在最初的新鲜感过去后,ai图像生成器“理解提示词能力差”,特别是“无法准确生成图片中的文字”严重阻碍这项功能在教育、职场等领域的应用。

随着今年阿里巴巴、谷歌先后推出能准确生成文字的文生图模型,openai终于补上这个短板。

在周二的演示中,openai展示了新一代chatgpt 的图像功能升级到了何种程度。

首先,chatgpt已经能够大致准确地按照提示词,生成图像中的文本。在演示中,ai成功按照要求生成一整页的讲话文本,同时没有出现错别字。奥尔特曼感慨称,能在图像生成功能中完美呈现文字本不应该是那么令人赞叹的事情,但我们却等了这么久。

ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻

从官方给出的更多示例来看,不管是生成黑板板书,还是印刷体、展示科学常识的绘图,chatgpt在生成图像文字领域终于从完全不能用,达到接近商用的程度。

ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻 ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻 ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻

同时,chatgpt的图像编辑功能,也变得更加有用。

在演示中,两名研究人员与奥尔特曼合影,然后要求chatgpt将合照转化为动画画风。

ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻

结合gpt-4o的知识库和终于能把字写清楚的能力,chatgpt也能通过简单的提示词,生成有关相对论的漫画彩图。

ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻

说到漫画,现在chatgpt也能根据漫画草稿,一键生成上完色的成品。同时也支持上传图片更换漫画里的主要角色。

ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻 ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻 ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻

从商业应用方面来讲,现在模型也能根据用户上传的照片和卡片模板,自定义组合生成新的卡片,并按照要求展示图片和文字。

ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻 ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻

gpt‑4o也可以根据聊天上下文的基础来生成图片和文字,所以生成的一系列图像将具有一致性,这对于设计游戏角色而言相当重要。

ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展 - 天天要闻

openai承认,新的图像生成器也存在一些局限性,例如也会受到模型幻觉影响,同时在密集文字和非拉丁语文字的图像生成方面,也更容易出现问题。

从周二开始,基于gpt‑4o的图像生成功能向所有免费和付费用户推出,未来几周内开发者将能通过api调用这项功能。

(财联社 史正丞)

科技分类资讯推荐

二十年前的586电脑,奔III处理器+Win98系统,闲鱼卖2680元 - 天天要闻

二十年前的586电脑,奔III处理器+Win98系统,闲鱼卖2680元

之前我写了个九十年代的海尔电脑机箱,阅读量挺高的,你们爱看这玩意?那就继续回忆杀,再写另一个“收藏级”的586老电脑,自带纯平显示器。它就是二十五年前的联想天禧6622电脑,居然是大全套收藏级成色,主机箱、显示器、键盘、光驱、软驱一应俱全,
消息称三星显示最早下月启动三星电子首款三折叠手机显示面板量产 - 天天要闻

消息称三星显示最早下月启动三星电子首款三折叠手机显示面板量产

IT之家 5 月 9 日消息,韩媒 daily.hankooki 当地时间今日报道称,三星显示预计最早 6 月、最晚 7 月开始量产三星电子首款三折叠手机(IT之家注:即所谓的 Galaxy G Fold)的显示面板。▲ 三星显示 Flex G 三折叠概念设备报道指出,由于三折叠手机在整体智能手机市场尚属新形态,因此三星显示的面板产量初期预计落在 20~30
Retroid Pocket Mini V2 安卓游戏掌机发布,1399 元 - 天天要闻

Retroid Pocket Mini V2 安卓游戏掌机发布,1399 元

IT之家 5 月 9 日消息,Retroid 今日推出安卓游戏掌机 Pocket Mini V2,迭代机型主要解决初代的显示问题,更换到该公司 Pocket Classic 掌机的同款 3.92 英寸 AMOLED 屏幕,其余配置参数一致,目前仅提供黑色,官网首发售价 1399 元。Retroid Pocket Mini V2 搭载高通骁龙 865 处理器,
谷歌消息开始推出“为所有人删除”功能 - 天天要闻

谷歌消息开始推出“为所有人删除”功能

#双11国货换新装#快速导读Android 版 Google Messages 正在推出一项新功能,允许用户在群组 RCS 对话中删除所有人的聊天信息,提供“为所有人删除”和“为我删除”两个选项。
盘点那些霸屏“五一”叫好又叫座的「主题展」 - 天天要闻

盘点那些霸屏“五一”叫好又叫座的「主题展」

盘点 REVIEW&ANALYSISIP主题展现阶段的IP主题展正从流量收割向长效情感联结的升级。中购联新媒体中心作者丨李洪健在刚刚过去的五一假期,消费市场的蓬勃气象让人欣喜,据交通运输部数据,5月1日至5日,预计全社会跨区域人员流动量累计
一个时代的结束:某运营商官宣终止3G服务 - 天天要闻

一个时代的结束:某运营商官宣终止3G服务

香港近年将流动通信服务升级至5G后,有电信运营商宣布终止3G服务,港媒报道称,这是“一个时代的结束”。据报道,香港四大电信商之一中国移动旗下中国移动香港公司近日宣布,计划于2025年6月30日零时正式停止3G服务的运营。此举旨在优化资源配置