大胆“走回头路”的ChatGPT,是否会取代搜索引擎?

2023年02月11日17:30:14 科技 2271

大胆“走回头路”的ChatGPT,是否会取代搜索引擎? - 天天要闻

自chatgpt发布以来,热度居高不下,集成了chatgpt的产品竞争也日趋白热化——谷歌于7号发布下一代对话ai系统bard,微软也于8日上线了集成chatgpt的新必应搜索引擎。而百度、阿里、网易、科大讯飞等国内互联网企业则争相释出正在研发或即将发布类似产品的消息。

相较以往的自然语言处理模型,chatgpt究竟有多大的突破性?如果很大,为什么国内外头部科技企业都声称自己已研发出类似产品?如果不大,为什么它会爆火?更重要的是,未来它是否真的会取代目前的搜索引擎?

1

相比其他模型,chatgpt的技术突破有多大?

据开发方openai(美国知名人工智能实验室)介绍,chatgpt使用基于gpt-3.5架构的大型语言模型,这使其语言理解能力更强。此外,它可以使用多种语言进行交互,还能够联系上下文和语境给出回复,并根据用户的语料进行训练和调整,使回复更符合用户的需求。

chatgpt和以往的语言模型不同的是,它能够记住并理解用户在此前对话中输入的内容,这对语言模型来说是较大的技术突破。“在机器的语义理解中输入的句子越短,逻辑越简单,机器的正确性就越高。但如果要把我们整个会话都记住,而且理解新问题对整体对话带来的意义改变,这是一个很困难的事情。”中科深智创始人兼ceo成维忠说。

除此之外,chatgpt的基础架构之一是有监督学习的深度学习模型。成维忠向南都·ai前哨站解释道,此前更为主流的大型语言模型算法的训练方式是非监督训练。而在无监督学习出现后,大部分科技公司就采用了这个新方式,不再使用成本更高的有监督学习。

“本来大模型、预训练,路子是无监督训练,不断填数据就行了,算法参数越来越大,效果越来越好。但openai到了instructgpt,忽然要加有监督微调,要加人工反馈,要加强化学习,看上去有点像‘瞎搞’,但非常大胆。”

因此,成为忠形容chatgpt“有点像是走了回头路”——“把过去的一些大模型训练之前的方法拿来用了,比如说对其进行人工干预和强化训练,其实是蛮突破性的。”事实证明,这一技术所需的人工成本更高,但效果更好。

“在某种意义上,这其实是对过去一味追求(参数)大和追求无监督学习的一个路线修正。”京东集团副总裁何晓冬曾对媒体表示,相较之前大量使用无监督深度学习算法,chatgpt模型背后的算法和训练过程更加新颖。如果没有人参与数据甄选,模型参数即便大十几倍,也很难达到如今的效果。

2

为何科技巨头争相下场?谁将取得先机?

然而,chatgpt的“爆火”可能并非全部出自于技术上的创新。

清华大学人工智能国际治理研究院副院长、人工智能治理研究中心主任梁正指出,在chatgpt出现之前,已经有许多语言模型面世,提高了用户的接受度,大语言模型的发展应用逐渐发展到了临界点。而chatgpt的出现意味着这种模型“从能用到好用”,打开了商业的想象力。

“就像人脸识别一样,”他进一步解释,2016年之前,人脸识别的准确率比较低,“当时我们做调研,如果人脸识别的准确率不到90%是不会有人用的,因为纠错的成本太高了。chatgpt去年12月出来,一开始也只有专业圈子的人在用,后面发现质量还可以,才打开了规模化应用的尝试。”

在成维忠看来,chatgpt的成功与其开放和用户的交互不无关系。他提到,此前openai发布的gpt1-3系列只是进行了技术发布,没有提供用户交互的应用,所以用户们比较难有直观的使用感受。

借着技术发展和规模化应用的东风,chatgpt似乎找到了最合适的商业化道路,各大巨头纷纷闻风而动。

2月7日,谷歌宣布将推出下一代对话ai系统bard。谷歌首席执行官桑德尔・皮查伊表示,“很快你就会在搜索中看到 ai 支持的功能,它可以将复杂的信息和多个视角的信息提炼成易于理解的格式。”

紧接着,微软官宣由chatgpt支持的新版必应搜索引擎和edge浏览器。微软首席执行官萨蒂亚·纳德拉在接受媒体采访时表示,“搜索行业整体目前正面临巨变。这样的机会很少会出现。”他称,这一次,谷歌作为当前领先者的优势将变得不再那么重要。

国内的百度、阿里、网易、科大讯飞等也争相释出正在研发或即将发布类似产品的消息。还有消息称,苹果也将举行与ai有关的峰会,主题可能就是chatgpt和openai。

3

chatgpt会取代目前的搜索引擎吗?

实际上,早在chatgpt刚刚出现之时,就有关于其是否会颠覆搜索引擎的讨论。2022年12月,摩根士丹利投行的首席分析师布赖恩·诺瓦克就在一份研报中提到,语言模型可能会占据市场份额,并破坏谷歌作为互联网用户入口的地位。

chatgpt是否真的会取代搜索引擎?多位专家对南都·ai前哨站表示,chatgpt的搜索结果还存在很多问题,短期内无法替代搜索引擎。

“以谷歌为例,目前它的信息资源相对来说还是比较精确的,而它也对必应的挑战做出了相应的回应,推出了自己的聊天机器人brad。”中国社会科学院哲学所科技哲学研究室主任段伟文指出,以chatgpt为代表的对话应用语言模型目前存在着以数据质量问题为代表的种种问题。

“如果语言模型的数据质量很糟糕,或者是数据本身有价值观问题,比如歧视和偏见,那么在用户和人工智能使用问答方式沟通的时候,由于它的回答是整合之后的,而不是像搜索引擎一样会呈现多条搜索结果,它带来的价值观风险就会更大,可能会出现信息拼凑、编造的问题。”

梁正也指出,在学术研究上,chatgpt对于搜索有增速的作用,可以根据需求和关键词反馈匹配的结果。但他实测发现,chatgpt在专业领域上面临的搜索难度依旧较大。“它可能会给出来一些不准确的信息,搜索就必须要花更多的时间筛选其给出来的答案。”

今年年初,北美密歇根大学哲学系教授antony aumann就遇到了这个问题:他班上一名学生使用chatgpt写出了一篇在他看来“全班最好的论文”。最终他决定改变他的课程论文写作方式,要求学生们使用受访问限制的浏览器,并且在教室里完成初稿。在提交初稿后,学生们还必须解释每一次修改的理由。

这位教授遇到的问题并非孤例。由于chatgpt带来了越来越多的学术造假,美国纽约市教育部正式禁用chatgpt,以保护学术诚信。此外,纽约市、巴尔的摩县、弗吉尼亚州的劳登县和阿拉巴马州的蒙哥马利县也开始限制学生访问chatgpt。而全球不少学术期刊出版社明令禁止或者限制其下的作者使用chatgpt,其中包括全球顶尖科学期刊《science》《nature》等等。

此外,chatgpt的回答可能会受到不同地区风俗、文化,乃至于法规的影响。段伟文认为,为了调和不同的价值观,语言模型的开发者将倾向于回避矛盾、冲突和分歧,而这可能导致少数群体在客观上受到忽视。

另一方面,根据用户实验和openai的公开资料,chatgpt的训练数据来自2021年及以往的互联网数据,具有滞后性。“一个算法的训练,不可能是完全开放的、没有标准的。只有把它做成相对比较封闭的训练,把训练数据标准化,训练效率才高。” 成维忠告诉南都·ai前哨站,这也使得短期内chatgpt难以对搜索引擎造成冲击。

采写:南都记者胡耕硕

科技分类资讯推荐

阿维塔全球研发中心启用,与华为联合共创进入新阶段 - 天天要闻

阿维塔全球研发中心启用,与华为联合共创进入新阶段

近日,阿维塔全球研发中心正式启用,可容纳超过1000人。接近阿维塔的知情人士透露,该办公大楼于2024年12月启动装修,其核心功能是承载阿维塔与华为联合共创团队的协同工作。此次全球研发中心的落成启用,预示着阿维塔与华为的联合共创将进入更大规
销量承压、动销欠佳,高玉玲如何让海信经销商“脱困”? - 天天要闻

销量承压、动销欠佳,高玉玲如何让海信经销商“脱困”?

文/曹双涛编辑/杨博丞2025年按照既定目标,海信集团整体营收需达到3000亿元。但2024年除高玉玲接棒代慧忠成为海信家电董事长,网传海信裁员3万人、裁员比例高达20%~30%外。公开数据显示,2024年海信集团营收2143亿元。另据海信家电发布的2024年年报显示,当年海信家电营收和归母净利润分别同比增长8.35%和17.99%,分别至9...
1699元能买到!荣耀Power有这些优缺点,选它续航焦虑真没了! - 天天要闻

1699元能买到!荣耀Power有这些优缺点,选它续航焦虑真没了!

有一天,一款主流手机的电池容量来到了8000mAh,且最关键的是,这样的产品并没有过多的牺牲手感,甚至可以说手感比主流旗舰机还好,这样的一款手机也许会在其他方面稍微有所妥协,但不得不说,它确实从根源上杜绝了我们的续航焦虑问题。没错了!今天咱们来聊聊荣耀POWER,一款定价在千元左右产品,按照笔者的理解,荣耀是将...
倒计时3天!第二届“兴智杯”全国人工智能创新应用大赛即将启动,线上直播预约开启 - 天天要闻

倒计时3天!第二届“兴智杯”全国人工智能创新应用大赛即将启动,线上直播预约开启

前期,工业和信息化部、科学技术部、深圳市人民政府共同主办了首届“兴智杯”全国人工智能创新应用大赛(以下简称“大赛”),以需求为牵引,推动了一批关键技术加快突破,加快人工智能与重点行业融合赋能,成为了目前国内规模最大、参赛主体最丰富的人工智能专业赛事。为进一步发挥“以赛促研、以赛促用、以赛育人”的作用...
国产芯片杀疯了!利润暴涨26倍,这些小芯片藏着大突破 - 天天要闻

国产芯片杀疯了!利润暴涨26倍,这些小芯片藏着大突破

最近翻看国产芯片企业的成绩单,可把我这个外行人看乐了——利润动辄涨个两三倍都是常规操作,最夸张的翻了26倍!您别误会,这可不是在炒股,而是实打实的造芯片挣来的真金白银。要说这波国产替代的浪潮,还真让咱们在芯片领域啃下了几块硬骨头。先说个身边
iStorage 推出 26TB 容量 diskAshur 加密硬盘,1541 美元起 - 天天要闻

iStorage 推出 26TB 容量 diskAshur 加密硬盘,1541 美元起

IT之家 5 月 5 日消息,硬盘制造商 iStorage 宣布推出 26TB 版本 diskAshur DT2/3 系列加密硬盘,相应硬盘主打“提供物理密码按键”,其中 diskAshur DT2 26TB 版本售价为 1541 美元(IT之家注:现汇率约合 11147 元人民币),diskAshur DT3 26TB 版本定价为 1814 美元(现汇率约
无线信号增强秘籍,桥接和中继模式哪个更强? - 天天要闻

无线信号增强秘籍,桥接和中继模式哪个更强?

【ZOL中关村在线原创技术解析】随着无线通信与计算机技术飞速发展,人们愈发渴望随时随地享受稳定的数据通信服务。无线路由器作为无线网络核心设备,作用关键。但当其信号覆盖不足,如穿过两堵墙后信号微弱时,可通过无线桥接或中继模式连接两个无线路由器,扩展网络、增强信号。中继模式和桥接模式虽都能扩展网络覆盖,但...
流畅更耐用 魅族Note 16将预装Flyme 12 - 天天要闻

流畅更耐用 魅族Note 16将预装Flyme 12

魅族官方透露,将于5月发布的魅族Note 16系列将出厂预装Flyme 12新系统,这也是Flyme系统大版本首次在非旗舰机型上首发。魅族Note 16搭载紫光展锐T765处理器,配备6.78英寸LCD屏,分辨率达2460*1080。后置采用八边形相机模组,由5000万像素主摄和200万像素镜头组成。续航方面,内置6600mAh大容量电池,支持40W有线充电