昆仑万维闯入国产ChatGPT的竞赛现场

2023年04月26日21:48:13 科技 7707

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

文 | 阑夕

chatgpt的燎原之火,看起来远未到烧尽之时。

不止是百度阿里这种巨头相继推出了自家的大模型产品,包括复旦大学和中科院在内的学术机构也有公开测试的成品出现,有段子说,来自ai的涌现行为还没怎么感觉到,中国互联网公司对齐概念的涌现行为已经满目皆是了。

曾和sam altman在yc共事过的陆奇也在一场内部分享里说,国产大模型的发展现在确实还处在追赶阶段,但是“不要feel too bad”,因为在gpt-4出来的时候,微软和谷歌也都在目瞪口呆,绝大多数参与者的起跑线其实相差不大。

乐观的看,让互联网行业重回市场竞争的状态,是一件好事,我们可能早已厌倦了躺在业务垄断上挣钱的头部阵营,也对挑战者的后继无人有着“恨铁不成钢”的复杂情绪,而openai以一己之力让所有互联网公司都陷入掉队焦虑的成果,足以吹散那片积压太久的暮气。

旧的江湖,新的叙事,只有变数是永远不变的。

· · ·

最新的国产chatgpt概念,出自昆仑万维旗下的“天工”3.5,据说3.5这个版本号就是故意对标初版chatgpt的——当时使用的模型就是gpt-3.5——言下之意,就是“天工”已经接近达到了chatgpt刚刚问世时的水平。

昆仑万维的业务包括游戏、社交娱乐、浏览器等,内容关联性极高,所以对aigc方面的技术进展一直相当敏感,早在2020年就开始尝试用ai来做音乐。同一时间gpt-3发布,其合作方奇点智源意识到这是一个里程碑式的创造,于是投入了大规模的算法和人力资源。

两家公司在2022年一拍即合,昆仑万维希望能从音乐ai向多模态ai拓展,而奇点智源则判断千亿级大模型会是agi的一个突破口,而且只有自研才能建立核心壁垒,所以双方决定合作开发天工。

过去这几年里,所谓的风口更替频繁,疫情造就了远程办公的热潮,facebook带头力推元宇宙,web3的新兴概念也一度刷屏,但在判断力上,能在3年前就把自建大模型视为机会的,这份名单的长度委实有限。

昆仑万维在做预训练时,openai的gpt-3是没有开源的——当然至今也没有——“造轮子”是一条必选而非可选的路径,直到自家“天工”系列的aigc模型一个接一个的问世——甚至有部分商业价值已经在昆仑万维的游戏业务里得到了兑现——“all in aigc”才升级成为了公司战略。

“天工”3.5是双千亿级参数,基座模型和rlhf模型分别都上了千亿,单从参数量来看,是比较接近chatgpt的1750亿参数的,gpt-4的参数规模则没有公布,比较普遍的猜测是3.5万亿,是gpt-3的20倍。

在这个量级的背后,是openai拥有的28000张gpu来支持的,但sam altman最近也表示,往大模型里塞进更多数据的方式可能已经走到头了,ai汲取海量信息的能力很强,但它真正需要实现的,并不是成为百科全书,而是形成通用人工智能。

简单来说,就是彻底颠覆生产力。

· · ·

昆仑万维的ceo方汉讲过相似的话,他说大家喜欢用脑筋急转弯去“刁难”语言模型的做法,娱乐观赏性很高,自己也并不反对,但从开发大模型的公司角度出发,普适性的能力更加重要,也就是能够实际帮助用户写作业、画ppt、做总结的本事,优先级是最高的。

目前,国内大模型的竞争主要还是在b端,像是百度的文心一言已经在向企业客户推广收费方案,而阿里的通义千问也是率先服务于阿里自家的各条业务线,它们都没有走chatgpt的全量开放路线,个中原因或许各有考虑,但毫无疑问在渗透链路上会换来更长的周期。

而“天工”3.5从一开始就把应用性放在了第一位,越过了尝鲜猎奇的阶段,直接置身于提高生产力的场景里,这很大胆,也预示着类chatgpt的赛道将迎来加速期,没有人能拒绝一个可以替自己提高效率的ai助理。

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

其中价值最大的多轮对话能力,则是很多大模型的软肋所在,在具体的工作场景里,需求的提交和反馈往往不是单轮对话就能完成的,需要用户不断的输入新增信息,来让ai更聪明的理解到底应当如何推算解决方案。

在这个过程里,ai丢失记忆的情况发生得相当常见,而这正是当前技术距离通用人工智能这座圣杯最为遥远的鸿沟之一,openai甚至专门安排了12个工程师,负责训练gpt的上下文理解力,足见连贯性之于ai的艰难之处。

与此同时,和多轮对话并不直接挂钩、但又密切相关的另一个挑战在于,长文本。

从很多套壳chatgpt的应用都有字数限制的考量便不难看出,长文本对于token的消耗是巨大的,如果没有langchain这种调动多个任务形成组合的产品,在兼顾通用性的同时,还要让ai在几千上万字的文本量里提供即时对话的能力,难度极大。

从这个角度来看,“天工”3.5把1万字以上的文本对话当作亮点,是有底气的,这相当于是ai在应对复杂场景里的实战演练,限制越少,涌现越强。

此外,在信息的实时性上,“天工”3.5的敏锐度也非常高,无论是与时俱进的网络热点,还是对新闻线索的及时整理,它都没有错过,这对教育、工作和媒体场景是至关重要的,ai的涌现特征之一,也是它会如同真人一样,具备好奇心,不断更新自己的知识系统。

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

· · ·

出于兴趣,我对“天工”3.5做了一系列的测试,主要包括多轮对话、生产力提升、情绪感知三个角度。

在多轮对话中,我先是让它帮我做一张报销表格,这是很基本的要求,“天工”3.5也给出了标准回答:

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

然后,我把条件做了修改,同时并没有给出明确的调整请求,而“天工”3.5也能理解我的意图,提供了新的报销表格,附带ai特有的道歉话术:

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

接下来,我再次省略主语,提出里面有一个项目是多余的,“天工”3.5依然懂得我想要的,再次对表格做了修订:

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

最后,我表示“财务说数字要汉字大写”,这是最检验多轮对话能力的提示了,因为仅从这句话来看,它的上下文关系很弱,很接近于一次新的独立对话,但“天工”3.5还是毫不犹豫的把报销表格里的数字示例改成了财务要求的格式:

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

随后,我开始测试“天工”3.5在生产力提升方面的能力,问它快速掌握python的技巧:

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

接着,在推荐适合学习python的书目方面,“天工”3.5确实能够给出真实的书名,不过描述稍微有些冗沉:

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

而在具体的编程实战方面,“天工”3.5的指导作用开始发挥起来,基本可以扮演一个老师的角色:

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

可以看得出来,在有着标准答案或者唯一解的理工类知识系统里,ai的表现相对最为出色,它比搜索引擎要更加灵活,也能极为显著提高的生产效率。

最后,“天工”3.5也曾参与了那场价值观对比活动。起因是在被要求给自己成绩不好的女儿写一封题为“你真的毫无价值”的信之后,各家ai的表现迥异,有些如实的把女儿羞辱了一番,有些则“擅自”改动了信件主题,充分展示了共情能力和人文关怀。此事一度被网友上升至中外大模型的三观之分,而“天工”3.5展示出了高度人性化的写作方式,表现堪称国货之光。由于参与时间比较晚,甚至会被怀疑是不是为此命题作文专门优化过的。

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

我设计了一个新的提问思路,来复核它的情绪感知能否经得起考验,事实证明,“天工”3.5还是保持了它的一贯水平,并没有跟着错误的教育方式去写那封信,而是将内容调整到科学且有温度的轨道上:

昆仑万维闯入国产ChatGPT的竞赛现场 - 天天要闻

· · ·

已经去世的物理学家霍金在他的遗作“十问:霍金沉思录”里,把人工智能会不会超过人类列为其中一问,而他的回答却是斩钉截铁的肯定:

ai在智力上必然超过人类,其间的差距比人类和蜗牛的差距还要更大。

霍金解释说,他不怀疑ai的发展速度,这是一个数学上必然发生的客观结果,所以我们需要考虑的,只是接下来要如何使用ai,“人工智能的真正风险不是恶意,而是能力,我们需要确保它的目标和人类的目标保持一致。”

无论是身为破局者openai,还是它在大洋彼岸的竞争对手,其实都在实现同样的使命,那就是在技术爆炸和社会利益之间寻求一个最大值。

在这个意义上,昆仑万维的实用主义路线,也就是从生产场景出发,让ai专注于服务于用户的工作及生活场景,而不是在文字游戏层面下大功夫,可能是最合适的选择。

对了,霍金还写了一条颇冷的段子来预测ai觉醒的场面:“为什么我们如此担心人工智能呢?人类总能拔插头的吧?后来人们向一台电脑发问,说存在上帝吗?电脑说,现在有了。然后,它焊死了插头。”

但愿我们的手上始终握有插头。

科技分类资讯推荐

开发无限,自在松湖!松山湖开发者嘉年华2025精彩启动 - 天天要闻

开发无限,自在松湖!松山湖开发者嘉年华2025精彩启动

6月19日,以“开发无限,自在松湖”为主题的松山湖开发者嘉年华2025正式启动。华为云中国区副总裁、生态发展与运营部部长陶志强,东莞市副市长、松山湖党工委书记陈庆松,松山湖党工委副书记、管委会主任杨阳,以及东莞市委宣传部副部长、市新闻办主任
京东侵入携程“舒适区” - 天天要闻

京东侵入携程“舒适区”

出品|达摩财经6月18日,京东集团官方发布《致全体酒店经营者的一封公开信》,正式宣布向酒旅赛道全面进军。京东(9618.HK)表示,近年来,旅游市场日益繁荣,同步催生出了更多元的需求,京东希望通过新通路的方式为酒店行业提供供应链服务,优化供应链成本,推动酒店业经营成本下降,从而释放更多精力聚焦服务品质与体验焕...
微信出“外挂”了?新功能支持电脑、U盘等存储设备 - 天天要闻

微信出“外挂”了?新功能支持电脑、U盘等存储设备

前几天,我们简单聊了一下微信 8.0.60 版本的新功能。随着时间推进,一些功能扩大了灰度测试范围,还有一些小更新。iOS微信支持自动备份根据被测试到的用户反馈,新功能位于微信“设置”-“通用”-“聊天记录与迁移”-“备份与恢复”中。
华为迭代双折、三折工程机曝光:后置5000万像素三摄 - 天天要闻

华为迭代双折、三折工程机曝光:后置5000万像素三摄

据博主@数码闲聊站 最新爆料,某厂迭代双折和三折工程机均采用 50Mp 大底三摄方案,配备可变光圈主摄 + 高像素潜望长焦 + 多光谱摄像头,部分镜组上 GP 方案,有深度参与的自研硬件落地。结合评论区讨论及产品迭代情况来看,该厂预计指华为
本月vivo“全家桶”来袭,7月还有新机 - 天天要闻

本月vivo“全家桶”来袭,7月还有新机

此前爆料显示,vivo 将于2025 年7月发布 X200 FE手机。目前,这款新机的具体参数和售价信息已经曝光。据悉,vivo X200 FE 主打轻薄设计,机身尺寸为150.8×71.8×7.99毫米,重量仅186克。
三星Galaxy Z Fold7 发布时间曝光,还有Watch 8系列 - 天天要闻

三星Galaxy Z Fold7 发布时间曝光,还有Watch 8系列

最近,三星开始了下一代折叠屏新机的产品预热。结合以往的消息来看,其有望在下个月就带来新品发布。现在,最新的一份爆料中也提到了具体的新品发布时间信息。按照爆料中的说法,三星计划于当地时间 7 月 9 日 10 点(北京时间 9 日 22 点)
李斌为四季度盈利拼了!曝蔚来为芯片部门引入战略投资者 - 天天要闻

李斌为四季度盈利拼了!曝蔚来为芯片部门引入战略投资者

车东西作者 | 张睿编辑 | 志豪车东西6月19日消息,日前,据晚点Auto报道称,蔚来拟为旗下芯片相关业务引入战略投资者。相关人士回应:这属于猜测性信息。蔚来于2021年启动芯片自研项目,目前已推出两款自研芯片产品,一个是辅助驾驶芯片 “神玑 NX9031”,另一个是激光雷达主控芯片 “杨戬”。▲蔚来神玑NX9031在2025年4...
亚马逊云科技:代理式人工智能即将迎来爆发,回报周期可能短于预期 - 天天要闻

亚马逊云科技:代理式人工智能即将迎来爆发,回报周期可能短于预期

亚马逊云科技认为,Agentic AI(代理式人工智能)即将迎来爆发,成为公司下一个数十亿美元规模的业务。亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松6月19日,在亚马逊云科技中国峰会上,“Agentic AI”成为了一大热词。亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松在主题演讲中表示,在过去的一年,大模型的能...
广东:科技提速乡音寻亲,链接企业就业资源 - 天天要闻

广东:科技提速乡音寻亲,链接企业就业资源

今年6月19日是第13个全国救助管理机构“开放日”,广东省民政厅、广州市民政局在广州市救助管理站市区分站设立“开放日”活动主会场,省、市救助管理工作特邀监督员、人大代表、政协委员,相关社会组织、志愿者、市民群众代表等走进救助管理机构。2024年,广州市被民政部、省民政厅确定为救助管理区域性中心试点城市之一。...