昆仑万维闯入国产ChatGPT的竞赛现场

2023年04月26日21:48:13 科技 7707

文 | 阑夕

chatgpt的燎原之火，看起来远未到烧尽之时。

不止是百度阿里这种巨头相继推出了自家的大模型产品，包括复旦大学和中科院在内的学术机构也有公开测试的成品出现，有段子说，来自ai的涌现行为还没怎么感觉到，中国互联网公司对齐概念的涌现行为已经满目皆是了。

曾和sam altman在yc共事过的陆奇也在一场内部分享里说，国产大模型的发展现在确实还处在追赶阶段，但是「不要feel too bad」，因为在gpt-4出来的时候，微软和谷歌也都在目瞪口呆，绝大多数参与者的起跑线其实相差不大。

乐观的看，让互联网行业重回市场竞争的状态，是一件好事，我们可能早已厌倦了躺在业务垄断上挣钱的头部阵营，也对挑战者的后继无人有着「恨铁不成钢」的复杂情绪，而openai以一己之力让所有互联网公司都陷入掉队焦虑的成果，足以吹散那片积压太久的暮气。

旧的江湖，新的叙事，只有变数是永远不变的。

· · ·

最新的国产chatgpt概念，出自昆仑万维旗下的「天工」3.5，据说3.5这个版本号就是故意对标初版chatgpt的——当时使用的模型就是gpt-3.5——言下之意，就是「天工」已经接近达到了chatgpt刚刚问世时的水平。

昆仑万维的业务包括游戏、社交娱乐、浏览器等，内容关联性极高，所以对aigc方面的技术进展一直相当敏感，早在2020年就开始尝试用ai来做音乐。同一时间gpt-3发布，其合作方奇点智源意识到这是一个里程碑式的创造，于是投入了大规模的算法和人力资源。

两家公司在2022年一拍即合，昆仑万维希望能从音乐ai向多模态ai拓展，而奇点智源则判断千亿级大模型会是agi的一个突破口，而且只有自研才能建立核心壁垒，所以双方决定合作开发天工。

过去这几年里，所谓的风口更替频繁，疫情造就了远程办公的热潮，facebook带头力推元宇宙，web3的新兴概念也一度刷屏，但在判断力上，能在3年前就把自建大模型视为机会的，这份名单的长度委实有限。

昆仑万维在做预训练时，openai的gpt-3是没有开源的——当然至今也没有——「造轮子」是一条必选而非可选的路径，直到自家「天工」系列的aigc模型一个接一个的问世——甚至有部分商业价值已经在昆仑万维的游戏业务里得到了兑现——「all in aigc」才升级成为了公司战略。

「天工」3.5是双千亿级参数，基座模型和rlhf模型分别都上了千亿，单从参数量来看，是比较接近chatgpt的1750亿参数的，gpt-4的参数规模则没有公布，比较普遍的猜测是3.5万亿，是gpt-3的20倍。

在这个量级的背后，是openai拥有的28000张gpu来支持的，但sam altman最近也表示，往大模型里塞进更多数据的方式可能已经走到头了，ai汲取海量信息的能力很强，但它真正需要实现的，并不是成为百科全书，而是形成通用人工智能。

简单来说，就是彻底颠覆生产力。

· · ·

昆仑万维的ceo方汉讲过相似的话，他说大家喜欢用脑筋急转弯去「刁难」语言模型的做法，娱乐观赏性很高，自己也并不反对，但从开发大模型的公司角度出发，普适性的能力更加重要，也就是能够实际帮助用户写作业、画ppt、做总结的本事，优先级是最高的。

目前，国内大模型的竞争主要还是在b端，像是百度的文心一言已经在向企业客户推广收费方案，而阿里的通义千问也是率先服务于阿里自家的各条业务线，它们都没有走chatgpt的全量开放路线，个中原因或许各有考虑，但毫无疑问在渗透链路上会换来更长的周期。

而「天工」3.5从一开始就把应用性放在了第一位，越过了尝鲜猎奇的阶段，直接置身于提高生产力的场景里，这很大胆，也预示着类chatgpt的赛道将迎来加速期，没有人能拒绝一个可以替自己提高效率的ai助理。

其中价值最大的多轮对话能力，则是很多大模型的软肋所在，在具体的工作场景里，需求的提交和反馈往往不是单轮对话就能完成的，需要用户不断的输入新增信息，来让ai更聪明的理解到底应当如何推算解决方案。

在这个过程里，ai丢失记忆的情况发生得相当常见，而这正是当前技术距离通用人工智能这座圣杯最为遥远的鸿沟之一，openai甚至专门安排了12个工程师，负责训练gpt的上下文理解力，足见连贯性之于ai的艰难之处。

与此同时，和多轮对话并不直接挂钩、但又密切相关的另一个挑战在于，长文本。

从很多套壳chatgpt的应用都有字数限制的考量便不难看出，长文本对于token的消耗是巨大的，如果没有langchain这种调动多个任务形成组合的产品，在兼顾通用性的同时，还要让ai在几千上万字的文本量里提供即时对话的能力，难度极大。

从这个角度来看，「天工」3.5把1万字以上的文本对话当作亮点，是有底气的，这相当于是ai在应对复杂场景里的实战演练，限制越少，涌现越强。

此外，在信息的实时性上，「天工」3.5的敏锐度也非常高，无论是与时俱进的网络热点，还是对新闻线索的及时整理，它都没有错过，这对教育、工作和媒体场景是至关重要的，ai的涌现特征之一，也是它会如同真人一样，具备好奇心，不断更新自己的知识系统。

· · ·

出于兴趣，我对「天工」3.5做了一系列的测试，主要包括多轮对话、生产力提升、情绪感知三个角度。

在多轮对话中，我先是让它帮我做一张报销表格，这是很基本的要求，「天工」3.5也给出了标准回答：

然后，我把条件做了修改，同时并没有给出明确的调整请求，而「天工」3.5也能理解我的意图，提供了新的报销表格，附带ai特有的道歉话术：

接下来，我再次省略主语，提出里面有一个项目是多余的，「天工」3.5依然懂得我想要的，再次对表格做了修订：

最后，我表示「财务说数字要汉字大写」，这是最检验多轮对话能力的提示了，因为仅从这句话来看，它的上下文关系很弱，很接近于一次新的独立对话，但「天工」3.5还是毫不犹豫的把报销表格里的数字示例改成了财务要求的格式：

随后，我开始测试「天工」3.5在生产力提升方面的能力，问它快速掌握python的技巧：

接着，在推荐适合学习python的书目方面，「天工」3.5确实能够给出真实的书名，不过描述稍微有些冗沉：

而在具体的编程实战方面，「天工」3.5的指导作用开始发挥起来，基本可以扮演一个老师的角色：

可以看得出来，在有着标准答案或者唯一解的理工类知识系统里，ai的表现相对最为出色，它比搜索引擎要更加灵活，也能极为显著提高的生产效率。

最后，「天工」3.5也曾参与了那场价值观对比活动。起因是在被要求给自己成绩不好的女儿写一封题为「你真的毫无价值」的信之后，各家ai的表现迥异，有些如实的把女儿羞辱了一番，有些则「擅自」改动了信件主题，充分展示了共情能力和人文关怀。此事一度被网友上升至中外大模型的三观之分，而「天工」3.5展示出了高度人性化的写作方式，表现堪称国货之光。由于参与时间比较晚，甚至会被怀疑是不是为此命题作文专门优化过的。

我设计了一个新的提问思路，来复核它的情绪感知能否经得起考验，事实证明，「天工」3.5还是保持了它的一贯水平，并没有跟着错误的教育方式去写那封信，而是将内容调整到科学且有温度的轨道上：

· · ·

已经去世的物理学家霍金在他的遗作「十问：霍金沉思录」里，把人工智能会不会超过人类列为其中一问，而他的回答却是斩钉截铁的肯定：

ai在智力上必然超过人类，其间的差距比人类和蜗牛的差距还要更大。

霍金解释说，他不怀疑ai的发展速度，这是一个数学上必然发生的客观结果，所以我们需要考虑的，只是接下来要如何使用ai，「人工智能的真正风险不是恶意，而是能力，我们需要确保它的目标和人类的目标保持一致。」

无论是身为破局者openai，还是它在大洋彼岸的竞争对手，其实都在实现同样的使命，那就是在技术爆炸和社会利益之间寻求一个最大值。

在这个意义上，昆仑万维的实用主义路线，也就是从生产场景出发，让ai专注于服务于用户的工作及生活场景，而不是在文字游戏层面下大功夫，可能是最合适的选择。

对了，霍金还写了一条颇冷的段子来预测ai觉醒的场面：「为什么我们如此担心人工智能呢？人类总能拔插头的吧？后来人们向一台电脑发问，说存在上帝吗？电脑说，现在有了。然后，它焊死了插头。」

但愿我们的手上始终握有插头。

科技

小红书“种草”首次登上国际营销界顶级舞台 - 天天要闻

小红书“种草”首次登上国际营销界顶级舞台

6月18日，在法国戛纳国际创意节的聚光灯下，受邀参会的小红书CMO之恒发表主旨演讲，首次在国际顶级舞台上系统阐释了小红书独特的社区生态，以及从社区中原生而出的营销新范式“种草”，并对种草的价值、底层逻辑、成功因素等进行了分享。之恒表示，有用户将小红书视为“电子闺蜜”和“情感树洞”，在小红书上寻找与自己爱好...

06月19日 9977

eSIM“叫停”两年后重启，卡槽时代即将迈向芯片时代？ - 天天要闻

eSIM“叫停”两年后重启，卡槽时代即将迈向芯片时代？

潮新闻客户端记者俞叶波近日，一则消息在通信领域引发广泛关注：据eSIM产业链知情人士透露，已暂停长达两年的 eSIM业务，三大运营商将于今年下半年全面重启办理。回溯到20....

06月19日 5412

大摩北美IT硬件数据追踪：App Store 仍跑赢市场预期，甲骨文引爆云计算资本支出 - 天天要闻

大摩北美IT硬件数据追踪：App Store 仍跑赢市场预期，甲骨文引爆云计算资本支出

智通财经APP获悉，大摩的追踪数据显示，App Store 年初至今净收入同比增长 12.5%，超出该行对第二季度的预测 150 个基点，并相当于服务业务超预期 40 个基点。大摩将2025年全球云资本支出预测上调至4060亿美元（同比增长43%），较1个月前预测提升4个百分点（新增140亿美元）。增长由甲骨文(ORCL.US)和阿里巴巴的上调驱动。...

06月19日 8434

宝洁失速背后，消费品正在被碎片化重构 - 天天要闻

宝洁失速背后，消费品正在被碎片化重构

本文来自微信公众号：刀姐doris，作者：刀法智库，原文标题：《宝洁失速的背后：加剧分化的时代，大品牌服务不了所有人》，头图来自：AI生成宝洁宣布裁员7000人，外表看起来是大集团走下坡路，本质上是大品牌服务不了所有人。前段时间，宝洁公司宣布，计划未来两年在全球裁员 7000 人，甚至要退出某些品类和产品，或出售旗...

06月19日 2815

TDK 收购智能眼镜软硬件开发商 SoftEye，扩大 AI 生态系统业务 - 天天要闻

TDK 收购智能眼镜软硬件开发商 SoftEye，扩大 AI 生态系统业务

IT之家 6 月 19 日消息，日本 TDK（东电化）今日宣布收购美国智能眼镜软硬件系统解决方案开发商 SoftEye，进一步扩大其 AI 生态系统业务。SoftEye 从事智能眼镜定制芯片、摄像机、软件和算法的开发工作，具备低功耗眼动追踪和物体识别方面的技术，交易完成后将成为 TDK 的全资子公司。TDK 通过此次收购将能够以更快的速度交...

06月19日 9218

消息称广汽埃安即将发布 B 端专用品牌，明日对外公布信息 - 天天要闻

消息称广汽埃安即将发布 B 端专用品牌，明日对外公布信息

IT之家 6 月 19 日消息，蓝鲸汽车今日报道称，从广汽方面获悉，广汽旗下自主品牌埃安即将发布 B 端专用品牌。有内部知情人士对该媒体称，明天（6 月 20 日）会有对外信息发布。报道还提到，继去年发布全新“AION”字母标并推出 3 款 C 端全球战略车型后，广汽埃安 C 端销量占比有所提升，下半年即将启动 B / C 端品牌全面分...

06月19日 4715

游戏主播以收徒为饵诱13岁男孩打赏7万元，平台回应：可退70% - 天天要闻

游戏主播以收徒为饵诱13岁男孩打赏7万元，平台回应：可退70%

近日，谢先生向澎湃公众互动平台“服务湃”（https://tousu.thepaper.

06月19日 1574

北欧豪华再次进化，新款沃尔沃S90上市，限时售30.09万元起 - 天天要闻

北欧豪华再次进化，新款沃尔沃S90上市，限时售30.09万元起

日前，新款沃尔沃S90正式上市，新车外观内饰双升级，可以视为本代大改款车型，现官方指导价为40.69万—50.59万，限时售价30.09万元至36.49万元。

06月19日 7431

阿里云将在韩国启用第二座数据中心，加速海外布局 - 天天要闻

阿里云将在韩国启用第二座数据中心，加速海外布局

新京报贝壳财经讯（记者罗亦丹）6月19日，阿里云宣布将于本月底在韩国启用第二座数据中心，来满足生成式AI快速发展带来的需求增长。这是今年以来，阿里云继墨西哥、泰国之后在全球落地的又一新节点。届时阿里云全球布局将扩展至29个地域、88个可用区

06月19日 1641

中国智能眼镜市场增速超100%，市场格局将“风起云涌” - 天天要闻

中国智能眼镜市场增速超100%，市场格局将“风起云涌”

根据国际数据公司（IDC）近日发布的《全球智能眼镜市场季度跟踪报告》，2025年第一季度全球智能眼镜（Smart Eyewear）市场出货量148.7万台，同比增长82.3%。其中全球音频和音频拍摄眼镜市场出货量83.1万台，同比增长219.5%；AR/VR市场出货65.6万台，同比增长18.1%。智能眼镜市场在全球范围仍然以Meta为主要发力厂商，除美国.

06月19日 2214