发布两大“超级有用”AI技术，AI长期主义者李彦宏的非共识解法

2024年11月30日08:31:37 科技 8136

2022年底，能够与人类自如、深度对话的聊天机器人chatgpt一经发布，便在全球掀起火热的生成式ai浪潮。而早在2013年，百度就成立了深度学习实验室，是国内最早入局ai领域的企业，赶在了其他同行之前。

11月12日，在百度世界2024大会上发表演讲时，百度创始人李彦宏却抛出了一个现实的问题：“客观地讲，大家期待的超级应用还没有出现，甚至有人开始问，过去这24个月，这种全球性的大模型狂热，究竟是一场新的技术革命，还是新一轮泡沫？”

作为中国人工智能的扛旗者，百度给出的回答是：ai是真实的需求。李彦宏提到，今年5月，百度的高管们曾在一起讨论ai大模型怎样才算“成了”。他给出的关键指标是，大模型api调用量能够在一年时间内从2亿上涨10倍至20亿。而仅仅半年之后，百度文心大模型的日均调用量已经超过15亿，增长了7.5倍。相较于一年前首次披露的5000万次，更是大幅增长约30倍。

在李彦宏看来，这条陡峭的增长曲线也是过去两年中国大模型应用爆发的缩影。“今天，基础模型能力就绪，我们即将迎来ai应用的群星闪耀时刻。每一个应用都是一颗星，每一个应用都将成为改变世界的力量。”他表示。

李彦宏的“非主流”ai观：优先解决幻觉、重点发展智能体

和ai行业的其他玩家相比，李彦宏和百度在很多时候都显得有些“非主流”。当许多公司陷入“百模大战”的厮杀中，把关注焦点放在大模型的性能和参数上时，李彦宏在多个公开场合反复强调“要卷应用不要卷大模型”、“没有应用ai模型一文不值”。面对开闭源之争，李彦宏又旗帜鲜明地站到闭源模型阵营中，称闭源才有真正的商业模式。

今年2月，openai亮出文生视频模型sora再次引爆全球互联网，很多中国企业也纷纷开始跟进这一赛道。但李彦宏在一场内部讲话中表态称，无论多么火爆，百度都不会去做sora类的视频生成模型，因为投入周期太长，10年、20年都可能拿不到业务收益。

在百度世界2024大会上，李彦宏对此进一步作出阐释。他表示比起sora，百度更希望解决图像生成的幻觉问题，即大模型的生成内容与事实不符或毫无根据。李彦宏称，“这个问题看起来更简单、甚至更枯燥，但是不解决就不会有应用。”他认为，过去24个月内，对行业而言最大的变化就是大模型基本消除了幻觉，回答问题的准确性大大提升，让ai从“一本正经的胡说八道”，变得可用、可被信赖。

而解决大模型幻觉问题的关键在于rag（检索增强）技术，让大模型利用检索到的信息来指导文本或答案的生成。在当日与硅星人创始人骆轶航、甲子光年创始人张一甲的“ai圆桌对谈”上，李彦宏提到，过去两年rag让大语言模型具备了实用价值，可以有效控制幻觉生成，所以才在各个场景尤其是to b方面应用起来。他强调，百度不做sora不等于百度不做多模态，“多模态要想进入真正实用阶段，也得有准确性、可控性，应用空间才能打开。”

因此百度瞄准了图像等多模态内容与rag的结合，在活动上发布了检索增强的文生图技术irag（image based rag）。irag能够结合百度搜索的亿级图片资源跟强大的基础模型能力，生成各种超真实的图片。

李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心irag技术，无论是这款特定型号汽车的车型车标、还是作为背景的长城，均未出现错误或变形的幻觉问题。借助这项技术，以前需要花费几十万才能完成的海报拍摄，现在的创作成本近乎于0。其商业价值就体现在无幻觉、超真实、没成本，立等可取。

随着全球科技巨头将目光转向寻找ai落地应用场景，智能体这一能够自主感知环境、执行行动并完成设定目标的系统也受到了更多关注。但李彦宏强调，像百度这样把智能体作为最重要战略方向的并不多。百度认为，作为ai应用的最主流形态，智能体即将迎来爆发点。目前，百度旗下文心智能体平台已吸引15万家企业和80万名开发者，覆盖了广泛的应用场景。

百度将智能体主要分为四类：公司类智能体，角色类智能体，工具类智能体和行业类智能体。具体而言，公司类智能体能够在传统公司网站的基础上提供主动推荐等服务，未来将可能成为直接面向消费者的第一界面。角色类智能体是高度拟人化的数字人，行业类智能体则专注于法律等垂直领域。百度文库与百度网盘还联合发布了工具类智能体“自由画布”，全面打通公域与私域资料的限制，实现输入、编辑、创作、分享自由。

自由画布生成多模态调研报告

行业智能体—法行宝

代码生成是大模型的一大核心能力，李彦宏也曾多次表示生成式ai将会让每个人都具备程序员的能力。在百度世界2024大会上，李彦宏宣布正式推出无代码工具“秒哒”。与辅助代码生成工具不同，借助“秒哒”这个由大模型和智能体组成的全新软件，用户甚至不再需要看懂代码，就能构建出各种应用，“将迎来一个前所未有的、只靠想法就能赚钱的时代”。

秒哒

在演讲的最后，李彦宏称自己是软件工程师出身，国外有一种说法叫“软件吞噬世界”。但在他看来，世界不应该被吞噬，而应该被创造。“ai时代，应用创造世界。”这位科技领袖如是说道。

一位ai长期主义者的布局与远见

创立百度二十余年，跟在李彦宏身上的标签有很多，其中就包括“ai的长期主义者”。这不仅寓意着李彦宏在人工智能方面的早期布局，也代表他对未来持续投入的坚实决心。

李彦宏曾在2023年登上《时代》周刊首届全球百大ai人物榜单，一同被评为全球ai领袖的还包括特斯拉ceo埃隆·马斯克、英伟达创始人兼ceo黄仁勋、openai ceo萨姆·奥特曼等人物。《时代》肯定了李彦宏对ai的长期投入及百度在ai方面取得的多项成就，评价其为“中国最杰出的未来主义者，长期投身于ai发展的浪潮”。

ai教父、图灵奖得主杨立昆也曾在自己的《科学之路》中文版自序中提到，百度是最早部署商业化深度学习系统的大型公司之一，领先于谷歌和微软。早在2012年，李彦宏在看到深度学习技术对搜索的改进后，就鼓励全百度产品经理了解ai技术的最新趋势。一年后，百度成立了深度学习实验室，由李彦宏担任院长，正式开启对ai的探索。

事实上，百度与当今多位ai领军者之间都有着千丝万缕的关系。斩获2024年诺贝尔物理学奖的“神经网络之父”geoffrey hinton就曾拒绝百度4400万美元的最高竞价，最终选择带领团队加入谷歌。当时，geoffrey hinton团队凭借新的神经网络算法alexnet，一举夺得2012年imagenet挑战赛冠军，一时声名鹊起。其团队成员就包括后来的openai联合创始人ilya sutskever。

除此之外，谷歌ai项目google brain的联合创始人和负责人吴恩达曾于2014年加入百度，担任首席科学家一职。在百度工作的三年时间内，吴恩达带领百度人工智能团队增长至1300人，其中百度研究院成员300人，帮助百度培养出大量ai人才。如今openai的最大竞争对手、ai初创企业anthropic的联合创始人兼ceo dario amodei，从斯坦福大学博士后毕业后的第一份工作，就是在百度的硅谷ai实验室担任研究员。

走过十年ai探索之路，百度在人工智能领域的成就和影响力已然深得认可。咨询公司沙利文近日发布的《2024年全球ai生态全景概览》报告显示，自生成式ai浪潮爆发后，以英伟达为代表的芯片厂商和微软等云厂商开始吃到红利，开源模型、创企、软件应用厂商也在加速抢占市场份额。而在全球ai生态全景中，表现亮眼的当属ai原生巨头，除了openai、谷歌外，百度也被列进了同一象限中。

2021年，李彦宏在《致股东信》中提到，在过去的十年里，百度致力于打基础、建生态，开始大举投入对ai的研发，期待用技术让复杂的世界更简单。因此，在人工智能大潮奔涌而来的当下，百度得以成为领先的ai生态型公司，拥有强大的互联网用户基础。“百度有定力，有耐心。因为我们深知，最前沿的技术浪潮是等不来的，你必须提前10年、20年去布局。”

对ai的坚定信仰也深刻影响着百度对未来的展望。见证并亲历过90年代末到2000年初的互联网泡沫，李彦宏对于大模型热潮有着清晰的认识。在10月对谈哈佛商业评论总编辑时，他提出生成式ai就像历史上许多次技术浪潮一样，在度过最初的兴奋阶段之后，也会不可避免地经历泡沫的过程，那些无法满足市场需求的伪创新将会被清洗掉。

但对于大模型的长期前景，这位互联网先驱仍然持有乐观态度，认为这是一次颠覆式的技术革命。“面对新的技术周期，坚持长期主义的创业者必会脱颖而出。”李彦宏曾表示。

大模型技术在狂飙之后逐渐归于理性务实，百度的态度也日益清晰：不是要推出一个“超级应用”，而是要不断地帮助更多人、更多企业打造出数百万“超级有用”的应用。如今，其大模型应用已落地能源、电力、制造等数十个行业、几百个场景。在世界2024大会上，百度还明确透露，文心大模型仍在持续训练中，更强大的新版本值得期待。