百度文心4.5将于“316”发布,哪个能力最值得期待?

2025年02月28日23:40:35 科技 8907
百度文心4.5将于“316”发布,哪个能力最值得期待? - 天天要闻


编辑|易瑾



2月28日,百度官方公众号宣布,将于3月16日发布文心大模型4.5。此前据百度创始人李彦宏在2024年q4及全年财报电话会上透露4.5将开源。


deepseek重点在文本模型上不同的是,据官方介绍文心大模型4.5除了在基础模型能力上有大幅提升外,还具备原生多模态、深度思考等能力。

百度文心4.5将于“316”发布,哪个能力最值得期待? - 天天要闻


公开资料显示,百度文心大模型是全球最早对标gpt的llm大模型,并将于今年内发布5.0版本。也就在今日凌晨,openai正式发布gpt4.5,只是一经发布该模型便受到不少质疑,一方面是持续的高价策略,另一方面则是产品性能和使用体验。


人工智能行业的大模型之战愈演愈烈,一直坚定投入大模型的百度,近期免费、开源动作频频,文心4.5即将发布,有哪些能力是值得期待的呢?


开放动作接连不断


春节期间,deepseek如同鲇鱼一般搅动了整个大模型市场。除了模型能力强外,开源+性价比是让deepseek引发泼天热度的重要原因。


受其影响,国内外大模型厂商迅速卷入到模型发布和开源的阵容中。毫不例外,百度也迅速“出招”以开放的策略以求占据主动权。


2月13日,百度宣布文心一言将于4月1日起全面免费,所有pc端和app端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级ai绘画、多语种对话等功能。


在此之前,文心一言一直采取和chatgpt类似的收费模型,免费用户只能使用文心大模型3.5,想要使用更高级的文心大模型4.0的用户,需要开通会员。


同时,文心一言上线深度搜索功能,该功能具备更强大的思考规划和工具调用能力,可为用户提供专家级内容回复,并处理多场景任务,实现多模态输入与输出。截至目前,文心一言用户规模达到4.3亿,文心大模型日均调用量超过16.5亿次。


面向b端客户,百度也为企业和开发者提供了不少福利。在2月5日,千帆上架了deepseek-r1和deepseek-v3模型后,百度推出了超低价格方案,最低至deepseek官方定价的30%,同时还推出了限时免费服务。模型上线首日,超过1.5万家客户通过千帆平台进行模型调用。


次日,百度宣布将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。现在来看,文心4.5版本将更快速地与用户见面。


据官方透露随着文心大模型的迭代升级,其训练和推理成本正在迅速下降。在不久前,李彦宏也在迪拜ai峰会上表示,当前的创新速度比以往快得多,大模型的推理成本每年能降低90%以上,并表示将持续投入ai基础设施,以打造下一代大模型。


在这之后,百度app全量上线新的ai入口、搜索和文心智能体平台全面接入deepseek和文心大模型最新的深度搜索功能等一系列动作,让用户体验提升到新的高度。


定档3月16日的文心4.5,在此前百度财报会上透露是史上最强大的文心大模型,又会有哪些惊喜呢?


幻觉能力或将降低到新水平


从2023年“百模大战”到2024年应用全面开花,大模型基座能力的比拼依然是在你追我赶的状态。尤其在今年年初deepseek凭借高性能、低成本模型引发业界关注后,全球不少大模型厂商争先恐后地发布自家模型。


anthropic的发布首款混合推理模型claude 3.7 sonnet、马斯克的人工智能初创公司xai推出更新版grok 3大模型、openai 最新大模型gpt-4.5正式推出……


据悉gpt-4.5是openai最后一代不具备“思维链推理”机制的模型。在广大用户的期待下,gpt-4.5有“进步”也有不少“争议”。


“情商”能力是被业内广泛认可的核心突破,而成本与价格是gpt-4.5的主要争议点:每百万输入是75美元、每百万输出是150美元,是claude 3.7 sonnet的25倍。


在用户体验上gpt-4.5也受到了不少“诟病”,有科技博主实测表示该模型在编码等方面并不比gpt-4o好太多、也有用户称不如grok。因此,业内也有一种观点是:这是openai仓促发布的一个产品。


即将在3月16日发布文心4.5,也引起了广泛关注,不少从业者都在期待新的突破。


百度文心4.5将于“316”发布,哪个能力最值得期待? - 天天要闻


实际上,从文心一言发布之初,百度就强调检索增强,到现在一年半多时间,检索增强的价值,已经成为业界共识。


百度基于搜索技术的积累在rag上具备明显优势,推出百度ai原生检索。从rag能力实测来看,国内外主流大模型中,百度文心一言综合表现都很突出。公开资料显示,百度研发了“理解-检索-生成”协同优化的检索增强技术,显著提升了大模型技术及应用的效果。


理解阶段,基于大模型理解用户需求,对知识点进行拆解;检索阶段,面向大模型进行搜索排序优化,并将搜索返回的异构信息统一表示,送给大模型;生成阶段,综合不同来源的信息做出判断,并基于大模型逻辑推理能力,解决信息冲突等问题,从而生成准确率高、时效性好的答案。


另外在2024世界大会上百度还发布了检索增强的文生图技术(irag),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,整体效果远远超过文生图原生系统,去掉了机器味儿,具备无幻觉、超真实、低成本、立等可取等特点。


结合百度官方介绍,文心大模型4.5在基础模型能力上有大幅提升,且具备原生多模态、深度思考等能力。结合rag、irag等百度一贯具备优势的能力,不难推测文心大模型4.5将在幻觉方面降低到新水平。


结语


一直以来,李彦宏都强调大模型应用的价值,也持续通过降低成本、提升模型性能等方式,降低大模型的应用普及落地门槛。


在他的愿景中是希望大模型能人人都用得起,人人都用得上。近期,在接连开源、免费等诸多动作下,开源的文心4.5给予市场更大的期待。



   推荐阅读   

科技分类资讯推荐

小猪不打标随机看广法(新) - 天天要闻

小猪不打标随机看广法(新)

不管现在的小猪一圈是1是10还是18的打开小猪从第一广到最后一广共20个广。每一个广都进去查看详情浏览30秒至1分钟;下载类的无需下只需打开图片详情浏览,播间的需要相关的评论及详情的浏览。团购的需要进入团购的商品浏览某赞及导航的停留。
革新储能新势力:广州国科电发布261KWH储能柜,开启能源管理新篇 - 天天要闻

革新储能新势力:广州国科电发布261KWH储能柜,开启能源管理新篇

在全球能源转型的浪潮中,广州国科电技术有限公司(以下简称“广州国科电”)推出的261KWH储能柜以卓越的性能和创新的技术,为工商业及各类能源应用场景带来前所未有的变革。这款储能柜不仅是能源存储的容器,更是高效能源管理、成本控制和可持续发展的核心驱动力。 高容量,大可为 261KWH的超大容量设计,使储能柜能够存储...
念朋机械:深耕行业二十载,以品质与创新铸就辉煌 - 天天要闻

念朋机械:深耕行业二十载,以品质与创新铸就辉煌

在建筑行业日新月异的发展浪潮中,一家企业凭借其对品质的坚守和创新的追求,成为了行业内的佼佼者。这家企业,就是廊坊市念朋机械设备加工有限公司(简称“念朋机械”)。自成立以来,念朋机械始终致力于混凝土制品设备的研发与生产,以卓越的产品质量和优质的服务赢得了市场的广泛认可。 品质为先,奠定坚实基础 念朋机械...
刚上市被吐槽,开售直接卖爆,苹果新款iPad补贴到2294元 - 天天要闻

刚上市被吐槽,开售直接卖爆,苹果新款iPad补贴到2294元

每次苹果推出新品,总有不少人在网络上吐槽“没创新”“贵得离谱”。但时间一到开售日,销量曲线便会打所有人一个措手不及。iPad 系列也不例外,虽然人们口头上说“真没什么新鲜的”,可门店里和官网上,却是一机难求,尤其是定价稍有调整时,更是迅速成
小米15强!618销量仅次于苹果16,拿下国产第一名 - 天天要闻

小米15强!618销量仅次于苹果16,拿下国产第一名

一年一度的618电商大促已经全面展开,手机市场迎来了年中最大一波换机潮。苹果依旧稳居销量榜首,在3000元、4000元、5000元甚至6000元以上各大价位段中,iPhone 15系列和iPhone 16系列牢牢占据着头部位置。这也再次印证