谷歌的原生多模态大模型Gemini来了,剑指GPT-4

2023年12月07日21:30:10 财经 8921

在此前被OpenAI压制了一整年后,就在2023年进入尾声时,当年凭借AlphaGo曾掀起人工智能浪潮的谷歌,也终于扬眉吐气了一把,揭开了原生多模态大模型Gemini的神秘面纱。据悉,Gemini号称是谷歌迄今为止“最大、也最全能的AI模型”,拥有文本、图像、视频、音频和代码能力,而且有别与其他大模型Gemini更加灵活,其包括了能力最强、复杂度最高的Gemini Ultra,适用于多任务的Gemini Pro,以及端侧的Gemini Nano(1.8B/3.25B)。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

从能够在移动端到大型数据中心的所有设备上运行,就足以证明谷歌对Gemini寄予厚望。根据谷歌方面的说法,Gemini Nano将率先在Pixel 8 Pro上落地,Gemini Pro则将从当地时间本周三开始支持Bard,而Gemini Ultra则会在明年年初向公众大范围开放。

当然,外界更关心的应该是Gemini的性能究竟如何,以及与GPT-4相比孰强孰弱。

根据谷歌方面公布的信息显示,在32项基准测试中,Gemini在30个项目上都实现了“遥遥领先”,同时Gemini Ultra在MMLU(大规模多任务语言理解数据集)中的得分率更是高达90.0%,成为了大模型中首个超越人类专家的产品。对于目前大模型在评测中刷题蔚然成风的现象,谷歌也特意强调,“对于以前的SOTA模型评估使用不同的提示技术”,也就是Gemini并未针对性的刷题。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

Gemini最大的亮点就是原生(native)多模态,谷歌口中的“anything to anything”也代表了Gemini和ChatGPT的本质区别。虽然两者确实都实现了支持文本、图像、音频和视频输入,以及文本和图片的输出,但OpenAI的解决方案是在ChatGPT这个大模型(LLM)上不断叠加多模态模块,谷歌的Gemini则是从一开始就将各种模态的能力一同训练,相当于一个是串联、另一个是并联。

比如在面对用户输入的同样一张图片,GPT-4的策略是用OCR技术分割图片,获得干净的字符图像、再识别字符,并转化为文本信息。而Gemini认知图片的方式则更接近人类,就是综合视觉、听觉、语言来理解事物,这也是Gemini在谷歌展示的DEMO中,对于连续输入的内容几乎能即刻做出反应的关键。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

值得一提的是,在Gemini技术报告中,谷歌方面表示其基于谷歌自家的张量处理单元(TPU)v4和v5e进行大规模训练,这也就意味着即使脱离了英伟达的CUDA生态,不使用英伟达GPU,业界依然有能力训练出性能不错的大模型。而且随着Gemini的发布,谷歌同时公布了专为训练先进AI大模型的Cloud TPU v5p,等于说是明晃晃地要抢英伟达的蛋糕。

作为在过去一年几乎压得谷歌几乎喘不过气的产品,GPT-4也是此次展示Gemini性能的标靶。例如Gemini Ultra在推理、数学、代码等文本处理能力的得分,就均高于GPT-4,在图像、视频、音频等多模态能力上也压倒了GPT-4。

但事实真的如此吗?其实仔细观察谷歌在视频中展示的关于Gemini和GPT-4评测的表格和图片会发现,其中似乎暗藏了玄机。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

事实上,谷歌在对比中采用了被称为“非对称”的方式,例如在比拼MMLU测试集时,Gemini Ultra的得分率为90%、而GPT-4则是86.4%,但二者测试的方法却截然不同。Gemini Ultra下方的CoT@32表明,它使用了思维链(CoT)技术,这也是目前大模型领域炙手可热的一项技术,它在Prompt中除了任务的输入和输出外,还加入了推理的中间步骤,会使得大模型的性能度提升,而GPT-4下方的5-shot,则代表使用了Few-Shot Learning(少样本学习)技术。

简单来说,两者的区别相当于是同样参加一场考试,GPT-4的作答时间是1小时,Gemini Ultra则有一天时间。试想一下,如果高考的答题时间不是2小时、而是24小时,想必大家的成绩都会更上一层楼。

除此之外,谷歌用未经过“AI对齐”(AI Alignment)的Gemini Ultra,来对比已经经过OpenAI对齐的公开版GPT-4。要知道,AI对齐要求AI的目标要与人类的价值观和利益相对齐,使得其符合设计者的利益预期,不会产生意外的有害后果。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

AI对齐概念的出现,其实是OpenAI等厂商为了合规而设计,它的副作用就会是导致大模型性能的下降,这一点在GPT-4、New Bing上已经有了明确的体现。换而言之,谷歌是用一个无法商业化的Gemini Ultra版本,来对比已经商业化的GPT-4,难免就有些胜之不武了。当然,谷歌选择投机取巧也不难理解,毕竟在过去的一年时间里,他们在AI领域确实承受着巨大的压力。

作为AI赛道曾经的领导者,谷歌也被外界批评由于过分僵化和谨慎,从而让其他公司抢占了大模型的先机,以至于创始人谢尔盖·布林都重新出山、协助搭建下一代AI模型。CEO皮查伊在面对媒体时更是不得不放狠话,“不管他们怎么说,我们在AI领域不会输”。更何况,精心筹备的Bard首秀即翻车,在整个2023年OpenAI、微软、Meta各领风骚的情况下,唯独谷歌几乎没有了声音。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

如此种种境况,使得谷歌想要让Gemini Ultra在纸面上压倒GPT-4也不难理解了,毕竟都已经倾注了所有的资源,再打不赢OpenAI可怎么办?不过即便Gemini Ultra不能超过GPT-4成为地表最强的AI大模型,但超越GPT 3.5几乎是板上钉钉的事情。

或许有了实质性的竞争对手,未来OpenAI可能也会加速GPT-5的落地。

财经分类资讯推荐

瞒不住了!中国最会赚钱的铁路,竟不是京沪高铁? - 天天要闻

瞒不住了!中国最会赚钱的铁路,竟不是京沪高铁?

在我国铁路运输的庞大版图中,有一条看似低调却实力强劲的铁路——朔黄铁路。它并非如京沪高铁那般声名远扬,但其赚钱能力却堪称一绝,以每秒超300元的速度“印钞”,就连国铁集团对它的管理也有着特殊的模式。西煤东运的关键纽带朔黄铁路作为我国西煤东运
民生证券:坚定看好AI产业长期叙事 国产替代加速突破 - 天天要闻

民生证券:坚定看好AI产业长期叙事 国产替代加速突破

智通财经APP获悉,民生证券发布研报称,坚定看好AI产业的长期叙事,英伟达(NVDA.US)持续强势,云厂商崛起,国产算力突破的当下,投资机遇也会更加多元化。全球AI算力需求持续高增,产品迭代加速推动产业链升级,国产算力在芯片、模型、基建等领域实现多点突破。具体到细分赛道,算力链重点关注服务器、PCB、CPO、铜缆、电源...
技领暖界 泵通中国|万和空气能2025新品发布会暨经销商旺季启动大会圆满举办 - 天天要闻

技领暖界 泵通中国|万和空气能2025新品发布会暨经销商旺季启动大会圆满举办

6月29日,以“技领暖界 泵通中国”为主题的万和空气能2025新品发布会暨经销商旺季启动大会在河北省石家庄市富力洲际酒店拉开帷幕。这场汇聚行业专家、企业领袖、经销商伙伴及媒体代表的年度盛会,不仅发布了颠覆行业的空气能新品,更以全产业链战略布局勾勒出中国热泵产业的未来图景。 万和电气 18 年深耕清洁能源的技术积...
“沪青优品”标准7月发布,青海特色农畜产品有了“入沪指南” - 天天要闻

“沪青优品”标准7月发布,青海特色农畜产品有了“入沪指南”

6月28日,2025外贸优品市州行、东西部协作“沪青优品”品牌化研讨会暨第二届上海援青商品化与品牌化系列活动在青海省格尔木市举办。“品牌力的内涵是质形力,既要做好产品创新、服务内化、渠道趋近、组织效率和数字转型,又要关注消费经验、顾客忠诚、舆论评审、公共关系和对外沟通。产品和服务本身是内在资产,传播是外在...
兴化股份:子公司兴化化工例行停车检修 - 天天要闻

兴化股份:子公司兴化化工例行停车检修

智通财经APP讯,兴化股份(002109.SZ)发布公告,公司接到全资子公司陕西延长石油兴化化工有限公司(简称兴化化工)的通知,为了确保后期生产的安全平稳运行,按照计划兴化化工安排例行停车检修。兴化化工于2025年6月29日开始进行生产装置例行停车检修,预计停车约34天,具体复产时间以装置实际开车时间为准。本次停车检修是兴...
科达利拟向两家子公司合计增资4亿元 - 天天要闻

科达利拟向两家子公司合计增资4亿元

智通财经APP讯,科达利(002850.SZ)发布公告,公司拟以自有资金共计人民币4亿元,向全资子公司四川科达利精密工业有限公司(简称“四川科达利”)和福建科达利精密工业有限公司(简称“福建科达利”)进行增资,增资方式为增加注册资本,增资金额均为2亿元。本次增资完成后,四川科达利的注册资本将由5亿元增加至7亿元,福建科达...
港股异动丨协鑫新能源涨超6% 光伏政策持续发力 市场静待需求修复 - 天天要闻

港股异动丨协鑫新能源涨超6% 光伏政策持续发力 市场静待需求修复

光伏概念股协鑫新能源(0451.HK)午后涨幅扩大,现涨6.49%报0.41港元。消息面上,工信部印发《关于深入推进工业和信息化绿色低碳标准化工作的实施方案》。方案提出,加强绿色低碳产业培育标准引领。加快推动完善光伏、新能源汽车、绿色智算、绿色船舶、绿色航空、绿色电力装备、绿色轻工、环保装备等领域标准体系,支撑绿色发...
热烈庆祝|瑞众保险成立两周年暨湖南分公司隆重表彰 - 天天要闻

热烈庆祝|瑞众保险成立两周年暨湖南分公司隆重表彰

值此瑞众保险成立两周年之际,湖南分公司特在《三湘都市报》上,向长期以来关心支持公司发展的广大客户及社会各界致以衷心感同时,在瑞众保险湖南分公司六月业务推动中,涌现出一批锐意进取的优秀团队带头人。
林师聊糖市:4季度国内白糖现货及期货存在较大上涨动力 - 天天要闻

林师聊糖市:4季度国内白糖现货及期货存在较大上涨动力

过去两个月国际及国内食糖价格下跌,原糖目前仍处于低位,下半年白糖市场又将发生什么变化。总的观点市场对巴西、印度食糖产量过于乐观了,且原糖价格在过去2个月下跌也充分表达了市场对巴西、印度产量乐观带来利空。巴西、印度食糖真的能达到预期吗,利空是