谷歌的原生多模态大模型Gemini来了,剑指GPT-4

2023年12月07日21:30:10 财经 8921

在此前被OpenAI压制了一整年后,就在2023年进入尾声时,当年凭借AlphaGo曾掀起人工智能浪潮的谷歌,也终于扬眉吐气了一把,揭开了原生多模态大模型Gemini的神秘面纱。据悉,Gemini号称是谷歌迄今为止“最大、也最全能的AI模型”,拥有文本、图像、视频、音频和代码能力,而且有别与其他大模型Gemini更加灵活,其包括了能力最强、复杂度最高的Gemini Ultra,适用于多任务的Gemini Pro,以及端侧的Gemini Nano(1.8B/3.25B)。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

从能够在移动端到大型数据中心的所有设备上运行,就足以证明谷歌对Gemini寄予厚望。根据谷歌方面的说法,Gemini Nano将率先在Pixel 8 Pro上落地,Gemini Pro则将从当地时间本周三开始支持Bard,而Gemini Ultra则会在明年年初向公众大范围开放。

当然,外界更关心的应该是Gemini的性能究竟如何,以及与GPT-4相比孰强孰弱。

根据谷歌方面公布的信息显示,在32项基准测试中,Gemini在30个项目上都实现了“遥遥领先”,同时Gemini Ultra在MMLU(大规模多任务语言理解数据集)中的得分率更是高达90.0%,成为了大模型中首个超越人类专家的产品。对于目前大模型在评测中刷题蔚然成风的现象,谷歌也特意强调,“对于以前的SOTA模型评估使用不同的提示技术”,也就是Gemini并未针对性的刷题。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

Gemini最大的亮点就是原生(native)多模态,谷歌口中的“anything to anything”也代表了Gemini和ChatGPT的本质区别。虽然两者确实都实现了支持文本、图像、音频和视频输入,以及文本和图片的输出,但OpenAI的解决方案是在ChatGPT这个大模型(LLM)上不断叠加多模态模块,谷歌的Gemini则是从一开始就将各种模态的能力一同训练,相当于一个是串联、另一个是并联。

比如在面对用户输入的同样一张图片,GPT-4的策略是用OCR技术分割图片,获得干净的字符图像、再识别字符,并转化为文本信息。而Gemini认知图片的方式则更接近人类,就是综合视觉、听觉、语言来理解事物,这也是Gemini在谷歌展示的DEMO中,对于连续输入的内容几乎能即刻做出反应的关键。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

值得一提的是,在Gemini技术报告中,谷歌方面表示其基于谷歌自家的张量处理单元(TPU)v4和v5e进行大规模训练,这也就意味着即使脱离了英伟达的CUDA生态,不使用英伟达GPU,业界依然有能力训练出性能不错的大模型。而且随着Gemini的发布,谷歌同时公布了专为训练先进AI大模型的Cloud TPU v5p,等于说是明晃晃地要抢英伟达的蛋糕。

作为在过去一年几乎压得谷歌几乎喘不过气的产品,GPT-4也是此次展示Gemini性能的标靶。例如Gemini Ultra在推理、数学、代码等文本处理能力的得分,就均高于GPT-4,在图像、视频、音频等多模态能力上也压倒了GPT-4。

但事实真的如此吗?其实仔细观察谷歌在视频中展示的关于Gemini和GPT-4评测的表格和图片会发现,其中似乎暗藏了玄机。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

事实上,谷歌在对比中采用了被称为“非对称”的方式,例如在比拼MMLU测试集时,Gemini Ultra的得分率为90%、而GPT-4则是86.4%,但二者测试的方法却截然不同。Gemini Ultra下方的CoT@32表明,它使用了思维链(CoT)技术,这也是目前大模型领域炙手可热的一项技术,它在Prompt中除了任务的输入和输出外,还加入了推理的中间步骤,会使得大模型的性能度提升,而GPT-4下方的5-shot,则代表使用了Few-Shot Learning(少样本学习)技术。

简单来说,两者的区别相当于是同样参加一场考试,GPT-4的作答时间是1小时,Gemini Ultra则有一天时间。试想一下,如果高考的答题时间不是2小时、而是24小时,想必大家的成绩都会更上一层楼。

除此之外,谷歌用未经过“AI对齐”(AI Alignment)的Gemini Ultra,来对比已经经过OpenAI对齐的公开版GPT-4。要知道,AI对齐要求AI的目标要与人类的价值观和利益相对齐,使得其符合设计者的利益预期,不会产生意外的有害后果。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

AI对齐概念的出现,其实是OpenAI等厂商为了合规而设计,它的副作用就会是导致大模型性能的下降,这一点在GPT-4、New Bing上已经有了明确的体现。换而言之,谷歌是用一个无法商业化的Gemini Ultra版本,来对比已经商业化的GPT-4,难免就有些胜之不武了。当然,谷歌选择投机取巧也不难理解,毕竟在过去的一年时间里,他们在AI领域确实承受着巨大的压力。

作为AI赛道曾经的领导者,谷歌也被外界批评由于过分僵化和谨慎,从而让其他公司抢占了大模型的先机,以至于创始人谢尔盖·布林都重新出山、协助搭建下一代AI模型。CEO皮查伊在面对媒体时更是不得不放狠话,“不管他们怎么说,我们在AI领域不会输”。更何况,精心筹备的Bard首秀即翻车,在整个2023年OpenAI、微软、Meta各领风骚的情况下,唯独谷歌几乎没有了声音。

谷歌的原生多模态大模型Gemini来了,剑指GPT-4 - 天天要闻

如此种种境况,使得谷歌想要让Gemini Ultra在纸面上压倒GPT-4也不难理解了,毕竟都已经倾注了所有的资源,再打不赢OpenAI可怎么办?不过即便Gemini Ultra不能超过GPT-4成为地表最强的AI大模型,但超越GPT 3.5几乎是板上钉钉的事情。

或许有了实质性的竞争对手,未来OpenAI可能也会加速GPT-5的落地。

财经分类资讯推荐

同日宣布被查!其中一人36岁执掌珠海香洲百亿级龙头国企 - 天天要闻

同日宣布被查!其中一人36岁执掌珠海香洲百亿级龙头国企

6月6日,廉洁珠海公号连续发布两则通报,珠海正方集团有限公司原党委书记、董事长、总经理唐亮,以及该公司原副总经理郭伟涉嫌严重违纪违法,目前正接受珠海市香洲区纪委监委纪律审查和监察调查。珠海正方集团系珠海知名国企,也是主城区香洲区龙头国企。此前正方集团高层遭遇人事地震,唐亮、郭伟均已离任,此次通报也是官...
血泪教训!90%基民踩过的10大坑,第5个几乎人人中招 - 天天要闻

血泪教训!90%基民踩过的10大坑,第5个几乎人人中招

这位网友问,基金投资如何闭坑,我换种说法来回答,基金行业的一些常识性的观点、建议,你即使不了解原理,但也最好相信,既然是常识,都是有万千投资者用真金白银试出来的经验结果,所以你还是需要认真对待。要点比较多,建议点赞收藏,以免以后找不到了。1
“制冷剂双雄”,历史新高 - 天天要闻

“制冷剂双雄”,历史新高

近两日新消费行情回调,其他板块迎来机会。昨天大科技反弹,今天上午,轮到周期股表现。具体看,有色金属板块涨幅居前,贵金属、锌、铅等板块大涨。随着投资者对贵金属避险属性的需求从黄金扩展到白银,白银期货价格最近走强。白银概念股上午表现突出,兴业银
郑州市政府发布通知 - 天天要闻

郑州市政府发布通知

郑州市人民政府关于印发郑州市支持河南中牟新区加快发展若干先行政策措施的通知郑政文〔2025〕63号各开发区管委会,各区县(市)人民政府,市人民政府各部门,各有关单位:现将《郑州市支持河南中牟新区加快发展若干先行政策措施》印发给你们,请认真组
国补再优惠2000元!这个618什么游戏本值得买? - 天天要闻

国补再优惠2000元!这个618什么游戏本值得买?

对于3A游戏玩家来说,最大的小确幸就是能脱离电脑桌的束缚,无论是旅途、露营还是队友聚会,都能随时酣畅沉浸在游戏世界中。因此,性能强劲、便携性佳的游戏笔记本电脑就成为玩家的心头好。现在年中购物狂欢618已经开启,更新装备的绝佳时机已经来临,联想特意为玩家准备了两
年产能2500万吨,宝武和力拓在澳大利亚联合开发的铁矿项目全面投产 - 天天要闻

年产能2500万吨,宝武和力拓在澳大利亚联合开发的铁矿项目全面投产

【文/观察者网 陈思佳】当地时间6月6日,全球矿业巨头力拓集团发表声明,宣布其与中国宝武钢铁集团联合开发的澳大利亚西坡铁矿项目正式投产。该铁矿位于西澳大利亚州皮尔巴拉地区,设计年产能为2500万吨。《日经亚洲》6日发文称,皮尔巴拉地区是澳大利亚重要的铁矿生产中心之一,该地区开采的铁矿石主要销往中国。在美国总...
货量增长70%!深圳物流公司24小时冲刺美线“囤货”高峰 - 天天要闻

货量增长70%!深圳物流公司24小时冲刺美线“囤货”高峰

成堆的集装箱在轨道上快速移动,叉车在仓库通道间穿梭不息……深圳盐田港的货物集散仓,正迎来前所未有的繁忙景象。今年5月,中美两国达成阶段性关税调整协议,宣布暂停部分加征关税并设立90天窗口期。美国采购商加紧“囤货”,美线海运热度不断上升。在盐田港密集分布的物流公司里,深圳市金运达国际物流有限公司(下称“...
“A系列”宽基指数本周收红,A500ETF易方达(159361)、A100ETF易方达(159686)等助力布局A股核心资产 - 天天要闻

“A系列”宽基指数本周收红,A500ETF易方达(159361)、A100ETF易方达(159686)等助力布局A股核心资产

本周,中证A500指数上涨0.9%,中证A100指数上涨0.8%,中证A50指数上涨0.3%。摩根士丹利策略师表示,由于美元走弱以及投资者多元化意愿增强等因素,未来6~12个月中国股票将吸引更多资金流入。由于投资者的预期更为现实以及美元走软,中国公司的盈利增长潜力正在“逐步上升”。每日经济新闻...