谷歌AI大模型Gemini亮相:擅长复杂学科推理,懂编程语言 PK GPT-4

2023年12月07日12:15:20 财经 4437
谷歌AI大模型Gemini亮相:擅长复杂学科推理,懂编程语言 PK GPT-4 - 天天要闻

雷递网 乐天 12月7日

美国科技巨头谷歌今日宣布推出人工智能模型Gemini,并针对三种不同的尺寸优化了 Gemini 1.0:

Gemini Ultra——谷歌最大、最有能力的模型,适用于高度复杂的任务。

Gemini Pro——谷歌可扩展各种任务的最佳模型。

Gemini Nano——谷歌最高效的设备端任务模型。

谷歌AI大模型Gemini亮相:擅长复杂学科推理,懂编程语言 PK GPT-4 - 天天要闻

据谷歌称,公司一直在严格测试Gemini模型并评估其在各种任务中的性能。从自然图像、音频和视频理解到数学推理,Gemini Ultra 的性能在大型语言模型 (LLM) 研发中使用的32个广泛使用的学术基准中的 30 个上超过了当前最先进的结果。

Gemini Ultra的得分高达90%,是第一个在 MMLU(大规模多任务语言理解)上超越人类专家的模型,该模型结合了数学、物理、历史、法律、医学和伦理学等 57 个科目来测试 知识和解决问题的能力。

Gemini新的 MMLU 基准方法使 Gemini 能够利用其推理能力在回答难题之前更仔细地思考,从而比仅使用第一印象有显着改进。

谷歌AI大模型Gemini亮相:擅长复杂学科推理,懂编程语言 PK GPT-4 - 天天要闻

该图表显示了 Gemini Ultra 在常见文本基准测试中的性能与 GPT-4 的比较(在报告数字缺失的情况下计算的 API 数字)。Gemini 在文本和编码等一系列基准测试中超越了最先进的性能。

Gemini Ultra还在新的MMMU 基准测试中取得 59.4% 的最先进分数,该基准测试由跨越不同领域、需要深思熟虑的推理的多模态任务组成。

根据谷歌测试的图像基准,Gemini Ultra 的性能优于以前最先进的模型,无需从图像中提取文本以进行进一步处理的对象字符识别 (OCR) 系统的帮助。这些基准凸显了双子座天生的多模态性,并表明了双子座更复杂推理能力的早期迹象。

擅长复杂学科推理 能懂编程语言

Gemini 1.0 复杂的多模式推理功能可以帮助理解复杂的书面和视觉信息。这使得它在发现大量数据中难以辨别的知识方面具有独特的能力。

Gemini 1.0 通过阅读、过滤和理解信息从数十万份文档中提取见解的卓越能力将有助于在从科学到金融的许多领域以数字速度实现新的突破。

Gemini 1.0 经过训练,可以同时识别和理解文本、图像、音频等,因此它可以更好地理解微妙的信息,并可以回答与复杂主题相关的问题。这使得它特别擅长解释数学和物理等复杂学科的推理。

谷歌的第一个版本的 Gemini 可以理解、解释和生成世界上最流行的编程语言(如Python、Java、C++ 和 Go)的高质量代码。它跨语言工作和推理复杂信息的能力使其成为世界领先的编码基础模型之一。

Gemini Ultra 在多个编码基准测试中表现出色,包括 HumanEval(用于评估编码任务性能的重要行业标准)和 Natural2Code(我们内部保留的数据集),该数据集使用作者生成的源而不是基于网络的信息。

Gemini还可以用作更高级编码系统的引擎。两年前,谷歌推出 AlphaCode,这是第一个在编程竞赛中达到竞争性能水平的人工智能代码生成系统。

谷歌AI大模型Gemini亮相:擅长复杂学科推理,懂编程语言 PK GPT-4 - 天天要闻

使用Gemini 的专门版本,谷歌创建更先进的代码生成系统 AlphaCode 2,它擅长解决超出编码范围、涉及复杂数学和理论计算机科学的竞争性编程问题。

Pixel 8 Pro将运行Gemini Nano

谷歌AI大模型Gemini亮相:擅长复杂学科推理,懂编程语言 PK GPT-4 - 天天要闻

谷歌还将Gemini引入Pixel。Pixel 8 Pro是第一款运行Gemini Nano的智能手机,它支持 Recorder 应用中的 Summarize等新功能,并从WhatsApp开始推出Gboard中的Smart Reply,明年还会推出更多应用。

在接下来的几个月中,Gemini将出现在谷歌更多的产品和服务中,例如搜索、广告、Chrome 和 Duet AI。

谷歌已经开始在搜索中试验 Gemini,它使用户的搜索生成体验 (SGE) 更快,美国英语的延迟减少了 40%,同时质量也得到了提高。

谷歌和 Alphabet 首席执行官桑达尔·皮查伊 (Sundar Pichai)说,每一次技术变革都是推进科学发现、加速人类进步和改善生活的机会。

“我相信我们现在所看到的人工智能转变将是我们一生中最深刻的转变,远远大于之前向移动或网络的转变。人工智能有潜力为世界各地的人们创造从日常生活到非凡的机会。它将带来新一波的创新和经济进步,并以前所未有的规模推动知识、学习、创造力和生产力。”

谷歌AI大模型Gemini亮相:擅长复杂学科推理,懂编程语言 PK GPT-4 - 天天要闻

皮查伊说,“我们正与Gemini一起迈出下一步,这是我们迄今为止功能最强大、最通用的模型,在许多领先基准测试中都具有最先进性能。我们的第一个版本 Gemini 1.0 针对不同尺寸进行了优化:Ultra、Pro 和 Nano。”

Google DeepMind 首席执行官兼联合创始人Demis Hassabis代表Gemini 团队发言,称长期以来,我们一直希望构建新一代人工智能模型,其灵感来自于人们理解世界和与世界互动的方式。人工智能感觉不太像一个智能软件,而更像是有用且直观的东西——一个专家帮助者或助手。

“今天,当我们推出 Gemini 时,我们离这一愿景又近了一步,这是我们迄今为止构建的最强大、最通用的模型。”

Demis Hassabis称,Gemini是整个Google团队(包括Google Research的同事)大规模协作努力的成果。它是从头开始构建的多模式,这意味着它可以概括和无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。

“Gemini 也是我们迄今为止最灵活的模型 - 能够在从数据中心到移动设备的所有设备上高效运行。其最先进的功能将显著增强开发人员和企业客户利用人工智能进行构建和扩展的方式。”

雷递由媒体人雷建平创办,若转载请写明来源。

财经分类资讯推荐

三名高管火速套现超千万!万辰集团股价闪崩9% - 天天要闻

三名高管火速套现超千万!万辰集团股价闪崩9%

7月2日,万辰集团(300972.SZ)(下称“万辰”)股价开盘后一路下行,盘中一度跌超11%,截至收盘跌幅收窄至9.73%,报168.67元/股;总市值304亿元,较上一日缩水约33亿元。这一股价异动,或与前一日披露的高管减持公告有关。7月1日晚,万辰发布公告,公司董事兼总经理王丽卿、董事兼副总经理李博、副总经理王松,以集中竞价...
再迎利好!万亿赛道大爆发 - 天天要闻

再迎利好!万亿赛道大爆发

【导读】利好政策密集出台,海洋经济概念股狂掀涨停潮中国基金报记者 牛思若海洋经济领域再迎重磅利好!7月1日,中央财经委员会第六次会议指出,推动海洋经济高质量发展,要加强顶层设计,加大政策支持力度,鼓励引导社会资本积极参与发展海洋经济。政策东风催热板块行情。7月2日,A股开盘后,海洋经济概念股狂掀涨停潮,深...
田浩洋:7.3黄金午夜行情思路解析,顺应趋势回踩不破做多 - 天天要闻

田浩洋:7.3黄金午夜行情思路解析,顺应趋势回踩不破做多

来源:田浩洋爱看盘黄金周三的行情走势基本已经接近尾声了,回顾今日我们几次下方3327-30区间内进行布局多单,多单也是完美全部获利出局,近期行情涨跌幅度比较大,加上本周又是非农周,消息面也比较多,所以我们更加需要稳健操作来把握利润,关注我文
A股复盘|指数缩量调整!热点快速切换,市场还有上涨动能吗? - 天天要闻

A股复盘|指数缩量调整!热点快速切换,市场还有上涨动能吗?

为投资者提供专业资讯服务 资讯传递价值,专业伴随成长!——腾讯官方证券投资平台 为投资者提供专业资讯服务 资讯传递价值,专业伴随成长!——腾讯官方证券投资平台7月2日市场全天缩量调整。截至收盘,上证指数跌0.09%,深证成指跌0.61%,创业板指跌1.13%。全市个股跌多涨少,全市下跌个股近3300只;全市全天成交1.37万亿...
利好利空晚报|高层部署!加快产业创新;证监会发声!持续提升A股吸引力、竟争力 - 天天要闻

利好利空晚报|高层部署!加快产业创新;证监会发声!持续提升A股吸引力、竟争力

为投资者提供专业资讯服务 资讯传递价值,专业伴随成长!——腾讯官方证券投资平台周三晚间,市场聚焦哪些新闻?一起来和自选哥看看吧:高层发声,事关新型工业化、新质生产力;证监会召开会议,研究部署资本市场具体举措。首先,一起来和自选哥看看高层关于新型工业化、新质生产力的发声吧。国务院副总理张国清近日在湖北...
比特币ETF或已成为贝莱德最创收产品 超越同门老将标普ETF - 天天要闻

比特币ETF或已成为贝莱德最创收产品 超越同门老将标普ETF

财联社6月24日讯(编辑 赵昊)对全球最大资产管理公司贝莱德来说,旗下的比特币交易所交易基金(ETF)为其创造的收入可能已经超过了其标志性的产品标普500指数ETF。数据显示,贝莱德规模约为750亿美元的iShares比特币信托ETF(代码:IBIT)受到机构与散户投资者的共同追捧,过去18个月中17个月录得资金流入,仅今年2月出现...
腾讯表态“不当接盘侠”!Nexon创始人遗产税难交,250亿元股票或再次流拍 - 天天要闻

腾讯表态“不当接盘侠”!Nexon创始人遗产税难交,250亿元股票或再次流拍

“ 点击上方"GameLook",订阅微信 ”近日,中国科技巨头腾讯再次明确表示,无意收购韩国游戏公司Nexon控股母公司NXC的股份。这批股份源于已故Nexon创始人金正洙的遗产税,由其遗属以实物形式上缴,占NXC总股本的近30%。尽管韩国企划财政部已通过韩国资产管理公社(KAMCO)启动了这85万1968股的出售程序,但腾讯并未参...
携手沃满客智慧便利店创业,共同开创智慧零售的新未来 - 天天要闻

携手沃满客智慧便利店创业,共同开创智慧零售的新未来

近年来,随着消费升级浪潮的持续推进和数字化转型的不断深入,零售行业正经历着前所未有的变革。在这一背景下,沃满客智慧便利店凭借其创新的商业模式和先进的技术支撑,正逐渐成为众多创业者进军智慧零售领域的首选合作伙伴。通过深度融合物联网、大数据、人工智能等前沿技术,沃