Google计划建立巨型人工智能语言模型 支持全球1000种最常用的语言

2022年11月03日01:33:20 科技 1786

Google宣布了一个雄心勃勃的新项目,开发一个支持世界上"1000种最常用语言"的单一AI语言模型。作为实现这一目标的第一步,该公司公布了一个经过400多种语言训练的人工智能模型,它将其描述为"今天在一个语音模型中看到的最大的语言覆盖范围"。

Google计划建立巨型人工智能语言模型 支持全球1000种最常用的语言 - 天天要闻

语言和人工智能可以说一直是Google产品的核心,但最近机器学习的进步--特别是强大的、多功能的"大型语言模型"或LLM的开发--使这些领域得到了新的重视。

Google已经开始将这些语言模型整合到Google搜索等产品中。但语言模型有许多缺陷,包括倾向于转述有害的社会偏见,如种族主义和仇外心理,以及无法以人类的敏感性来解析语言。在自己的研究人员发表了概述这些问题的论文后,Google自己也臭名昭著地解雇了他们。

不过,这些模型能够完成许多任务,从语言生成(如OpenAI的GPT-3)到翻译(见Meta的"不遗漏语言"工作)。Google的"1000种语言计划"并不专注于任何特定的功能,而是要创建一个具有世界上各种语言的巨大知识广度的单一系统。

Google人工智能研究副总裁Zoubin Ghahramani说,该公司认为,创建一个如此规模的模型将使其更容易将各种人工智能功能带到在线空间和人工智能训练数据集中表现不佳的语言(也被称为"低资源语言")。

"语言就像生物体,它们是相互演化而来的,它们有某些相似之处。通过让一个单一的模型接触并训练许多不同的语言,我们在低资源语言上得到更好的表现,"Ghahramani说。"我们达到1000种语言的方法不是通过建立1000种不同的模型。语言就像生物体,它们是相互进化的,它们有某些相似之处。而且,当我们将一种新语言的数据纳入我们的1000种语言模型,并获得将[它所学到的东西]从一种高资源语言转化为低资源语言的能力时,我们可以在我们所谓的零点学习中找到一些相当惊人的进展。"

过去的研究显示了这种方法的有效性,而Google计划中的模型的规模可以提供比过去的工作更多的收益。这种大规模的项目已经成为科技公司主导人工智能研究雄心的典型,并利用了这些公司在获得大量计算能力和训练数据方面的独特优势。一个类似的项目是Facebook母公司Meta正在尝试建立一个"通用语音翻译器"。

Google表示,为了支持1000种语言模型的工作,它将资助收集低资源语言的数据,包括音频记录和书面文本。

该公司表示,它没有直接计划在哪里应用这个模型的功能--只是预计它将在Google的产品中具有一系列用途,从Google翻译到YouTube字幕等等。

"同样的语言模型可以将机器人的命令变成代码;它可以解决数学问题;它也可以进行翻译。关于大型语言模型和一般的语言研究,真正有趣的事情之一是它们可以做很多很多不同的任务,"Ghahramani说。"语言模型真正有趣的地方在于它们正在成为大量知识的储存库,通过以不同的方式探测它们,你可以获得不同的有用功能。"

Google在一个新的人工智能产品展示会上宣布了1000种语言模型。该公司还分享了关于文本到视频模型的新研究,一个名为Wordcraft的人工智能写作助手原型,以及对其人工智能测试厨房应用程序的更新,该应用程序允许用户有限地访问正在开发的人工智能模型,如其文本到图像模型Imagen。

科技分类资讯推荐

每28.5秒下线一部手机!荣耀多款AI终端产品发布 - 天天要闻

每28.5秒下线一部手机!荣耀多款AI终端产品发布

荣耀近日发布多款AI终端生态产品,包括折叠屏手机、笔记本电脑、平板电脑、手表、耳机等。北京青年报记者了解到,荣耀近年来加速推进智能制造升级,通过AI、机器人等前沿技术的深度应用,优化生产流程并提升产....
2025岚图用户之夜7月12日开启  岚图FREE+正式上市 - 天天要闻

2025岚图用户之夜7月12日开启 岚图FREE+正式上市

7月12日,在岚图品牌成立五周年之际,2025岚图用户之夜暨岚图FREE+上市发布会将在武汉体育中心震撼开启。届时,全球5000名岚图用户将齐聚现场,实力歌手薛凯琪与国华乐队水木年华联袂献唱,投入5亿升级、四年磨一剑的岚图FREE+即将重磅上市,奥运冠军和多国
马斯克旗下xAI公司Grok-4系列模型发布,马斯克:它几乎所有学科都比人类研究生聪明!算力是市面上其他任何模型的10倍以上 - 天天要闻

马斯克旗下xAI公司Grok-4系列模型发布,马斯克:它几乎所有学科都比人类研究生聪明!算力是市面上其他任何模型的10倍以上

新浪科技讯 7月10日下午消息,马斯克旗下xAI公司宣布推出最新的Grok-4系列AI模型。这是前代产品 Grok 3 的重大升级版本,直接跳过了3.5版本。据马斯克介绍,该模型几乎在所有学科领域都比人类研究生更聪明。据悉,Grok-4能够进行超人级别的推理,具有代码编写、多模态Agent、视频生成等多项能力,并且在MMLU-Pro、LiveCode...
华为余承东进“局子”自首:关于智驾的“超前野望” - 天天要闻

华为余承东进“局子”自首:关于智驾的“超前野望”

华为常务董事、终端BG董事长余承东在享界用户大会上表示:前段时间网上有个拍我开车睡觉的视频,其实我是在低头看手机,用智驾在开。旁边一个人开车跟我打招呼,我也跟他打招呼。他开了个新款M9,我以为他是华为员工。开车风大,我也没听清他说啥,他还拿手机给我拍照。我也不知道他拍照说我低头在睡觉,然后发到网上了,结...
燃油车逆势增长,一汽-大众大众品牌为何能领跑合资? - 天天要闻

燃油车逆势增长,一汽-大众大众品牌为何能领跑合资?

随着新能源崛起,自主新能源凭借迅猛势头蚕食合资油车市场,现在的攻势余热仍对未来车市影响深远。依照现在的情况观察,时间来到2025年下半年,合资大盘仍面临着前所未有的发展高压,销量不断萎缩,新品更新缓慢,这对于合资品牌而言,每一次销量数据的发布都堪称一场严峻“大
消息称某天玑9500工程机采用矩阵相机模组设计 - 天天要闻

消息称某天玑9500工程机采用矩阵相机模组设计

IT之家 7 月 10 日消息,博主 @数码闲聊站 今日曝光某天玑 9500 “大杯”工程机部分信息,预计来自 OPPO Find X9 Pro。据爆料,这款工程机采用左上角小方矩阵相机模组设计,“最顶一版”是 50Mp 1/1.
微软宣称AI节省5亿美元成本 裁员近万人 - 天天要闻

微软宣称AI节省5亿美元成本 裁员近万人

来源:环球网 【环球网科技综合报道】7月10日消息,据路透社报道,微软首席商务官Judson Althoff近日公开表示,人工智能工具正深刻改变公司内部运营模式,在销售、客户服务、软件工程等多个关键领域显著提升生产力。
乐动机器人港交所递交招股书:连续三年亏损,业务单一 - 天天要闻

乐动机器人港交所递交招股书:连续三年亏损,业务单一

近日,全栈式智能机器人企业乐动机器人正式向港交所递交招股书,并计划于港交所主板挂牌上市。乐动机器人成立于2017年11月,主要打造以视觉感知为核心的智能机器人基础设施并赋能各类智能机器人应用场景,同时提供适合新兴应用场景的视觉感知产品及整机