Google计划建立巨型人工智能语言模型 支持全球1000种最常用的语言

2022年11月03日01:33:20 科技 1786

Google宣布了一个雄心勃勃的新项目,开发一个支持世界上"1000种最常用语言"的单一AI语言模型。作为实现这一目标的第一步,该公司公布了一个经过400多种语言训练的人工智能模型,它将其描述为"今天在一个语音模型中看到的最大的语言覆盖范围"。

Google计划建立巨型人工智能语言模型 支持全球1000种最常用的语言 - 天天要闻

语言和人工智能可以说一直是Google产品的核心,但最近机器学习的进步--特别是强大的、多功能的"大型语言模型"或LLM的开发--使这些领域得到了新的重视。

Google已经开始将这些语言模型整合到Google搜索等产品中。但语言模型有许多缺陷,包括倾向于转述有害的社会偏见,如种族主义和仇外心理,以及无法以人类的敏感性来解析语言。在自己的研究人员发表了概述这些问题的论文后,Google自己也臭名昭著地解雇了他们。

不过,这些模型能够完成许多任务,从语言生成(如OpenAI的GPT-3)到翻译(见Meta的"不遗漏语言"工作)。Google的"1000种语言计划"并不专注于任何特定的功能,而是要创建一个具有世界上各种语言的巨大知识广度的单一系统。

Google人工智能研究副总裁Zoubin Ghahramani说,该公司认为,创建一个如此规模的模型将使其更容易将各种人工智能功能带到在线空间和人工智能训练数据集中表现不佳的语言(也被称为"低资源语言")。

"语言就像生物体,它们是相互演化而来的,它们有某些相似之处。通过让一个单一的模型接触并训练许多不同的语言,我们在低资源语言上得到更好的表现,"Ghahramani说。"我们达到1000种语言的方法不是通过建立1000种不同的模型。语言就像生物体,它们是相互进化的,它们有某些相似之处。而且,当我们将一种新语言的数据纳入我们的1000种语言模型,并获得将[它所学到的东西]从一种高资源语言转化为低资源语言的能力时,我们可以在我们所谓的零点学习中找到一些相当惊人的进展。"

过去的研究显示了这种方法的有效性,而Google计划中的模型的规模可以提供比过去的工作更多的收益。这种大规模的项目已经成为科技公司主导人工智能研究雄心的典型,并利用了这些公司在获得大量计算能力和训练数据方面的独特优势。一个类似的项目是Facebook母公司Meta正在尝试建立一个"通用语音翻译器"。

Google表示,为了支持1000种语言模型的工作,它将资助收集低资源语言的数据,包括音频记录和书面文本。

该公司表示,它没有直接计划在哪里应用这个模型的功能--只是预计它将在Google的产品中具有一系列用途,从Google翻译到YouTube字幕等等。

"同样的语言模型可以将机器人的命令变成代码;它可以解决数学问题;它也可以进行翻译。关于大型语言模型和一般的语言研究,真正有趣的事情之一是它们可以做很多很多不同的任务,"Ghahramani说。"语言模型真正有趣的地方在于它们正在成为大量知识的储存库,通过以不同的方式探测它们,你可以获得不同的有用功能。"

Google在一个新的人工智能产品展示会上宣布了1000种语言模型。该公司还分享了关于文本到视频模型的新研究,一个名为Wordcraft的人工智能写作助手原型,以及对其人工智能测试厨房应用程序的更新,该应用程序允许用户有限地访问正在开发的人工智能模型,如其文本到图像模型Imagen。

科技分类资讯推荐

美团不怕京东,但怕淘宝 - 天天要闻

美团不怕京东,但怕淘宝

出品|新品略财经 作者|吴文武 淘宝闪购再加码猛攻,美团罕见大动员应战,京东外卖最新再加码,美团或许不怕京东,但怕淘宝,背后的即时零售新大战,互联网巨头们都想赢。 01....
的修报修系统——一站式智能后勤管理SaaS平台 - 天天要闻

的修报修系统——一站式智能后勤管理SaaS平台

的修报修系统——一站式智能后勤管理SaaS平台 为5000+机构提供数字化转型解决方案核心优势 ✔ 全渠道报修接入:微信/企业微信/钉钉/小程序/二维码/PC端/的修APP等多端覆盖 ✔ 智能工单调度:手动派单、自动派单、抢单模式灵活适配各
2025 差旅服务平台排行榜:中国五大差旅平台 - 天天要闻

2025 差旅服务平台排行榜:中国五大差旅平台

随着金税四期全面落地与企业数字化转型加速,差旅管理已从单纯的 “出行预订” 升级为 “合规管控 + 成本优化 + 效率提升” 的综合性管理场景。数据显示,2024 年国内企业差旅支出规模突破 8000 亿元,其中因流程繁琐、合规疏漏造成的隐性成本占比超 15%。如何通过平台选型实现 “降本、提效、合规” 三位一体?本文基于 2...
是德科技年度技术盛会:5G、6G、AI需要“三融发展” - 天天要闻

是德科技年度技术盛会:5G、6G、AI需要“三融发展”

IT时报记者 沈毅斌回望中国通信产业的演进历程,4G快速发展,让人们体验到移动互联网的便捷;5G横空出世,以其高速率、低时延、大带宽的特性,为智能工厂、自动驾驶等新兴产业带来无限可能;如今5G-A(5G Advanced)的逐步推进,进一步拓展5G的应用边界……通信技术不断迭代中,6G悄然走来,却又面临着诸多挑战与不确定性。...
1-5月全球动力电池装车量TOP10 - 天天要闻

1-5月全球动力电池装车量TOP10

韩国市场研究机构SNE Research公布的最新数据显示,今年1-5月,全球动力电池装车量达到401.3GWh,同比增长38.5%。中国电池企业继续保持全球主导地位,共有6家企业入榜前十,装车量总计274.7GWh,市场份额达到了68.4
有点离谱了,Windows上用iOS,还有一键整合包? - 天天要闻

有点离谱了,Windows上用iOS,还有一键整合包?

近期关于苹果新闻的爆料是越来越多,就连之前都不怎么发声的质量检测环节,也出现在新闻上了,邀请媒体进行参观。(水刑)另外就是iPhone17和iPhone18以及20周年纪念版的“假想图”,在网上也是一大堆。
芯片封装企业案例分析——长电科技 - 天天要闻

芯片封装企业案例分析——长电科技

欢迎关注下方公众号阿宝1990,本公众号专注于自动驾驶和智能座舱,每天给你一篇汽车干货,我们始于车,但不止于车。封装是芯片制造产业链中的关键环节,处于产业链下游位置,在提升芯片性能、连接内外电路及促进产业发展等方面都发挥着重要作用,国内公司通过多年深耕,在封装产业的占比相对其他环节具有了更大的优势。今天...
从华为到中国移动,为何行业巨头频频将生态大会放在成都? - 天天要闻

从华为到中国移动,为何行业巨头频频将生态大会放在成都?

今年以来,一系列国际性、行业性活动落地成都。成都全市对外开放发展大会余音未落,2025成都国际友城合作与发展大会、第二十届中国西部国际博览会氛围正浓,第二届“一带一路”科技交流大会、2025“投资成都”全球招商大会接踵而至……如同顶流明星演唱会带来更多的游客,国际性会议活动则吸引行业企业巨头齐聚成都。 7月9...