Google計劃建立巨型人工智慧語言模型 支持全球1000種最常用的語言

2022年11月03日01:33:20 科技 1786

Google宣布了一個雄心勃勃的新項目,開發一個支持世界上"1000種最常用語言"的單一AI語言模型。作為實現這一目標的第一步,該公司公布了一個經過400多種語言訓練的人工智慧模型,它將其描述為"今天在一個語音模型中看到的最大的語言覆蓋範圍"。

Google計劃建立巨型人工智慧語言模型 支持全球1000種最常用的語言 - 天天要聞

語言和人工智慧可以說一直是Google產品的核心,但最近機器學習的進步--特別是強大的、多功能的"大型語言模型"或LLM的開發--使這些領域得到了新的重視。

Google已經開始將這些語言模型整合到Google搜索等產品中。但語言模型有許多缺陷,包括傾向於轉述有害的社會偏見,如種族主義和仇外心理,以及無法以人類的敏感性來解析語言。在自己的研究人員發表了概述這些問題的論文後,Google自己也臭名昭著地解僱了他們。

不過,這些模型能夠完成許多任務,從語言生成(如OpenAI的GPT-3)到翻譯(見Meta的"不遺漏語言"工作)。Google的"1000種語言計劃"並不專註於任何特定的功能,而是要創建一個具有世界上各種語言的巨大知識廣度的單一系統。

Google人工智慧研究副總裁Zoubin Ghahramani說,該公司認為,創建一個如此規模的模型將使其更容易將各種人工智慧功能帶到在線空間和人工智慧訓練數據集中表現不佳的語言(也被稱為"低資源語言")。

"語言就像生物體,它們是相互演化而來的,它們有某些相似之處。通過讓一個單一的模型接觸並訓練許多不同的語言,我們在低資源語言上得到更好的表現,"Ghahramani說。"我們達到1000種語言的方法不是通過建立1000種不同的模型。語言就像生物體,它們是相互進化的,它們有某些相似之處。而且,當我們將一種新語言的數據納入我們的1000種語言模型,並獲得將[它所學到的東西]從一種高資源語言轉化為低資源語言的能力時,我們可以在我們所謂的零點學習中找到一些相當驚人的進展。"

過去的研究顯示了這種方法的有效性,而Google計劃中的模型的規模可以提供比過去的工作更多的收益。這種大規模的項目已經成為科技公司主導人工智慧研究雄心的典型,並利用了這些公司在獲得大量計算能力和訓練數據方面的獨特優勢。一個類似的項目是Facebook母公司Meta正在嘗試建立一個"通用語音翻譯器"。

Google表示,為了支持1000種語言模型的工作,它將資助收集低資源語言的數據,包括音頻記錄和書面文本。

該公司表示,它沒有直接計劃在哪裡應用這個模型的功能--只是預計它將在Google的產品中具有一系列用途,從Google翻譯到YouTube字幕等等。

"同樣的語言模型可以將機器人的命令變成代碼;它可以解決數學問題;它也可以進行翻譯。關於大型語言模型和一般的語言研究,真正有趣的事情之一是它們可以做很多很多不同的任務,"Ghahramani說。"語言模型真正有趣的地方在於它們正在成為大量知識的儲存庫,通過以不同的方式探測它們,你可以獲得不同的有用功能。"

Google在一個新的人工智慧產品展示會上宣布了1000種語言模型。該公司還分享了關於文本到視頻模型的新研究,一個名為Wordcraft的人工智慧寫作助手原型,以及對其人工智慧測試廚房應用程序的更新,該應用程序允許用戶有限地訪問正在開發的人工智慧模型,如其文本到圖像模型Imagen。

科技分類資訊推薦

美團不怕京東,但怕淘寶 - 天天要聞

美團不怕京東,但怕淘寶

出品|新品略財經 作者|吳文武 淘寶閃購再加碼猛攻,美團罕見大動員應戰,京東外賣最新再加碼,美團或許不怕京東,但怕淘寶,背後的即時零售新大戰,互聯網巨頭們都想贏。 01....
的修報修系統——一站式智能後勤管理SaaS平台 - 天天要聞

的修報修系統——一站式智能後勤管理SaaS平台

的修報修系統——一站式智能後勤管理SaaS平台 為5000+機構提供數字化轉型解決方案核心優勢 ✔ 全渠道報修接入:微信/企業微信/釘釘/小程序/二維碼/PC端/的修APP等多端覆蓋 ✔ 智能工單調度:手動派單、自動派單、搶單模式靈活適配各
2025 差旅服務平台排行榜:中國五大差旅平台 - 天天要聞

2025 差旅服務平台排行榜:中國五大差旅平台

隨著金稅四期全面落地與企業數字化轉型加速,差旅管理已從單純的 「出行預訂」 升級為 「合規管控 + 成本優化 + 效率提升」 的綜合性管理場景。數據顯示,2024 年國內企業差旅支出規模突破 8000 億元,其中因流程繁瑣、合規疏漏造成的隱性成本佔比超 15%。如何通過平台選型實現 「降本、提效、合規」 三位一體?本文基於 2...
是德科技年度技術盛會:5G、6G、AI需要「三融發展」 - 天天要聞

是德科技年度技術盛會:5G、6G、AI需要「三融發展」

IT時報記者 沈毅斌回望中國通信產業的演進歷程,4G快速發展,讓人們體驗到移動互聯網的便捷;5G橫空出世,以其高速率、低時延、大帶寬的特性,為智能工廠、自動駕駛等新興產業帶來無限可能;如今5G-A(5G Advanced)的逐步推進,進一步拓展5G的應用邊界……通信技術不斷迭代中,6G悄然走來,卻又面臨著諸多挑戰與不確定性。...
1-5月全球動力電池裝車量TOP10 - 天天要聞

1-5月全球動力電池裝車量TOP10

韓國市場研究機構SNE Research公布的最新數據顯示,今年1-5月,全球動力電池裝車量達到401.3GWh,同比增長38.5%。中國電池企業繼續保持全球主導地位,共有6家企業入榜前十,裝車量總計274.7GWh,市場份額達到了68.4
有點離譜了,Windows上用iOS,還有一鍵整合包? - 天天要聞

有點離譜了,Windows上用iOS,還有一鍵整合包?

近期關於蘋果新聞的爆料是越來越多,就連之前都不怎麼發聲的質量檢測環節,也出現在新聞上了,邀請媒體進行參觀。(水刑)另外就是iPhone17和iPhone18以及20周年紀念版的「假想圖」,在網上也是一大堆。
晶元封裝企業案例分析——長電科技 - 天天要聞

晶元封裝企業案例分析——長電科技

歡迎關注下方公眾號阿寶1990,本公眾號專註於自動駕駛和智能座艙,每天給你一篇汽車乾貨,我們始於車,但不止於車。封裝是晶元製造產業鏈中的關鍵環節,處於產業鏈下游位置,在提升晶元性能、連接內外電路及促進產業發展等方面都發揮著重要作用,國內公司通過多年深耕,在封裝產業的佔比相對其他環節具有了更大的優勢。今天...
從華為到中國移動,為何行業巨頭頻頻將生態大會放在成都? - 天天要聞

從華為到中國移動,為何行業巨頭頻頻將生態大會放在成都?

今年以來,一系列國際性、行業性活動落地成都。成都全市對外開放發展大會餘音未落,2025成都國際友城合作與發展大會、第二十屆中國西部國際博覽會氛圍正濃,第二屆「一帶一路」科技交流大會、2025「投資成都」全球招商大會接踵而至……如同頂流明星演唱會帶來更多的遊客,國際性會議活動則吸引行業企業巨頭齊聚成都。 7月9...