出品 | AI科技大本營(ID:rgznai100)
Meta 在近日的「用人工智能構建元宇宙」的討論會上,展示了最新的 AI 黑科技 「Builder Bot」 ,並且在此次會議上 Meta 公布了關於構建元宇宙的人工智能計劃,其中包括通用語言翻譯系統、對話 AI 系統CAIRaoke,人工智能推薦系統 TorchRec 等。
Builder Bot
在此次討論會上,扎克伯格分享了他們正在研究一類新的生成 AI 模型,該模型將允許人們描述一個世界,人工智能自動生成它的各個方面。首次展示了用人工智能系統 Builder Bot 創建虛擬空間的過程。
在元宇宙的島嶼上以 3D 化身的形式出現,並發出語音命令創建海灘等,該系統可以跟隨命令更改氣候,添加不同的場景。
在這個世界裡,你想要什麼、去到哪裡,只需要語音命令,就可以秒出。更有熱點的是,Builder Bot 還可以播放不同的音樂。
目前,Builder Bot 還在測試中,暫時還未開放,因為 Meta 也還不確定它的限制在哪。
在討論會上的另一部分是語音識別技術,Meta 表示正在研究人工智能,讓人們能夠與語音助手進行更自然的對話。
對話 AI 系統CAIRaoke
在演示中,CAIRaoke 在一個家庭場景中起到了作用,人在煮菜時,語音助手會發出提示,警告說鹽已經加到鍋里了。AI 助理還注意到鹽放少了,於是提示要加更多。
在 Meta 發布的博客中,研究者們對 CAIRaoke 背後的技術進行了解讀。CAIRaoke 減少了添加新域所需的工作。在規範方法中,擴展到新領域需要順序構建和更改每個模塊,然後才能可靠地訓練下一個模塊。此項技術提高了開發和訓練速度,使我們能夠以更少的數據微調其他模型。
該公司還表示,它已在旗下的視頻通話設備 Portal 中使用該模型,並期待將其集成到具有 AR 和 VR 的硬件設備中。
實時翻譯器
Meta 正在開發一款通用語音翻譯器,旨在創建適用於「世界上所有語言」的翻譯軟件。該公司此前已為其人工智能系統設定了翻譯所有書面語言的目標。
扎克伯格表示:“能夠用任何語言與任何人交流,這是人們夢寐以求的超能力,而人工智能將在我們有生之年實現這一目標。”
儘管當前的翻譯工具可以很好地適用於英語、普通話、西班牙語等常用語言,但世界上大約 20% 的人口不會說這些系統所涵蓋的語言。通常,這些服務不足的語言沒有易於訪問的書面文本語料庫,這些語料庫也是訓練 AI 系統必需的,甚至一些語言根本沒有標準化的書寫系統。
Meta 表示,它希望通過在兩個特定領域部署新的機器學習技術來克服這些挑戰。第一個稱為 No Language Left Behind,將專註於構建可以使用更少的訓練示例學習翻譯語言的 AI 模型。第二個是通用語音翻譯器,旨在構建直接將語音從一種語言實時翻譯成另一種語言的系統,而無需書面組件作為中介(書面中介是許多翻譯應用程序的常用技術)。
Meta 正在構建一個新的高級 AI 模型,可以從更少的示例中進行語言學習,Meta 將使用它來實現數百種語言的專家級翻譯,從阿斯圖里亞斯語、盧甘達語到烏爾都語。Meta 還在構建新型通用實時語音翻譯器,以支持沒有標準書寫系統的語言及口頭語言。
為了支持低資源語言的翻譯,並為未來更多語言的翻譯創建構建塊,Meta 正在擴展自身的自動數據集創建技術。一種是基於 LASER,一個是開源工具包,現在包含用 28 種不同腳本編寫的超過125種語言。基於 LASER ,研究者構建了 ccMatrix 和 ccAligned 等系統,它們能夠在互聯網上查找不同語言的平行文本。由於低資源語言的可用數據很少,Meta 創建了一種新的訓練方法,使 LASER 能夠專註於特定的語言子組,例如班圖語,並從更小的數據集中學習。
這使得 LASER 能夠跨語言大規模有效地運行,最近還將 LASER 擴展到了語音處理領域。
為了提升機器翻譯模型的性能,投入大量資源創建了大容量且可以高效訓練的模型。通過增加模型體量和自動路徑學習功能,不同的符號可以使用不同的專家能力。為了將基於文本的機器翻譯模型擴展到上百種語言,Meta 提取了另一種以語言為核心的多語言翻譯系統,其效果甚至優於最好的雙語翻譯。
在宣布這一消息的博客文章中,Meta 研究人員還沒有提供完成這些項目的時間表,也沒有提供實現目標的主要路線圖。相反,該公司只是強調了通用語言翻譯的可能性。
Meta 還設想這種技術將極大造福於其遍布全球的產品,進一步擴大其影響範圍並轉變為數百萬人必不可少的通信工具。正如博客文章寫到的那樣,通用翻譯軟件將成為未來可穿戴設備的殺手級應用,如 Meta 正在構建的 AR 眼鏡,還將打破沉浸式VR 和 AR 現實空間(Meta 也在構建)的界限。
結語
確實,近年來機器學習的進步大幅度地提高了機器翻譯的速度和準確性。從谷歌到蘋果,許多大型科技公司現在都在為用戶提供免費的人工智能翻譯工具,用於工作和旅遊,無疑在全球範圍內都提供了不可估量的好處。
但也會存在一些技術上的問題,批評者指出機器翻譯會忽略在人類說話時的一些至關重要的細微差別,在輸出中會存在一些偏見,並且指出只有計算機才能出現的一些奇怪的、意向不到的語法錯誤。對於使用非通用語言的人表示,如果翻譯完全由大型科技公司控制,他們擔心失去對自己語言和文化的掌握。
儘管 Meta 長期以來一直渴望進入全球市場,但該公司自己的產品仍然偏向於為其提供大部分收入的國家/地區。
雖然通用翻譯器是一個非常美好的願望,但 Meta 不僅需要證明它的技術和能力,作為一家公司,還需要公平地研究其應用。
在此次討論會上,收穫的信息還是滿滿的,對此,你怎麼看呢?
參考鏈接:
https://www.theverge.com/2022/2/23/22947368/meta-facebook-ai-universal-speech-translation-project
https://ai.facebook.com/blog/teaching-ai-to-translate-100s-of-spoken-and-written-languages-in-real-time
https://www.reuters.com/technology/metaverse-event-metas-zuckerberg-unveils-work-improve-how-humans-chat-ai-2022-02-23/