通常,翻譯系統的開發人員會在大量目標語言的書面文本上訓練 AI 模型。這為系統提供了許多不同的語言示例和組合,以產生最正確的結果。
總的來說,人工智能驅動的翻譯系統近年來有了很大的改進。現在比以往任何時候都更容易在線或在設備上獲得翻譯幫助,以更好地進行國際交流。
但此類系統的一個問題是翻譯過程存在延遲。例如,當系統記錄口語語音時,首先將單詞轉換為文本,然後由 AI 系統進行翻譯。然後,翻譯的單詞被轉換回語音,以便可以聽到。
Meta 項目的不同尋常之處在於,開發團隊沒有大量的閩南語文本來輸入人工智能系統。
福建話是漢語的一個版本或方言。中國東南部的福建省有數百萬人使用這種語言。台灣的許多人以及馬來西亞、新加坡和菲律賓的一些社區也使用這種語言。這種語言通常是世代相傳的。
Meta 指出,福建話是近 3,500 種主要使用且沒有廣泛使用的書寫系統的現存語言之一。該公司表示,其人工智能開發人員的目標是創建涵蓋世界上大多數語言的語音到語音翻譯工具。
今年早些時候,Meta 宣布了兩個新的人工智能項目。一種叫做“不忘語言”。扎克伯格在一段視頻中表示,努力旨在創建涵蓋“數百種”世界語言的翻譯系統。
另一種稱為通用語音翻譯器。該公司在一份聲明中表示,該項目的目標是建立一個能夠產生“所有語言的語音到語音翻譯”的系統。Meta 涉及福建話的最新系統是作為其通用語音翻譯項目的一部分而開發的。
扎克伯格說:“能夠以任何語言與任何人交流——這是人們夢寐以求的超級大國,人工智能將在我們有生之年實現這一點。”
Meta 表示,它使用了幾種不同的方法來創建新的系統來翻譯閩南語和英語。該團隊在來自另一個版本的中文普通話(類似於福建話)的書面文本示例上訓練其 AI 模型。
此外,Meta 開發人員使用了一種編碼工具,旨在將口語福建話與類似的英文文本進行比較。該團隊還與講閩南語的人密切合作,以確保結果正確。
Meta 表示,它的目標是使用與福建話相同的方法,在未來為更多語言創建語音到語音翻譯系統。
然而,該公司表示,其閩南語翻譯模式“仍在進行中”。它指出,該系統目前一次只能翻譯一個完整的句子。