通常,翻译系统的开发人员会在大量目标语言的书面文本上训练 AI 模型。这为系统提供了许多不同的语言示例和组合,以产生最正确的结果。
总的来说,人工智能驱动的翻译系统近年来有了很大的改进。现在比以往任何时候都更容易在线或在设备上获得翻译帮助,以更好地进行国际交流。
但此类系统的一个问题是翻译过程存在延迟。例如,当系统记录口语语音时,首先将单词转换为文本,然后由 AI 系统进行翻译。然后,翻译的单词被转换回语音,以便可以听到。
Meta 项目的不同寻常之处在于,开发团队没有大量的闽南语文本来输入人工智能系统。
福建话是汉语的一个版本或方言。中国东南部的福建省有数百万人使用这种语言。台湾的许多人以及马来西亚、新加坡和菲律宾的一些社区也使用这种语言。这种语言通常是世代相传的。
Meta 指出,福建话是近 3,500 种主要使用且没有广泛使用的书写系统的现存语言之一。该公司表示,其人工智能开发人员的目标是创建涵盖世界上大多数语言的语音到语音翻译工具。
今年早些时候,Meta 宣布了两个新的人工智能项目。一种叫做“不忘语言”。扎克伯格在一段视频中表示,努力旨在创建涵盖“数百种”世界语言的翻译系统。
另一种称为通用语音翻译器。该公司在一份声明中表示,该项目的目标是建立一个能够产生“所有语言的语音到语音翻译”的系统。Meta 涉及福建话的最新系统是作为其通用语音翻译项目的一部分而开发的。
扎克伯格说:“能够以任何语言与任何人交流——这是人们梦寐以求的超级大国,人工智能将在我们有生之年实现这一点。”
Meta 表示,它使用了几种不同的方法来创建新的系统来翻译闽南语和英语。该团队在来自另一个版本的中文普通话(类似于福建话)的书面文本示例上训练其 AI 模型。
此外,Meta 开发人员使用了一种编码工具,旨在将口语福建话与类似的英文文本进行比较。该团队还与讲闽南语的人密切合作,以确保结果正确。
Meta 表示,它的目标是使用与福建话相同的方法,在未来为更多语言创建语音到语音翻译系统。
然而,该公司表示,其闽南语翻译模式“仍在进行中”。它指出,该系统目前一次只能翻译一个完整的句子。