從“竊聽”到“回應”：AI解碼動物語言新突破，未來能否與動物談心？

2025年10月03日16:40:14 科學 8261

《自然》雜誌撰文指出，人工智能（ai）在動物語音通信領域取得突破，揭示了靈長類、鯨魚和鳥類等物種擁有複雜的叫聲模式，這些模式在結構和功能上正逐步展現出接近人類語言的特徵。

這一進展不僅挑戰了“人類語言獨特性”的傳統認知，也引發了關於動物認知能力及跨物種對話可能性的廣泛討論。科學家正將ai技術與實地觀察結合，加速揭開動物世界的“語言之謎”，這將革命性地影響生態保護和人類對智能生命的定義。

法國雷恩大學的梅麗莎・貝爾泰對倭黑猩猩進行研究

法國雷恩大學的梅麗莎・貝爾泰（mélissa berthet）研究發現，倭黑猩猩能像人類一樣，通過巧妙組合不同叫聲進行交流。這一成果不僅依賴貝爾泰的細緻觀察，更得益於現代錄音和數據分析工具的輔助。

在長達六個月的觀察中，貝爾泰發現倭黑猩猩會組合叫聲形成複雜“短語”。例如，它們會結合表示“讓我們一起做”的“yelp”和表示“看我”的“grunt”，傳達類似“看看我在做什麼，我們一起來完成吧！”的合作含義。

另一個案例是，倭黑猩猩會將表示“我想做這個”的“peep”與表示“讓我們待在一起”的“whistle”組合，用於緩解群體衝突或分離重聚等敏感社交情境。

倭黑猩猩這種“叫聲含義依賴上下文”的特性，與人類語言的“語境影響語義”高度相似，進一步模糊了人類與動物通信的界限。貝爾泰於今年4月發表在《科學》雜誌上的研究，有力證明了非人類動物語音通信的複雜性。

目前，研究者已在多種物種中發現了曾被視為人類語言“定義性特徵”的發聲模式。這些發現促使學界對“語言”的定義進行重新思考。貝爾泰團隊通過記錄700次倭黑猩猩叫聲，構建了首個完整的倭黑猩猩“叫聲詞典”，系統梳理了叫聲類型和組合規則，為後續利用ai解碼動物語言提供了基礎。

隨着動物通信複雜性的揭示，科學家們開始利用ai加速解讀動物叫聲。加州伯克利“地球物種計劃”的大衛・羅賓遜指出，ai能通過機器學習算法分析海量音頻數據，精準識別其中微妙的模式變化，甚至在噪聲環境中也能有效處理信號，顯著擴展了動物語言研究的範圍。

研究的下一步目標是藉助ai實現與動物的“回應式互動”，從而開啟人類與動物對話的新時代，並為生態保護提供新思路（如通過解讀鯨魚信號避免船隻碰撞）。然而，這一前景也引發了關於人類是否應干預動物自然行為的倫理討論**。

01 組合叫聲：動物語言的“語法雛形”

倭黑猩猩能夠通過巧妙組合不同叫聲，開展類似人類對話的交流活動

研究動物通信的科學家正以與語言學家相似的視角，探索動物語音產生、聲音組合與“短語”結構，這為理解動物是否具備類似人類的語言構建機制提供了新線索。

大約十年前，“組合性”（compositionality），即通過組合有意義的聲音形成衍生意義表達的能力，被普遍視為人類語言和認知的標誌性特徵。然而，一系列研究徹底改變了這一認知。

2016年，日本山雀的研究首次清晰證明了動物叫聲的“組合性”。山雀將“警戒”和“召集”兩種叫聲按特定順序組合時，會同時表現出“警戒”與“聚集”兩種行為；順序顛倒則不會有類似反應。這類似於人類語言中“詞序影響語義”**的規律，暗示了鳥類認知能力的保守性。

2023年的黑猩猩研究進一步拓展了該發現。科學家發現，黑猩猩面對模擬捕食者時，會組合“警報”與“召集”叫聲，促使其他成員迅速聚集，共同應對威脅，顯示出類似人類部落“警報系統”的協作通信策略。

儘管存在這些發現，學界仍長期認為人類是唯一能以多種方式運用“組合性”（如改變詞序、創造習語）的物種。但貝爾泰及其團隊對倭黑猩猩的研究削弱了這一界限。

研究發現，倭黑猩猩能以四種方式組合有限的叫聲類型。除了意義為簡單疊加的“簡單組合性”（如“yelp–grunt”），它們還能展現“非簡單組合性”。例如，一種叫聲可以修飾另一種叫聲的含義，類似於人類語言中“糟糕的演員”的表達邏輯。貝爾泰認為，這種能力暗示倭黑猩猩的認知可能比以往認知更接近人類，甚至可能反映了人類與倭黑猩猩共同祖先的語言潛力。

2025年，塞德里克・吉拉爾-布托茲（cédric girard-buttoz）團隊對黑猩猩的研究也得出相似結論。他們發現黑猩猩能以多種方式組合叫聲，且部分組合短語的意義無法從單一叫聲中推導，與人類習語完全一致。例如，將“在地上休息”的“hoot”與“玩耍和親密關係”的“pant”組合，竟能促使群體成員“爬上樹、築巢並共同休息”。

吉拉爾-布托茲認為，這種“通過多種方式生成新意義”的能力是語言的核心基石，它可能源於人類與黑猩猩的共同進化祖先。

02 鯨魚語言：海洋中的“複雜通信系統”

科學家們使用無人機將能夠收集生物聲學和其他數據的傳感器附着在抹香鯨身上

除了靈長類動物，鯨魚的語言同樣展現出類似人類語言的顯著特徵。美國非營利組織“鯨魚通信項目”（project ceti）正在加勒比海跟蹤和記錄抹香鯨（physeter macrocephalus）的運動與聲音信號，構建龐大數據集，旨在通過關聯“鯨魚聲音”與“行為”來“翻譯”它們的語言。

該跨學科項目利用ai、無人機和水下傳感器等技術，探索抹香鯨的社會結構、文化變異，以及不同鯨群間可能存在的“方言”差異。

與人類通過聲帶發聲不同，抹香鯨依靠鼻腔中的唇狀結構振動空氣，發出“click”（咔嗒）聲。這些“click”聲進一步組合成被稱為“coda”（尾音）的通信單位。ceti的語言學家加斯珀・貝古什團隊發現，“coda”並非簡單信號，而是攜帶了節奏、語調等豐富信息，類似於人類對話的“抑揚頓挫”，可能對應抹香鯨的情感或意圖傳遞。

科學家們去年的研究指出，抹香鯨擁有專屬的“語音字母表”，不同的“coda”在節奏和速度上存在顯著差異。貝古什團隊進一步發現，抹香鯨的“coda”在部分特徵上與人類語言中的元音、雙元音高度相似。

人類元音因舌頭和唇形變化產生差異，雙元音則結合兩個元音產生頻率變化。抹香鯨的“coda”表現出類似的複雜性。團隊識別出兩種具有不同音型的“coda”，命名為“a-元音”與“i-元音”。這兩種“元音”的頻率變化存在上升、下降等四種模式**，被認為可能表明抹香鯨的“coda”中存在類似人類雙元音的結構。

這一發現不僅豐富了人類對海洋哺乳動物認知能力的理解，也為ai技術生成“鯨魚叫聲”、實現與鯨魚的雙向互動奠定了重要基礎。

03 語言的本質：動物通信能否被定義為“語言”？

動物通信是否算“語言”，既取決於“語言”的定義，也與對動物思維能力的認知相關。貝古什指出學界主要有兩種對立觀點：

第一種觀點認為，語言與複雜思維緊密相連，複雜思維先於語言，是語言的源頭。該觀點源自喬姆斯基的“生成語法理論”，強調人類語言的先天性與獨特性。若此觀點成立，動物若缺乏複雜思維，就無法擁有真正的“語言”。

已去世的倭黑猩猩 kanzi

第二種觀點則將語言視為眾多通信方式的一種，與手勢、面部表情類似，無需依賴複雜思維。按此邏輯，即便動物無複雜思維，也可能有自身“語言”。對已去世的倭黑猩猩 kanzi的研究為此提供了部分支撐，kanzi曾被證明能學習人類溝通語言。但學界普遍認為，“動物實驗室學人類語言”與“野外自然用自身語言” 是兩回事，這類實驗雖有爭議，卻為跨物種學習研究和動物權利哲學辯論提供了思路。

羅賓遜坦言，目前無法確定動物中是否存在完整語言體系，但ai技術正加速該領域研究，藉助大數據與神經網絡，人類或很快能在動物語言解碼上取得突破。

當前，人類語言的部分核心特徵尚未在其他物種中明確發現。語言學家霍克特提出的人類語言16個關鍵特徵中，“位移性”、“生產性”、“雙重性”尚未在非人類動物中明確識別，不過近年研究顯示動物可能在部分方面接近這些特徵：

位移性：指能討論過去、未來、遙遠事物及抽象概念。目前雖有間接證據，如海豚可能呼喚多年前消失的同伴“名字”、猩猩可能“討論”此前出現的捕食者，但這些多為軼事性證據，缺乏足夠實證，無法排除“巧合”或“簡單記憶”的可能。
生產性：指能說出或理解從未聽過的新表達，需個體能無限生成新聲音組合。目前僅人類明確具備此能力，但ai模擬技術或為測試動物“生產性潛力”提供新途徑。
雙重性：指語言由“無意義小聲音單位”組合成“有意義信息單位”。儘管抹香鯨會用 “click”聲組合成“coda”，但尚未證明“click”無意義而“coda”有明確意義，未來ai深度分析或能澄清這一問題，構建更精確的鯨魚聲學模型。

此外，“遞歸性”也被認為可能是人類語言的獨特特徵，即通過在句子中嵌入短語創造更深層意義。德國學者戴安娜・廖通過訓練烏鴉在觸摸屏上按正確順序啄選括號，發現烏鴉具備遞歸心理能力，表現優於獼猴，接近人類幼兒水平。

另一個關鍵爭議是動物是否有定義語音通信結構的 “語法規則”。儘管靈長類動物已被證明能通過組合叫聲產生不同意義，但吉拉爾 - 布托茲指出，其 “意義數量” 遠不及人類語言。不過，隨着研究積累，這一差距可能縮小，推動人類重新評估生命的智能多樣性。

未來，隨着ai工具升級，人類或能真正實現與動物“對話”，推動人與自然和諧共處。（文/騰訊科技特約編譯無忌，編輯/涵清）