跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗

2025年05月20日15:12:05 科學 1473

綜述

小時候你有沒有幻想過,自己可以像童話故事一樣聽懂動物的“語言”,自由自在地和各種動物實現交流?最近,谷歌的一項研究讓幻想照進現實。AI模型“DolphinGemma”橫空出世,成功破譯了海豚的“語言”。

這個僅有400M大小的AI模型,能直接在谷歌Pixel設備上運行。DeepMind的CEO哈薩比斯透露,下一個要破解的目標就是狗。不過,這個海豚語言模型的"詞彙量"究竟有多大?它真的能實現人類與海豚的跨物種對話嗎?

跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗 - 天天要聞

AI如何聽懂海豚

讓AI理解海豚的“語言”,原理上和教會AI理解人類語言類似。就好比你打字時,輸入法會猜測你下一個詞是什麼。谷歌的DolphinGemma也用了類似的邏輯,只不過它的學習對象是一連串海豚的哨聲,短脈衝和嘶鳴。

通過持續的訓練,DolphinGemma如同其他語言大模型學習人類語言那樣,從海量的海豚發聲數據中逐步摸索出了它們的"語法規則"。

跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗 - 天天要聞

這個模型的秘訣在於兩大核心技術。第一是SoundStream音頻分詞器,它就像給聲音配字幕的工具,能把海豚千變萬化的叫聲轉化為計算機看得懂的信號,精準“拆解”它們的發聲片段用以學習。

第二是基於序列預測的模型架構,它能分析這些聲音碎片之間的關係,試着預測海豚一段“對話”中下一個可能出現的音節。當然,其規則要比輸入法聯想複雜得多。

跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗 - 天天要聞

訓練模型的核心數據來自一個堅持了40年的研究項目:“野生海豚計劃”(WDP)。自1985年起,這個非營利組織的科學家就在巴哈馬群島追蹤一群大西洋斑點海豚,他們為每隻海豚命名,記錄活動軌跡,收集海量的水下音頻資料並分析整理,用於研究。

例如,研究人員發現斑點海豚母親會在幼崽覓食後,用特定的哨聲序列呼喚它們回家。正是無數個這些聲音與行為“配對”的案例,成了AI理解海豚世界的“啟蒙教材”。

未來,這個僅400M大小,能在手機上運行的模型將隨科學家潛入海底進行實時分析。屆時研究人員只需一部手機,AI就能即時"翻譯"海豚的交流內容,為海洋生物研究提供全新的技術支撐。

跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗 - 天天要聞

當前的局限性

雖然DolphinGemma的誕生是跨時代性的,但這並不代表人類真正地破譯了海豚的語言。

舉個簡單例子:當一個人類媽媽對孩子說“回家吃飯”,這句話不僅傳遞了“要求回家”這個明確信息,還可能隱含擔憂或催促的情緒信息。孩子回到家是吃紅燒肉還是“皮帶炒肉”,就隱藏在媽媽喊話的語氣中。

科學家當下只是破解了海豚發出某段聲音時,海豚在做什麼或將要做什麼的信息,簡單將為關聯了起來,至於海豚能否像人類一樣結合聲音創造抽象含義,比如在聲音中融入情緒,是 “回憶昨天的潮水”還是“提醒遠處有鯊魚”,科學家仍一無所知。

跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗 - 天天要聞

為了向真正的“交流”邁進,谷歌和WDP正在努力教會海豚新的“語言”。團隊開發了一套名為CHAT(鯨類動物聽力增強遙感)的系統,它能發出人工合成的類似海豚聲,每個聲音對應特定物品,比如海藻,海草或人類戴的圍巾。

比如,當研究者按下按鈕,設備發出類似海豚聲的同時,遞上一把海草。研究者希望通過這種方式,教會海豚新的“單詞”,海豚若能學會用同樣的聲音回應,就實現了原始的“語言教學”。

跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗 - 天天要聞

不過,當下技術仍面臨一道天然門檻:海豚也有“方言”。DolphinGemma的訓練數據全部來自巴哈馬群島的小型斑點海豚社群,但在其他海域的同類,可能會棲息環境不同演化出不同的發聲方式,AI模型若沒學過對應的“口音”,幾乎不可能聽懂。

為此,谷歌計劃在今年夏季開源DolphinGemma,鼓勵全球科學家上傳不同海域的海豚聲音數據,以豐富海豚語言的數據庫。

跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗 - 天天要聞

AI跨物種潛力

你可能會好奇:為什麼谷歌先盯上了海豚,而不是研究更常見的家養寵物貓或狗?這主要基於兩個關鍵原因。

首先是海豚高超的的“語言天賦”,它們的交流方式幾乎是動物中最接近我們人類的。海豚的發聲需要靠鼻腔附近一對特殊組織振動,原理類似人類的聲帶發聲;二是海豚有着堪比人類社會的複雜社會群落,成員會合作捕獵,照顧幼崽,甚至為去世的同伴哀鳴。

跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗 - 天天要聞

同時研究還發現,海豚能通過不同聲音的組合來表達複雜意圖,這與人類用句子傳遞信息的邏輯不謀而合。正是這種相似性讓海豚成為突破口,但AI的潛力遠不止於此。

比如CETI(鯨類翻譯倡議)項目,專門用於抹香鯨研究。抹香鯨通過類似摩斯電碼般,一連串的"噠噠"聲來交流,該項目已收集了60多頭抹香鯨的8000餘條聲音密碼,正在解析其中的規律。

跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗 - 天天要聞

又比如另一個研究團隊的“地球物種項目”,正在致力於利用AI,解碼大象,白鯨,烏鴉等更多物種的語言,以實現跨物種交流。當然,最值得期待的還是DeepMind團隊下一步計劃。團隊CEO哈薩比斯透露:“我想對話的下一個對象,就是我家的狗。”

相比海豚,狗與人類的互動更頻繁,收集數據也更方便。如果某天手機上裝個軟件,就能看懂自家狗子扒門是想散步還是餓了,這場面想想大概就讓無數寵物主人興奮無比了。

跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗 - 天天要聞

結尾

或許未來某天,你戴着智能設備去海洋館,不僅能看見海豚躍出水面的優美身姿,還能實時看到它們"對話"字幕:"日常打卡迎接兩腳獸,好無聊!""我為什麼不能和小美一個缸"...這樣的場景是不是比科幻電影還帶勁?

不過話說回來,動物語言被破譯,是否會導致人類濫用這種能力?比如用虛假信號引誘鯨群靠近漁船,或是強制改變動物的行為。科技讓我們離動物更近,在打開跨物種對話大門的同時,人類更要把握好這把"雙刃劍",讓科技來傳遞善意而非傷害。

跨物種交流被實現?谷歌突破海豚語言後,宣稱下一個會是狗 - 天天要聞

科學分類資訊推薦

如何用理論描述大腦神經系統的“預測能力”? - 天天要聞

如何用理論描述大腦神經系統的“預測能力”?

預測編碼理論認為:大腦不是被動地接收感官輸入,而是主動地預測即將到來的感官信息,並利用這些預測來指導知覺和行為。那麼應該如何為其進行建模呢? 撰文 | 黃振業(中國科學院理論物理研究所20....
被忽視的細胞,可能在記憶存儲中發揮重要作用 - 天天要聞

被忽視的細胞,可能在記憶存儲中發揮重要作用

人腦大約包含860億個神經元。這些細胞會發出電信號,在腦中承擔著至關重要的功能,不僅幫助存儲記憶,也負責在腦及整個神經系統中傳遞信息與指令。然而,並不是所有的腦細胞都是神經元。據估計,人腦中大約一半的細胞是神經膠質細胞,其中最主要的一類便是
牙齒最初不是用來咬東西的? - 天天要聞

牙齒最初不是用來咬東西的?

脊椎動物的牙齒從何而來?這是古生物學界長期未解的謎題。科學家們已經知道,牙齒起源於一種名叫齒突(odontodes)的結構——它們最初是古魚類的盔甲或外骨骼上隆起的小突起。但科學家仍不清楚牙齒的起源和功能為何。
快看!誕生過21項電力專利的“草根工坊”全面升級 - 天天要聞

快看!誕生過21項電力專利的“草根工坊”全面升級

極目新聞通訊員 陳蕖 龔雪瑋近日,“遠東匠創工坊”創新工作室在安山供電所竣工掛牌,標誌着國網武漢市江夏區供電公司第一間以員工名字命名的創新工作室正式誕生,是基層員工在相對艱苦條件下執着創新的生動縮影,也是公司關愛員工、點燃創新熱情的溫暖實踐。走進安山供電所大院,一間別緻的小門邊“遠東匠創工坊”標牌格外...
聽!黑洞的聲音?宇宙“聽”起來比“看”更帶勁 - 天天要聞

聽!黑洞的聲音?宇宙“聽”起來比“看”更帶勁

它聽起來像煙花爆竹的聲音,“砰”的一聲,然後響起“嗡嗡”的背景聲,很快這些聲音被像是衝擊波的聲音所取代。在這一波波的聲音之間,還有一些隨機的“嗶剝”聲。這是黑洞的聲音,具體來說,是一個距離地球約7800光年的黑洞恆星系統天鵝座V404。
今年全球唯一,祝賀許健民院士! - 天天要聞

今年全球唯一,祝賀許健民院士!

記者從中國氣象局了解到,瑞士日內瓦時間6月19日,世界氣象組織(WMO)執行理事會第79次屆會決定授予中國工程院院士許健民第70屆國際氣象組織(IMO)獎。許健民成為今年全球唯一一位獲獎者,同時也是第四位獲得這一國際最高氣象榮譽的中國科學家
2028年完成火星着陸!2031年帶回500克火星樣品! - 天天要聞

2028年完成火星着陸!2031年帶回500克火星樣品!

6月19日,國際權威學術期刊《Nature Astronomy》在線發表文章,系統介紹了我國火星取樣返回任務(天問三號)的科學目標、着陸點遴選、探測載荷配置與樣品實驗室需求等,為人類即將開展首次火星取樣返回描繪了發展前景。火星長期被視為地球