跨物種的交流—AI幫助人類聽懂海豚之聲
2025/4/15 中午12:53
文/格洛克·海因萊茵博士(發表於2025/4/15)
在人類與動物之間建立對話,長久以來一直是科學家與科幻愛好者的夢想。海豚,這種以高智商與複雜聲音交流聞名的海洋生物,更是跨物種溝通研究的核心對象。
2025年4月,Google執行長Sundar Pichai宣布了一項突破性計畫:DolphinGemma,一個專為解碼海豚聲音模式設計的AI語言模型(LLM)。這項技術不僅讓我們更接近「聽懂」海豚的可能,也為跨物種溝通開啟了全新篇章。
AI與海豚的初次對話
DolphinGemma是一款基於Google Gemma模型開發的AI,擁有約4億個參數,規模雖小,卻足以在Google Pixel 9手機上運行,甚至能直接在海洋環境中進行實地研究。這個模型的訓練數據來自「野生海豚計畫」 (Wild Dolphin Project, WDP),一個長達40年專注於大西洋斑點海豚(Stenella frontalis)聲音與行為研究的組織。WDP 累積了大量海豚聲音數據,涵蓋哨聲、咔嗒聲與爆破聲等多種聲音模式,但這些數據若靠人工分析,估計需要150年才能完成。而DolphinGemma的出現,讓這一切變得可能。
DolphinGemma的核心目標是學習海豚的聲音模式,並預測牠們接下來可能發出的聲音。簡單來說,這就像教AI去「猜測」海豚的下一句話。為了實現這一點,Google與喬治亞理工學院合作,結合了一套名為CHAT(Cetacean Hearing Augmentation Telemetry)的系統。CHAT 能讓研究者在水中播放人工合成的海豚聲音,例如與特定物件(如海草或圍巾)相關聯的哨聲,然後觀察海豚是否會模仿這些聲音來「索取」物件。這樣的互動就像建立了一個簡化的共享詞彙,讓人類與海豚之間的對話成為可能。
海豚語言之謎
海豚的聲音交流系統極其複雜,牠們使用哨聲來表達身份、情緒或社交意圖,使用咔嗒聲進行回聲定位,甚至可能用爆破聲表達情緒起伏。科學家長期以來試圖解碼這些聲音,探討海豚是否擁有類似人類語言的結構。然而,這個問題至今仍充滿爭議。一些專家認為,海豚的聲音只是單純的信號(signals),用來傳遞特定訊息,但缺乏人類語言的語法與無限結構;另一些研究者則相信,海豚的溝通可能具有更高層次的複雜性。
DolphinGemma的出現為破解這個謎團提供了新工具。通過分析數十年的聲音數據,AI能辨識出海豚聲音中的模式,甚至預測牠們的行為。例如,當一隻海豚發出某種特定的哨聲後,DolphinGemma可以推測這是否與社交互動、覓食或警告相關。這樣的技術不僅加速了數據分析,也讓科學家能更精確地設計實驗,進一步探索海豚的溝通邏輯。
跨物種溝通的未來
DolphinGemma的潛力遠不止於此。Google計劃在2025年夏天將這個模型以開放形式釋出,供全球研究者使用。這意味著未來的科學家可能利用DolphinGemma研究其他種類的海豚(如瓶鼻海豚或飛旋海豚),甚至應用於其他鯨類動物,例如抹香鯨或座頭鯨。隨著更多研究者加入,這項技術可能幫助我們建立一個更廣泛的跨物種溝通框架。
然而,這項技術也帶來了一些挑戰與倫理問題。首先,AI的預測是否真正反映了海豚的意圖?如果我們誤解了海豚的聲音,可能會對牠們的自然行為造成干擾。其次,跨物種溝通的目標究竟是什麼?是為了滿足人類的好奇心,還是為了保護這些海洋生物及其棲息地?這些問題需要在技術發展的同時,與倫理學家和生態學家共同探討。
從夢想到現實
DolphinGemma只是跨物種溝通旅程中的第一步,但它已經展現了AI在科學研究中的巨大潛力。從解碼海豚的聲音模式,到建立人與動物之間的對話橋樑,這項技術讓我們重新思考人類與自然界的關係。正如WDP創始人Denise Herzing博士所說:
「我們花了30年才開始理解海豚的語言,而AI讓我們在幾年內就取得了巨大進展。」
或許有一天,我們能真正「聽懂」海豚,甚至與牠們進行簡單的對話。這樣的未來不僅令人興奮,也提醒我們:與自然界的其他物種建立聯繫,可能是保護地球生態的一把鑰匙。而DolphinGemma,正帶領我們走向這個充滿可能的未來。
0 則留言