“猴臉識別”:AI技術(shù)顛覆動物傳統(tǒng)研究

位于陜西周至國家級自然保護區(qū)內(nèi)的川金絲猴。李媛/攝

■本報見習(xí)記者 李媛

20多年前,郭松濤攻讀碩士學(xué)位期間,跟隨導(dǎo)師李保國在陜西周至國家級自然保護區(qū)監(jiān)測金絲猴。白天他們在山林間追蹤猴群,夜晚借宿在山下的村民家中。因為老鼠太多,次日清晨他們經(jīng)常因找不到鞋子而苦惱。

如今已是西北大學(xué)教授的郭松濤,那時剛接觸野生動物研究不久,常年風餐露宿,皮膚曬得黝黑。他坦言,曾一度羨慕實驗室中穿白大褂的同窗。

但現(xiàn)在,得益于郭松濤帶領(lǐng)團隊研發(fā)的新“猴臉識別”系統(tǒng),他終于能笑著說:“我們再也不用為找不到鞋而苦惱了?!?/p>

面對國際空白,他們自主研發(fā)

動物行為是常見但機理復(fù)雜的自然現(xiàn)象。千百年來,人們一直通過肉眼觀察來記錄和研究動物習(xí)性。

“傳統(tǒng)監(jiān)測需要花費大量時間,研究人員要長期駐扎在野外,而動物的行為復(fù)雜多變,有時候單個個體就要觀察很久。”在長期的研究中,郭松濤一直想通過技術(shù)突破這一瓶頸。

起初,郭松濤團隊從歐洲購買了一個軟件,寄希望于提高監(jiān)測效率。然而實際應(yīng)用后,他們發(fā)現(xiàn)這款軟件僅具備基礎(chǔ)數(shù)據(jù)錄入功能,研究人員仍需到野外拍攝動物錄像,再輸入電腦里分析。

“看起來是進步的,但相較于野外觀察,沒有了環(huán)境參照,個體識別變得更復(fù)雜了,研究人員坐在電腦前的時間更長了,甚至有學(xué)生因此視網(wǎng)膜脫落、住院?!惫蓾寡?,在使用了一段時間后,他們還是放棄了。

這段經(jīng)歷卻催生出郭松濤的一個想法:“所謂先進軟件,僅應(yīng)用了統(tǒng)計與數(shù)據(jù)處理技術(shù),卻未觸及動物身份識別與行為分析兩大核心難題。我們能否自主攻克呢?”

彼時,人工智能(AI)技術(shù)迅猛發(fā)展,被大量應(yīng)用于汽車制造、人體健康監(jiān)測等方面?!凹热粵]人將其用在動物上,我們就做開拓者,把AI跟動物學(xué)研究結(jié)合起來,解決困擾動物學(xué)研究人員的問題?!惫蓾f。

2018年,郭松濤與西北大學(xué)計算機學(xué)院研究人員開展跨學(xué)科攻關(guān),研發(fā)專注于動物行為研究的AI技術(shù)。2020年,團隊基于長期積累的金絲猴特征數(shù)據(jù),創(chuàng)新性提出具有關(guān)注機制的深度神經(jīng)網(wǎng)絡(luò)模型,成功研發(fā)出全球首個金絲猴個體識別系統(tǒng)(Tri-AI)。

“該系統(tǒng)顛覆了依靠動物個體特征(斑紋、顏色、傷疤)或者人為標記特征(烙印、刺青、染色、環(huán)志、無線電項圈及遺傳標記)的傳統(tǒng)方法,實現(xiàn)了野生個體準確身份識別和連續(xù)跟蹤采樣的功能。更重要的是,該系統(tǒng)為在理想條件下實現(xiàn)‘無觀察者干擾效應(yīng)’的動物學(xué)研究提供了可能?!惫蓾f。

從1.0“猴臉識別”到2.0“翻譯行為”

想象這樣一個場景:面前有幾十只猴子,每一只都在動,每一個動作都有著特定的行為定義。研究人員該如何分辨?

要捕捉到這些信息,此前需要靠人工觀測,用記錄本記錄下來,計算機把每一只猴子的每一種動作自動標記起來,并且算出這些動作花了多長時間、執(zhí)行了多少次。

盡管視頻數(shù)據(jù)可通過專業(yè)軟件輔助分析,但要觀察幾天的動物行為視頻,仍需要上百小時的人工核驗。對于環(huán)境復(fù)雜、種群龐大的野生動物而言,這種低效模式嚴重制約了行為規(guī)律研究。

為破解行為智能分析中面臨的共性難題,郭松濤團隊以行為學(xué)原理為根基,融合AI技術(shù),歷時4年研發(fā)出“猴臉識別2.0”——自動識別與測量人工智能框架。該系統(tǒng)不僅能精準識別、追蹤野生動物個體,還可自動分析行為節(jié)律,生成時間分配報告,實現(xiàn)全自動行為監(jiān)測。相關(guān)研究今年4月發(fā)表于《整合動物學(xué)》。

該框架在3種靈長目物種(川金絲猴、狐猴、狒狒)、3種食肉目物種(老虎、棕熊、黑熊)、3種偶蹄目物種(羚牛、列氏水羚、角馬)、1種奇蹄目物種(斑馬),共計四大類群、10種代表性物種上得到了驗證。

這個龐大的數(shù)據(jù)庫算法也讓這項技術(shù)有了“獨家秘訣”,不依賴于觀察者的數(shù)據(jù)分析系統(tǒng),突破了觀察者的視角局限。

在實際應(yīng)用中該算法非常有效。舉個例子:兩只老虎打架,如果其中一只受傷了,靜臥半個小時,肉眼很難分辨它為什么躺在那兒,或者說為什么停留那么長時間,而AI則可以精準識別。郭松濤解釋,這個內(nèi)在的邏輯就在于每一種動物在某種行為上花的時間是相對穩(wěn)定的,即便是休息,也應(yīng)該是以某種相對穩(wěn)定的姿態(tài)休息。一旦出現(xiàn)異常模式,系統(tǒng)立即預(yù)警。預(yù)警信息直達監(jiān)管人員與獸醫(yī)團隊,為及時干預(yù)爭取黃金時間。

這對瀕危物種保護意義重大。“以大熊貓為例,通過AI量化分析其進食時長、咀嚼頻率等細節(jié),能夠?qū)崿F(xiàn)消化系統(tǒng)異常預(yù)判,有利于我們快速掌握熊貓的健康狀態(tài)?!惫蓾嬖V《中國科學(xué)報》。

鐵籠里觀測猛獸,科研之路“累并快樂著”

盡管技術(shù)已大幅降低人力依賴,郭松濤團隊仍堅守一個原則:野外研究必須近距離觀察?!爸挥性趧游锔案惺芩?、觀察它,才能深刻理解它的每一個動作、每一個行為、每一個眼神的深意?!惫蓾f。

“如果你不理解動物行為,那就是因為你觀察得不夠仔細,或者靠得不夠近?!惫蓾忉屨f。

郭松濤團隊的博士生劉佳是在“猴臉識別”技術(shù)研發(fā)時加入團隊的,如今他已經(jīng)成長為橫跨動物保護與AI技術(shù)的復(fù)合型人才。回憶起框架收集期間的難忘經(jīng)歷,劉佳告訴記者,團隊在猛獸區(qū)的采集是在鐵籠里進行的,人在籠內(nèi),老虎、黑熊這些肉食動物在籠外自由活動。

“看著咆哮示威的猛獸,整個監(jiān)測過程神經(jīng)緊繃。不過,能24小時在園區(qū)零距離觀測動物,這種經(jīng)歷讓我們非常興奮。當大家拿到大量行為數(shù)據(jù),最終應(yīng)用到框架中時,自豪感油然而生?!眲⒓颜f。

如今,郭松濤團隊正在著手研發(fā)3.0系統(tǒng),將拓展至更多動物?!拔磥恚覀兿M軌驊?yīng)用到家禽家畜的養(yǎng)殖上,如果有足夠多的前期訓(xùn)練數(shù)據(jù),就可以通過視頻監(jiān)控對個體進行健康預(yù)警。”郭松濤表示,預(yù)警信息有望直達養(yǎng)殖戶和獸醫(yī)團隊,為動物健康監(jiān)測提供更廣泛的解決方案。

相關(guān)論文信息:

https://doi.org/10.1111/1749-4877.12985

《中國科學(xué)報》 (2025-05-28 第4版 綜合)

原文鏈接:https://rmtzx.sciencenet.cn/app/kexuewang/liveShare/#/newPaper?nums=15&pg=1&type=kxsbonenews&articleId=384752

< 上一篇

古代“打工人”的職業(yè)病 骨骼都知道

35歲即“高齡”!顯微鏡下的古代陶工職業(yè)病

下一篇 >