繼在圍棋棋盤上輕松戰(zhàn)勝人類后,AI似乎在對(duì)空間的認(rèn)知和巡航能力上也要將人類踩在腳下了。美國(guó)東部時(shí)間5月9日,一手打造AlphaGo的DeepMind
繼在圍棋棋盤上輕松戰(zhàn)勝人類后,AI似乎在對(duì)空間的認(rèn)知和巡航能力上也要將人類“踩在腳下了。
美國(guó)東部時(shí)間5月9日,一手打造AlphaGo的DeepMind團(tuán)隊(duì)又在世界頂級(jí)學(xué)術(shù)雜志《自然》上發(fā)表了一項(xiàng)重磅成果。在一篇題為Vector-based navigation using grid-like representations in artificial agents的論文中,DeepMind團(tuán)隊(duì)稱,其其最新研發(fā)出的一個(gè)人工智能程序具有類似哺乳動(dòng)物一樣的尋路能力,非常類似大腦中網(wǎng)格細(xì)胞的工作原理。
人類在自然空間中游刃有余,可以輕松繞過(guò)障礙,找到自己與目的地間的捷徑,但其背后的機(jī)理卻不甚明了。
為了解開這個(gè)謎團(tuán),科學(xué)家們進(jìn)行了孜孜不倦地探索。早在上個(gè)世紀(jì)六十年代末,UCL神經(jīng)生理學(xué)家John O’Keefe就開始研究這個(gè)問(wèn)題,并在1971年發(fā)現(xiàn)位置細(xì)胞(Place Cell),大腦定位系統(tǒng)的第一個(gè)元件。位置細(xì)胞能在主體到達(dá)特定地點(diǎn)時(shí)放電,從而賦予對(duì)過(guò)往地點(diǎn)的記憶,但位置細(xì)胞并不是坐標(biāo),也不具備幾何計(jì)算能力。
2005年,May-Britt Moser和Edvard Moser夫婦發(fā)現(xiàn)了大腦內(nèi)嗅皮層更為神奇的網(wǎng)格細(xì)胞。他們記錄大鼠運(yùn)動(dòng)時(shí)特定神經(jīng)細(xì)胞被相應(yīng)激活的規(guī)律,發(fā)現(xiàn)網(wǎng)格細(xì)胞能將整個(gè)空間環(huán)境劃分成蜂窩狀的六邊形網(wǎng)格,就像地圖上的坐標(biāo)系一樣。網(wǎng)格細(xì)胞的行為是如此令人震撼,2014年,Moser夫婦也因此分享了諾貝爾生理學(xué)獎(jiǎng)。
不過(guò),網(wǎng)格細(xì)胞僅僅是在空間環(huán)境中提供GPS定位服務(wù)嗎?一直以來(lái),人們猜測(cè)網(wǎng)格細(xì)胞支撐著生物的矢量巡航,即計(jì)算通向目標(biāo)的距離和方向,但人們?cè)诎l(fā)現(xiàn)網(wǎng)格細(xì)胞十余年后,對(duì)其計(jì)算功能以及和矢量巡航的關(guān)系,仍然未知。
這正是deepmind這篇論文試圖解開的謎團(tuán)。
DeepMind團(tuán)隊(duì)決定用人工神經(jīng)網(wǎng)絡(luò)檢驗(yàn)上述猜想。人工神經(jīng)網(wǎng)絡(luò)是一種利用多層處理模擬大腦神經(jīng)網(wǎng)絡(luò)的運(yùn)算結(jié)構(gòu)。在這項(xiàng)工作中,研究人員首先訓(xùn)練循環(huán)神經(jīng)網(wǎng)絡(luò)基于運(yùn)動(dòng)速度信息在虛擬環(huán)境中定位。這與哺乳動(dòng)物在不熟悉環(huán)境中運(yùn)動(dòng)定位所用到的信息非常類似。
令人震驚的是,類似網(wǎng)格細(xì)胞的模式,研究人員稱之為網(wǎng)格單元,在神經(jīng)網(wǎng)絡(luò)中自然出現(xiàn)了。在此前的訓(xùn)練中,研究人員并未刻意引導(dǎo)神經(jīng)網(wǎng)絡(luò)產(chǎn)生此種結(jié)構(gòu)。人工智能的定位方案,竟然與大自然億萬(wàn)年進(jìn)化所得到的答案如此一致。
DeepMind團(tuán)隊(duì)隨后利用強(qiáng)化學(xué)習(xí)檢驗(yàn)這種網(wǎng)格結(jié)構(gòu)是否能夠進(jìn)行矢量導(dǎo)航。強(qiáng)化學(xué)習(xí)被普遍用于訓(xùn)練游戲AI,人類告訴AI一種游戲的得分獎(jiǎng)懲機(jī)制,但卻不教授游戲方法,由AI在反復(fù)進(jìn)行游戲、努力爭(zhēng)取更高分的過(guò)程中自我進(jìn)化。后期的AlphaGo就完全擯棄了人類棋譜經(jīng)驗(yàn),在純粹的自我對(duì)弈中從零進(jìn)化到更強(qiáng)版本。
研究人員將之前自動(dòng)出現(xiàn)的網(wǎng)格結(jié)構(gòu)與一個(gè)更大型的神經(jīng)網(wǎng)絡(luò)架構(gòu)結(jié)合成了人工智能體,置于虛擬現(xiàn)實(shí)的游戲環(huán)境中。經(jīng)歷強(qiáng)化學(xué)習(xí)后,該人工智能在游戲迷宮中向目的地前進(jìn)的導(dǎo)航能力超越了一般人,達(dá)到了職業(yè)游戲玩家水平。它能像哺乳動(dòng)物一樣尋找新路線和抄近路。
而如果將網(wǎng)格單元靜音后,其巡航能力則大打折扣,距離和方向的計(jì)算誤差都增大,證明網(wǎng)格模式對(duì)矢量巡航的重要性。
對(duì)于這項(xiàng)發(fā)現(xiàn),網(wǎng)格細(xì)胞發(fā)現(xiàn)者Edvard Moser表示:“這篇論文橫空出世,非常令人興奮。更令人吃驚的是,從另一個(gè)角度來(lái)看,計(jì)算機(jī)模式的發(fā)展最終回歸到了我們從生物學(xué)中發(fā)現(xiàn)的網(wǎng)格模式。
Deep Mind創(chuàng)始人和CEO,論文共同作者哈薩比斯稱:“我們相信人工智能和神經(jīng)科學(xué)是相互啟發(fā)的。這項(xiàng)工作就是很好的證明:通過(guò)研發(fā)出一個(gè)能在復(fù)雜環(huán)境中導(dǎo)航的人工智能體,我們對(duì)網(wǎng)格細(xì)胞在哺乳動(dòng)物導(dǎo)航中的重要性有了更深的理解。”
DeepMind團(tuán)隊(duì)相信,這一工作既是理解網(wǎng)格細(xì)胞計(jì)算功能的重要一步,也是人工智能發(fā)展的重要一步,顯示類腦機(jī)器學(xué)習(xí)構(gòu)架的重要性。而同樣的方法,也可以用于研究生命的其他感知能力。
英國(guó)帝國(guó)理工學(xué)院劉芳德博士稱,位置細(xì)胞和網(wǎng)格細(xì)胞的研究對(duì)人工智能特別是機(jī)器人系統(tǒng)啟發(fā)很大。位置細(xì)胞其實(shí)是空間索引的數(shù)據(jù)庫(kù),描述的是拓?fù)淇臻g;而網(wǎng)格細(xì)胞是幾何計(jì)算器,描術(shù)的是歐氏空間。這種組織跟我們目前計(jì)算機(jī)科學(xué)中的技術(shù)完全不同,并有非常強(qiáng)的優(yōu)勢(shì)。
杜克大學(xué)陳怡然教授和博士生吳春鵬介紹,論文中提到的兩個(gè)細(xì)節(jié)值得注意。第一,如果神經(jīng)網(wǎng)絡(luò)的損失函數(shù)中不包括正則項(xiàng),那么神經(jīng)網(wǎng)絡(luò)無(wú)法表現(xiàn)出網(wǎng)格細(xì)胞功能。這一發(fā)現(xiàn)給了我們一個(gè)全新的角度去思考正則項(xiàng)的作用。第二,論文指出深度神經(jīng)網(wǎng)絡(luò)的“黑盒”特點(diǎn)阻礙了進(jìn)一步分析網(wǎng)格細(xì)胞活動(dòng)特性對(duì)路徑整合的作用。這一點(diǎn)再次印證了當(dāng)前研究神經(jīng)網(wǎng)絡(luò)可解釋性的必要。
對(duì)此,約翰霍普金斯大學(xué)神經(jīng)學(xué)家Francesco Savelli 和 James Knierim在同期Nature發(fā)表的題為AI mimics brain codes for navigation的新聞評(píng)述中強(qiáng)調(diào):“網(wǎng)格模型增強(qiáng)了目標(biāo)導(dǎo)向能力,這一事實(shí)證明了網(wǎng)格細(xì)胞在大腦中的作用。但是在模型中無(wú)法直接控制這些計(jì)算,使得我們很難對(duì)其背后的計(jì)算原理、算法和編碼策略進(jìn)行研究。如何讓深度學(xué)習(xí)系統(tǒng)更加智能以理解人類的推理邏輯,是未來(lái)我們面臨的一個(gè)令人興奮的挑戰(zhàn)。”
關(guān)鍵詞: 團(tuán)隊(duì)