具身智能是指一種思想或者理論。它強(qiáng)調(diào)認(rèn)知受智能體的感知與動(dòng)作的影響,主張智能或智能行為來(lái)自智能體身體與周?chē)h(huán)境的交互,而不僅僅是大腦的功能。這種思想與建立在笛卡爾身心二元論基礎(chǔ)上的離身智能不同,后者沒(méi)有考慮大腦與身體之間的聯(lián)系。具身智能理論對(duì)認(rèn)知科學(xué)、心理學(xué)、人類(lèi)學(xué)、藝術(shù)等都產(chǎn)生了深刻的影響,由此誕生了具身認(rèn)知、具身心理學(xué)等分支學(xué)科。當(dāng)前,具身智能理論深入到大眾關(guān)注的人工智能、機(jī)器人技術(shù)等領(lǐng)域,并產(chǎn)生重大影響。
推動(dòng)人工智能邁向更高水平的通用人工智能
早期人工智能研究者認(rèn)為,機(jī)器可以通過(guò)對(duì)符號(hào)的操作實(shí)現(xiàn)對(duì)人類(lèi)思考(理性行為)的模擬,即讓機(jī)器像人類(lèi)那樣思考,無(wú)需考慮身體和環(huán)境。他們把人工智能定義為模擬人類(lèi)的智能行為,除了模擬思考之外,還包括感知、動(dòng)作,以及情感與靈感等。由于他們認(rèn)為思考和身體、環(huán)境是分離的,因此在模擬這些行為時(shí),是各自獨(dú)立進(jìn)行,沒(méi)有考慮行為之間的相互聯(lián)系。人工智能的另一學(xué)派內(nèi)在主義,主張人工智能應(yīng)該模擬人類(lèi)大腦的工作原理,我們通常稱(chēng)之為類(lèi)腦計(jì)算。這個(gè)學(xué)派也沒(méi)有考慮思考、感知與身體的關(guān)系。因此傳統(tǒng)人工智能中的兩大學(xué)派都屬于離身智能。
具身智能則認(rèn)為人類(lèi)的智能行為不僅依賴(lài)大腦的思考,還需要通過(guò)與物理環(huán)境的交互來(lái)進(jìn)行學(xué)習(xí)和決策,最后通過(guò)感知將執(zhí)行的結(jié)果反饋到大腦,形成閉環(huán),構(gòu)成一個(gè)智能體,這樣才能真正實(shí)現(xiàn)模擬人類(lèi)智能行為的目標(biāo)。具身智能這種思想的提出,與傳統(tǒng)人工智能不同,將推動(dòng)人工智能向更高的水平——通用人工智能發(fā)展。
人工智能的發(fā)展歷史,經(jīng)歷過(guò)三個(gè)階段。第一代人工智能提出以知識(shí)與經(jīng)驗(yàn)為基礎(chǔ)的推理模型,通過(guò)這一模型來(lái)模擬人類(lèi)的思考。這一模型具有可解釋性與可理解性的優(yōu)點(diǎn),但由于知識(shí)表示與獲取的困難,該模型在應(yīng)用和產(chǎn)業(yè)化上受到很大限制。第二代人工智能提出數(shù)據(jù)驅(qū)動(dòng)的模型,通過(guò)基于大數(shù)據(jù)的機(jī)器學(xué)習(xí),實(shí)現(xiàn)對(duì)人類(lèi)感性和情感行為的模擬。由于模型的圖像、語(yǔ)音等輸入數(shù)據(jù)來(lái)自客觀(guān)世界,因此具有很大的應(yīng)用潛力,但由于模型本身存在不安全、不可靠、不可信(不可解釋?zhuān)?、不可控和不易推廣等缺陷,因此應(yīng)用范圍有限。雖然科學(xué)家在這期間也進(jìn)行過(guò)模擬人類(lèi)動(dòng)作,比如手的操作與腳的步行等研究,但沒(méi)有將這些研究與思考、感知等其他方面聯(lián)系起來(lái)??傊@兩代人工智能都有很大的局限性,而且只針對(duì)特定領(lǐng)域、利用特定模型去解決特定任務(wù)。
2020年大語(yǔ)言模型的出現(xiàn),把人工智能推向新的發(fā)展階段——第三代人工智能。大語(yǔ)言模型具有強(qiáng)大的語(yǔ)言生成能力,使機(jī)器能夠在開(kāi)放領(lǐng)域下實(shí)現(xiàn)與人類(lèi)的自由交互,這表明機(jī)器已經(jīng)完全掌握了人類(lèi)的語(yǔ)言。此事意義重大。正如哲學(xué)家維特根斯坦所言:“我的語(yǔ)言界限,就是我的世界界限。”機(jī)器一旦掌握了人類(lèi)的語(yǔ)言,也就在某種程度上理解了人類(lèi)的世界。大語(yǔ)言模型向通用人工智能邁出了關(guān)鍵一步。
盡管人工智能在語(yǔ)言生成上取得成功,在許多其他任務(wù)上還不能實(shí)現(xiàn)領(lǐng)域的通用性。比如醫(yī)療診斷,目前我們還沒(méi)有開(kāi)發(fā)出適用于各種疾病的計(jì)算機(jī)醫(yī)療診斷系統(tǒng)。另外,大語(yǔ)言模型只會(huì)說(shuō)(生成語(yǔ)言),不會(huì)干(行動(dòng))。還有大量的任務(wù),特別是復(fù)雜的任務(wù),人工智能目前還無(wú)法完成。我們離真正的通用人工智能仍有一定距離,其原因就在于,傳統(tǒng)人工智能對(duì)人類(lèi)(大腦)的思考、感知與動(dòng)作等方面的模擬是相互分開(kāi)的,而且與環(huán)境隔離。具身智能則強(qiáng)調(diào)物理身體、環(huán)境感知與反饋的重要性,并通過(guò)它們實(shí)現(xiàn)與外部世界的交互。這正好彌補(bǔ)了傳統(tǒng)人工智能的不足,使機(jī)器通過(guò)與環(huán)境的反復(fù)交互,逐漸學(xué)習(xí)適應(yīng)環(huán)境并優(yōu)化其決策和行動(dòng),不斷迭代,完成更多、更復(fù)雜的任務(wù),這就是新的學(xué)習(xí)范式——強(qiáng)化學(xué)習(xí)。由此可見(jiàn),具身智能將使人工智能在更廣泛的環(huán)境下,完成更多的任務(wù),向通用人工智能邁進(jìn)。
推動(dòng)機(jī)器人領(lǐng)域三方面的技術(shù)進(jìn)步
機(jī)器人的研究遠(yuǎn)在人工智能誕生之前。1954年,科學(xué)家發(fā)明數(shù)字控制可編程的機(jī)械臂,為現(xiàn)代工業(yè)機(jī)器人打下基礎(chǔ),也預(yù)示著現(xiàn)代機(jī)器人的真正誕生。在人工智能的發(fā)展過(guò)程中,雖然也將模仿人類(lèi)動(dòng)作納入研究范圍,但由于當(dāng)時(shí)研究的重點(diǎn)是思考與感知,動(dòng)作(身體)并沒(méi)有受到很大關(guān)注。后來(lái),機(jī)器人研究慢慢形成一個(gè)新領(lǐng)域——機(jī)器人學(xué),與人工智能中的動(dòng)作研究同時(shí)存在。機(jī)器人學(xué)研究的范圍更寬,也更多關(guān)注技術(shù)、實(shí)際應(yīng)用和產(chǎn)業(yè)化。1986年,移動(dòng)機(jī)器人的先驅(qū)羅德尼·布魯克斯提出了行為主義機(jī)器人學(xué)的主張,他認(rèn)為傳統(tǒng)的符號(hào)主義人工智能過(guò)于依賴(lài)復(fù)雜的推理系統(tǒng),忽視了身體與環(huán)境的互動(dòng)對(duì)智能行為的關(guān)鍵性貢獻(xiàn)??梢哉f(shuō),這是在機(jī)器人領(lǐng)域首次提出具身智能思想。
總的來(lái)看,具身智能推動(dòng)了機(jī)器人領(lǐng)域三方面的技術(shù)進(jìn)步。
其一是推動(dòng)機(jī)器人技術(shù)從單一感知(如視覺(jué)或觸覺(jué))向多模態(tài)感知發(fā)展。自動(dòng)駕駛汽車(chē)需要在各種氣候條件和復(fù)雜環(huán)境下行駛,全天候的環(huán)境感知極為重要。目前除了利用單一的攝像機(jī)之外,人們更多地考慮多傳感器融合,即除攝像機(jī)之外,還要綜合利用激光掃描儀、雷達(dá)、聲吶、衛(wèi)星定位等不同傳感器,以保證感知的可靠性。同樣,對(duì)機(jī)械手來(lái)講,也需要利用觸覺(jué)、力覺(jué)、力矩覺(jué)等多傳感器的融合,以便在復(fù)雜環(huán)境下實(shí)現(xiàn)復(fù)雜操作,比如,裝配、搶險(xiǎn)救災(zāi)、排雷等。
其二是推動(dòng)機(jī)器人技術(shù)更加關(guān)注軟件與硬件的高度整合。為了適應(yīng)不同工作任務(wù)的需求,我們需要設(shè)計(jì)不同類(lèi)型的機(jī)器人,如為家庭服務(wù)的人形機(jī)器人,擁有靈巧雙手的裝配機(jī)器人,擁有特殊功效的仿生機(jī)器人等。不同類(lèi)型的機(jī)器人需要不同的控制技術(shù),也會(huì)導(dǎo)致不同的學(xué)習(xí)和感知方式,這反過(guò)來(lái)又影響機(jī)器人形態(tài)的設(shè)計(jì)。這些都屬于機(jī)器人軟硬件協(xié)同的問(wèn)題。
其三,具身智能中的智能體概念對(duì)機(jī)器人技術(shù)也將產(chǎn)生重要影響。根據(jù)智能體這一概念,機(jī)器人將思考、感知和動(dòng)作連為一體,既可以在數(shù)字世界中也可以在物理世界中完成任務(wù),利用數(shù)字世界又可以對(duì)物理世界進(jìn)行仿真,這些對(duì)推動(dòng)機(jī)器人的發(fā)展意義重大。比如,無(wú)人車(chē)的實(shí)驗(yàn)如果在物理世界中進(jìn)行,就要受到氣候條件、突發(fā)事件等諸多因素限制,利用仿真模擬則會(huì)大大提高效率,節(jié)省時(shí)間與費(fèi)用。利用智能體理論,我們可以讓機(jī)器人相互之間進(jìn)行博弈,實(shí)現(xiàn)機(jī)器的自我進(jìn)化(迭代),使機(jī)器人的性能不斷提高。
(作者為中國(guó)科學(xué)院院士、清華大學(xué)教授)
推薦讀物
《人工智能導(dǎo)論》:林堯瑞、馬少平編著;清華大學(xué)出版社出版。
《可解釋人工智能導(dǎo)論》:楊強(qiáng)、范力欣等著;電子工業(yè)出版社出版。
《具身智能導(dǎo)論》:劉華平、郭迪等編著;高等教育出版社出版。
版式設(shè)計(jì):蔡華偉