高文,中國工程院院士,北京大學博雅講席教授,鵬城實驗室主任。他見證和參與了中國計算機行業(yè)的高速發(fā)展,見證了人工智能的成長壯大。他先后主持國家級科研項目20多項,涉及人工智能、視頻編碼與分析、計算機視覺等前沿領域。他帶領的數(shù)字視頻編解碼技術國家工程實驗室,經(jīng)過十余年的潛心研究,憑借完全自主創(chuàng)新,完成了我國具備自主知識產(chǎn)權的第二代信源編碼標準體系,達到了國際標準水平。2021年,他和他的項目團隊憑借“超高清視頻多態(tài)基元編解碼關鍵技術”,榮獲2020年度國家技術發(fā)明獎一等獎。他和團隊主導制定的AVS超高清視頻編解碼國家標準,還被全球超高清產(chǎn)業(yè)聯(lián)盟采納為國際標準。
人工智能被視為第四次工業(yè)革命的一個標志,發(fā)達國家和眾多的科技公司,紛紛投入巨資展開研發(fā)和布局,我國也在全力構筑人工智能發(fā)展的先發(fā)優(yōu)勢。黨的二十大報告指出,推動戰(zhàn)略性新興產(chǎn)業(yè)融合集群發(fā)展,構建新一代信息技術、人工智能、生物技術、新能源、新材料、高端裝備、綠色環(huán)保等一批新的增長引擎。什么是人工智能?人工智能將如何改變我們的生活?如何在這場技術革命中搶占先機?
什么是人工智能
人工智能的發(fā)展歷史只有六七十年。人工智能也叫人造智能,就是由人制造出來的模仿人的智能,一般通過機器人、計算機等載體表現(xiàn)出來。人工智能有兩個重要概念:一個是通用人工智能或者叫強人工智能,如果這種智能系統(tǒng)的功能、能力和人一樣,甚至超過人,就叫強人工智能系統(tǒng);另一個是專用人工智能或者叫弱人工智能,如果這個智能系統(tǒng)只能干一件事,盡管可能比人厲害,那它也是弱人工智能。比如常見的刷臉識別、語音識別系統(tǒng)。
1956年,10位年輕的學者,其中許多是圖靈獎和諾貝爾獎的獲得者,在美國達特茅斯市搞了一個暑期研究所。在兩個月的討論中,他們針對人工智能應該干什么、怎么干進行了一番討論,列出了人工智能領域需要研究的自動計算機、編程語言、神經(jīng)網(wǎng)絡、計算規(guī)模理論等問題,并形成了一個比較前沿的報告,這被公認為是對人工智能一個比較完整的描述,這一年也被稱為人工智能元年。
從1956年到1976年,這20年是人工智能發(fā)展的第一個階段,這一時期的人工智能主要是在模擬大腦工作。這種模擬不是信號級的模擬,而是在邏輯推理等更高層面上去模擬大腦。這一階段比較珍貴的一個成果是數(shù)學定理證明,也就是用計算機自動進行數(shù)學定理的證明。包括代數(shù)定理證明和幾何定理證明,都是由兩位華人(王浩、吳文?。┩瓿傻?。后來研究人員發(fā)現(xiàn)僅僅通過模擬人的大腦來實現(xiàn)人工智能這條路太難走。因為當時只完成了數(shù)學定理證明這件事,戰(zhàn)勝國際象棋冠軍、機器譜曲等其他目標都沒完成。人工智能逐漸從高潮跌到低谷,學者們開始反思是不是人工智能走歪路了,是不是要做點實事。
學者們開始嘗試研發(fā)對社會有影響力的系統(tǒng),比如醫(yī)療診斷專家系統(tǒng)、故障診斷系統(tǒng),可以代替醫(yī)生、專家去做一些診斷。另外就是模擬神經(jīng)系統(tǒng)來做專家系統(tǒng),這在字符識別、文字識別領域比較有效。后來應用到機器自動識別、自動分揀系統(tǒng),包括今天的語音識別,基本上都是走的神經(jīng)網(wǎng)絡這條技術路線。
這兩條技術路線使第二次人工智能發(fā)展專家系統(tǒng)的這30年,開創(chuàng)了百花齊放的局面。不過專家系統(tǒng)的高光時刻并沒有持續(xù)太久,因為專家系統(tǒng)雖然做了很多,演示時效果也不錯,但真正上線去用的時候效果并不理想,于是熱度開始下降,直到2006年引發(fā)人工智能領域轟動的3篇重量級文章的問世,人工智能才開始了突飛猛進的發(fā)展。
這一年,多倫多大學教授辛頓、紐約大學教授楊立昆、蒙特利爾大學教授本杰奧,幾乎同時發(fā)表了重量級的文章,從不同角度說明深度神經(jīng)網(wǎng)絡是大有可為的,是可以進行大規(guī)模學習訓練的。只要輸入的數(shù)據(jù)好,它就可以解決問題。這一系列論文發(fā)表后,大家摸索了幾年小有收獲,但并沒有重大成果產(chǎn)出。直到2010年以后,斯坦福大學華裔女教授李飛飛、普林斯頓大學華人教授李凱,開發(fā)了一個規(guī)模特別大的圖像數(shù)據(jù)庫,然后拿去參加比賽。當時比賽標準是誰做的系統(tǒng)錯誤率更低,誰就勝出。2010年錯誤率最低的隊是28%,2011年是26%,2012年取得了突破,降至16%。原來是辛頓的學生用辛頓公開發(fā)表文章中的技術去參加比賽,打敗了所有的對手,這是一個重大進展。到了2013年,深度網(wǎng)絡這個技術普及開來,其它路線無非是使用多深的網(wǎng)、多少個節(jié)點、參數(shù)怎么設定等技巧性改進,而不是方法上的革命了。到2015年系統(tǒng)的錯誤率又實現(xiàn)革命性突破,降至3.6%,而人的平均錯誤率是5%,在圖像分類這件事上,神經(jīng)元網(wǎng)絡已經(jīng)超過人了。這事是誰做的呢?中國學者孫劍做的,當時他和他的團隊提出了殘差網(wǎng)絡。這個殘差網(wǎng)絡,不僅在圖像分類應用上是第一名,圍棋里面也是最厲害的?;诖?,在深度網(wǎng)絡適合的那些弱人工智能是可以進行廣泛應用研究和產(chǎn)業(yè)化的。
人工智能的特點和成長
從感知到認知,人工智能更上一層樓。在智能水平上,感知智能日益成熟。智能可分為感知智能、認知智能和決策智能。感知智能是和我們眼看、耳聽、手摸等感官直接相連的智能,現(xiàn)在的臉部和語音識別、機器翻譯,以及診斷病人病例、產(chǎn)品殘次識別,都發(fā)展得非常好,人工智能正在慢慢從一般的感知智能向認知智能進行升級。
類腦計算和量子計算,兩條突破之路。如果做更大規(guī)模或者做和認知有關的人工智能以及強人工智能,靠現(xiàn)有計算機是做不到的,怎么辦?就要尋找出路,在技術路線上有兩個比較可能的出路。一個是類腦智能,人對信息處理的能效比非常之高,現(xiàn)在的計算機不行,能效比太低了,類腦計算能效比會高一些。另一個是量子計算,其能效比是極高的,把量子計算做成比較穩(wěn)定的一個系統(tǒng)是有可能的。當然不管是類腦、量子計算,現(xiàn)在還有很大的不確定性,需要繼續(xù)加以研究和積累。
人與機器,混合智能具備獨特優(yōu)勢。在智能形態(tài)方面,人和計算機混合模式越來越多,這個叫人機混合智能。機器擅長做的事交給機器,機器做不好的事,人可以介入一下。這樣人機混合的智能,是現(xiàn)階段發(fā)展人工智能一個比較重要的技術途徑。
應用先行,有助于技術發(fā)展。在應用驅動方面,以前是先把技術做好,然后轉化技術去做應用?,F(xiàn)在靠應用去拉動技術發(fā)展,這條路是人工智能一個非常重要的發(fā)展形態(tài)。深度神經(jīng)網(wǎng)絡出現(xiàn)時,在哪兒好用,不知道,需要找一個很好的應用場景把它用起來。如果不是辛頓的學生把它拿去參加圖像網(wǎng)絡比賽,可能神經(jīng)網(wǎng)絡的熱潮還會拖許久才會到來。
未雨綢繆,防止技術失控。人工智能具有社會屬性。人類會不會被人工智能奴役、擺布?這個社會屬性,恰恰是我們在做人工智能時要認真對待的一個問題,要擺正人和智能系統(tǒng)之間的關系,對人工智能能干什么、不能干什么進行研究和立法,從法律和道德層面去約束和規(guī)范它。否則,將來可能會很被動。
中國人工智能發(fā)展的優(yōu)勢與差距
從2013年起,世界許多國家政府,尤其是發(fā)達國家紛紛調研人工智能對社會、經(jīng)濟可能帶來的顛覆性影響,相繼發(fā)布符合自身國情的人工智能戰(zhàn)略。在這場事關未來的技術革命中,我們的機會在哪里?優(yōu)勢和短板分別是什么?
我國已經(jīng)成為人工智能領域的超級大國之一。改革開放以來,我們國家在基礎研究方面的投入巨大,人工智能的發(fā)展有了非常好的沉淀。一些關鍵核心技術,中國已經(jīng)走在了世界前列,比如說人臉和語音識別技術。中國人工智能的發(fā)展與各行各業(yè)的結合和滲透是非常高的,其應用和推廣比其他國家做得更好。我國人工智能發(fā)展的創(chuàng)新生態(tài)環(huán)境已經(jīng)初步形成。百度的無人駕駛、阿里的城市大腦、騰訊的智能醫(yī)療、科大訊飛的語音識別、商湯的圖像與視頻處理等開放平臺以及華為、寒武紀、??低暤葘嶓w經(jīng)濟領域平臺已經(jīng)創(chuàng)建。全球AI指數(shù)排名,中國屬于第一梯隊,緊隨美國,在人才、教育、專利產(chǎn)出等方面均有所進步。中美兩國引領、呈梯次分布的全球人工智能發(fā)展總格局保持不變。
四大優(yōu)勢護航中國人工智能發(fā)展。第一個是政策優(yōu)勢,人工智能已被列為國家優(yōu)先發(fā)展事項。第二個是海量數(shù)據(jù)資源優(yōu)勢,中國人口是美國的四倍多,手機群體和手機消費、支付量也是最大的,擁有龐大的消費、出行、醫(yī)療、旅游、物流等數(shù)據(jù)資源。第三個是應用場景優(yōu)勢,我國是發(fā)展中國家,很多基礎設施還不夠完善,這恰恰給人工智能的應用提供了一些深度場景。比如城鄉(xiāng)的基礎設施、醫(yī)療、教育、民生服務等領域的問題,人工智能系統(tǒng)的介入,問題可以快速得到解決。第四個是青年人才優(yōu)勢,我國高等教育毛入學率已達59.6%,而且學理工科的學生比例很高,這是一個非常大的人才儲備庫。國家自然科學基金委員會專門設立人工智能一級學科代碼,資助相關基礎研究、前瞻性探索和應用研究。
當然,我們也存在一些短板,特別是在四個薄弱環(huán)節(jié)急需加強。第一,基礎理論和原創(chuàng)算法研究比較薄弱。第二,高端器件研發(fā)能力弱,比如做深度神經(jīng)網(wǎng)絡訓練的GPU(圖形處理器),中國在這方面差距比較明顯。第三,缺乏有影響的人工智能開源開放平臺。第四,缺乏相應的高端人才。據(jù)統(tǒng)計,中國最頂級的人工智能高端人才數(shù)只有美國的20%,已成為國家關鍵領域急需的高層次人才。
我們該如何布局未來
未來已來,到底是哪一個未來來了?過去三十年是變化非常大、非??斓娜辍5谝粋€是計算機的算力增強了約一百萬倍,第二個是存儲容量增加了約一百萬倍,第三個是通信速度增加了約一百萬倍。這三個一百萬倍,讓我們的社會、工作、生活、學習都發(fā)生了天翻地覆的變化。而下一次影響人類社會的工業(yè)革命時間可能會發(fā)生在2030年到2040年之間,其主題將會是人工智能,人工智能將是未來一個世紀的核心技術。
國家戰(zhàn)略、人才高地、基礎建設、立法保障,一個都不能少。要想把人工智能發(fā)展好,就需要我們在很多事上起好步、布好局。一是將發(fā)展人工智能提升至國家發(fā)展戰(zhàn)略,國家、地方和企業(yè),要把其作為戰(zhàn)略性新興產(chǎn)業(yè),給予大力支持。二是健全人工智能的國家研發(fā)體系。三是加快人才培養(yǎng),形成一批人工智能的國家人才高地,進而帶動整個人工智能理論和算法的發(fā)展。四是加強智能化基礎設施建設,推動公開數(shù)據(jù)的開放、共享,同時完善相關法律法規(guī)保護數(shù)據(jù)的安全性。五是加快人工智能法律、倫理問題的研究,引導人工智能安全可控發(fā)展。六是深化國際開放合作,主動參與全球人工智能的治理和標準制定。
數(shù)據(jù)處理、開源平臺、應用場景,三個抓手要記牢。利用人工智能為各行各業(yè)賦能,抓手是什么?排在第一位的是數(shù)據(jù),沒有數(shù)據(jù),即便是弱人工智能也沒法做,所以要把數(shù)據(jù)組織起來、清洗出來、利用起來并加以安全防護。第二位是創(chuàng)建好自己的開源平臺,與我們作為人工智能大國的地位相匹配。第三位是應用場景的培育和賦能,現(xiàn)在很多場景還只是投資驅動的,政府要清楚哪些是優(yōu)先發(fā)展的領域,市場能做能決定的事,就交給市場去做去決定,需要政府介入、調控才能做好的事,政府就要果斷去干預、去培育,扶上馬,送一程。這是非常關鍵的一個步驟。在做大做強自己,補齊自身短板弱項后,我們要和全世界人工智能同步推進,去迎接人工智能第四次工業(yè)革命的到來。