中國(guó)人民大學(xué)信息學(xué)院教授 孟小峰
【摘要】人工智能幾經(jīng)沉浮,終于在60年之后迎來(lái)了新的黃金發(fā)展期。計(jì)算社會(huì)科學(xué)是一門(mén)因數(shù)據(jù)而生的學(xué)科,人工智能將成為其重要的研究工具。同時(shí),計(jì)算社會(huì)科學(xué)也將推動(dòng)人工智能“了解智能”。在新的時(shí)代背景下,把人工智能和計(jì)算社會(huì)科學(xué)結(jié)合起來(lái)發(fā)展,勢(shì)在必行。但是,這將產(chǎn)生數(shù)據(jù)層、算法層、應(yīng)用層和生態(tài)系統(tǒng)四個(gè)方面的挑戰(zhàn),本文將對(duì)這些挑戰(zhàn)進(jìn)行分析,并提出相應(yīng)的解決方案,旨在通過(guò)“技術(shù)+制度”的方式,進(jìn)一步推動(dòng)人工智能和計(jì)算社會(huì)科學(xué)向前邁進(jìn)。
【關(guān)鍵詞】人工智能 計(jì)算社會(huì)科學(xué) 數(shù)據(jù) 算法 生態(tài)系統(tǒng)
【中圖分類(lèi)號(hào)】 TP18 【文獻(xiàn)標(biāo)識(shí)碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2019.20.004
引言
人工智能的發(fā)展。目前,學(xué)術(shù)界公認(rèn)人工智能的提出肇始于1956年的達(dá)特茅斯會(huì)議。經(jīng)歷了60余年沉浮,人工智能發(fā)展再攀高峰。從計(jì)算模式的角度來(lái)思考人工智能發(fā)展過(guò)程,可以發(fā)現(xiàn),計(jì)算機(jī)模式幾乎每15年就會(huì)發(fā)生一次重大變革。1950年,首臺(tái)計(jì)算機(jī)出現(xiàn);1965年,大型機(jī)進(jìn)入人們視野;1980年,個(gè)人電腦開(kāi)始普及;1995年,互聯(lián)網(wǎng)創(chuàng)造了“地球村”;2010年,云計(jì)算與大數(shù)據(jù)重新定義數(shù)據(jù)價(jià)值;2015年,“智能萬(wàn)物互聯(lián)”的概念被提出。在此期間,人工智能于1956年被提出,并以“符號(hào)主義”的形式走進(jìn)人們視野;20世紀(jì)80年代,“聯(lián)結(jié)主義”展示出強(qiáng)大生命力;在互聯(lián)網(wǎng)時(shí)代,統(tǒng)計(jì)學(xué)習(xí)理論得到發(fā)展,誕生了SVM等經(jīng)典模型。但是,直至云計(jì)算與大數(shù)據(jù)締造的大數(shù)據(jù)時(shí)代,人工智能才真正開(kāi)始應(yīng)用于實(shí)踐,形成了人工智能潮流。這與前期的理論積累和以深度學(xué)習(xí)為代表的人工智能算法、大數(shù)據(jù)時(shí)代的數(shù)據(jù)規(guī)模以及云計(jì)算帶來(lái)的強(qiáng)大算力密不可分。
那么,到底什么是人工智能呢?提出“機(jī)器學(xué)習(xí)(machine learning)”一詞的Arthur L. Smuel認(rèn)為,[1]人工智能旨在使機(jī)器通過(guò)學(xué)習(xí)人的智能來(lái)解決復(fù)雜問(wèn)題。所以,人工智能具有了解智能和實(shí)踐智能兩層內(nèi)涵。其中,前者指真正了解人類(lèi)解決復(fù)雜問(wèn)題的智能過(guò)程;后者指機(jī)器能夠重現(xiàn)大腦在給定場(chǎng)景下的活動(dòng)。由于前者,人工智能是一個(gè)典型的交叉學(xué)科問(wèn)題,具體涉及計(jì)算機(jī)科學(xué)、數(shù)學(xué)、神經(jīng)科學(xué)、認(rèn)知學(xué)等。而依據(jù)后者,即機(jī)器重現(xiàn)大腦的程度,可以將人工智能的發(fā)展分為弱人工智能、強(qiáng)人工智能和超人工智能三個(gè)階段。其中,弱人工智能可以在特定場(chǎng)景下完成基礎(chǔ)的角色性任務(wù),如根據(jù)圖片對(duì)失蹤兒童本人進(jìn)行識(shí)別;強(qiáng)人工智能則用于實(shí)現(xiàn)隨場(chǎng)景遷移的智能,如根據(jù)失蹤兒童照片找到其父母;而超人工智能則指超越于人類(lèi)的智能。目前,強(qiáng)人工智能的應(yīng)用并不常見(jiàn),而超人工智能尚未真正出現(xiàn),所以,我們正處于弱人工智能階段。因此,本文的人工智能指“弱人工智能”。
雖然人工智能歷經(jīng)沉浮,迎來(lái)了新的黃金發(fā)展期。但是其本身存在“實(shí)現(xiàn)智能過(guò)程非智能”的問(wèn)題,即實(shí)現(xiàn)機(jī)器學(xué)習(xí)等人工智能的手段依舊大量依靠人工。在機(jī)器學(xué)習(xí)系統(tǒng)中,[2]真正的機(jī)器學(xué)習(xí)代碼僅占很小一部分,而大部分工作都消耗在環(huán)境配置、數(shù)據(jù)采集、數(shù)據(jù)驗(yàn)證、機(jī)器學(xué)習(xí)資源管理、特征提取、過(guò)程管理工具、分析工具、服務(wù)基礎(chǔ)設(shè)施和監(jiān)測(cè)上。而且隨著相關(guān)應(yīng)用的落地,人們也會(huì)產(chǎn)生一些疑問(wèn):人工智能可以學(xué)習(xí)人的顯性知識(shí),但應(yīng)當(dāng)如何學(xué)習(xí)常識(shí)等隱性知識(shí)以及知識(shí)抽象等能力呢?人工智能收集的個(gè)人信息可以應(yīng)用于公安系統(tǒng),從而保障人身安全,但同時(shí)個(gè)人隱私又應(yīng)當(dāng)如何保護(hù)呢?因此,政府不僅通過(guò)“國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái)白名單”等形式大力鼓勵(lì)相關(guān)技術(shù)研發(fā),也出臺(tái)了《新一代人工智能治理原則》等進(jìn)一步督促其健康發(fā)展。在人工智能潮流的背景之下,人們的生產(chǎn)和生活方式發(fā)生了很大變化,那么,計(jì)算社會(huì)科學(xué)又會(huì)迎來(lái)什么樣的挑戰(zhàn)和機(jī)遇呢?
計(jì)算社會(huì)科學(xué)的發(fā)展。后工業(yè)化時(shí)代的復(fù)雜社會(huì)問(wèn)題催生了計(jì)算社會(huì)科學(xué)的誕生。正是其所在的大數(shù)據(jù)時(shí)代使“我們的社會(huì)開(kāi)啟了一場(chǎng)可與印刷和互聯(lián)網(wǎng)帶來(lái)的革命相比肩的偉大旅程”。[3]2009年,David Lazer等多位科學(xué)家發(fā)表了題為《計(jì)算社會(huì)科學(xué)》(Computational Social Science[4])的文章,成為計(jì)算社會(huì)科學(xué)這一交叉學(xué)科誕生的標(biāo)志。2012年,歐洲學(xué)者Conte R.等人發(fā)表的《計(jì)算社會(huì)科學(xué)宣言》(Manifesto of Computational Social Science[5])更是計(jì)算社會(huì)科學(xué)領(lǐng)域的“宣言”。
計(jì)算社會(huì)科學(xué)[6]是一種基于系統(tǒng)科學(xué)、網(wǎng)絡(luò)科學(xué)、復(fù)雜性科學(xué)等科學(xué)理論,利用人工智能、數(shù)據(jù)挖掘等計(jì)算科學(xué)方法,以社會(huì)、經(jīng)濟(jì)等領(lǐng)域大數(shù)據(jù)作為研究對(duì)象,交叉融合各學(xué)科理論,為人類(lèi)更深入地認(rèn)識(shí)社會(huì)、改造社會(huì),解決政治、經(jīng)濟(jì)、文化等領(lǐng)域復(fù)雜社會(huì)問(wèn)題的理論和方法論體系。簡(jiǎn)而言之,計(jì)算社會(huì)科學(xué)是一門(mén)基于社會(huì)學(xué)原理,使用自然科學(xué)和信息科學(xué)工具,揭示社會(huì)發(fā)展規(guī)律,從而解決社會(huì)問(wèn)題的學(xué)科。
計(jì)算社會(huì)科學(xué)是復(fù)雜社會(huì)背景和大數(shù)據(jù)時(shí)代共同催生的產(chǎn)物。但在大數(shù)據(jù)和互聯(lián)網(wǎng)的春風(fēng)下,數(shù)據(jù)產(chǎn)生方式以及數(shù)據(jù)本身的特征將進(jìn)一步發(fā)生轉(zhuǎn)變,未來(lái)二三十年的人類(lèi)社會(huì)將從大數(shù)據(jù)時(shí)代過(guò)渡到萬(wàn)物互聯(lián)時(shí)代,從而奠定智能社會(huì)的重要技術(shù)基礎(chǔ)。那么,計(jì)算社會(huì)科學(xué)將面臨哪些挑戰(zhàn)?又該如何實(shí)現(xiàn)這些挑戰(zhàn)的機(jī)遇化?為了充分利用萬(wàn)物互聯(lián)時(shí)代的技術(shù)基礎(chǔ),計(jì)算社會(huì)科學(xué)又將如何變革?
人工智能與計(jì)算社會(huì)科學(xué)的相輔相成。毫無(wú)疑問(wèn),進(jìn)一步發(fā)展的人工智能將成為未來(lái)智能社會(huì)科技的重要組成。那么,在當(dāng)前的人工智能潮流中,計(jì)算社會(huì)科學(xué)應(yīng)當(dāng)以什么姿態(tài)面對(duì)智能,又應(yīng)當(dāng)如何突破自身限制,繼續(xù)向前發(fā)展?在回答這個(gè)問(wèn)題之前,我們首先需要明確人工智能與計(jì)算社會(huì)科學(xué)之間的關(guān)系。
人工智能將成為計(jì)算社會(huì)科學(xué)的重要研究工具。如上所述,計(jì)算社會(huì)科學(xué)是一門(mén)典型的交叉學(xué)科:從理論基礎(chǔ)、研究對(duì)象、研究問(wèn)題,到研究工具,其每個(gè)環(huán)節(jié)都受益于其他學(xué)科的發(fā)展。計(jì)算社會(huì)科學(xué)扎根于傳統(tǒng)的社會(huì)學(xué)理論,基于大數(shù)據(jù)時(shí)代的豐富采樣和分析手段來(lái)研究和解決問(wèn)題。人工智能的出現(xiàn),不僅豐富了計(jì)算社會(huì)科學(xué)的分析手段,還增強(qiáng)了其預(yù)測(cè)能力。如基于文本等內(nèi)容的網(wǎng)絡(luò)輿情分析就是人工智能推動(dòng)計(jì)算社會(huì)科學(xué)研究的典型案例。
計(jì)算社會(huì)科學(xué)將推動(dòng)人工智能“了解智能”。如前所述,人工智能的提出旨在使機(jī)器通過(guò)學(xué)習(xí)人類(lèi)在特定場(chǎng)景下的智能來(lái)解決復(fù)雜問(wèn)題,具體包括了解智能和實(shí)踐智能兩方面。目前的人工智能僅處于弱人工智能階段。它面臨隱性知識(shí)無(wú)法得知和抽象能力無(wú)法學(xué)習(xí)等問(wèn)題,也無(wú)法像人類(lèi)那樣進(jìn)行感性決策。而這些問(wèn)題的關(guān)鍵在于機(jī)器對(duì)世界的感知和理解無(wú)法達(dá)到人類(lèi)水平。因此,要真正“了解智能”,就需要對(duì)人及其思維展開(kāi)進(jìn)一步研究。而計(jì)算社會(huì)科學(xué)正是一門(mén)研究人及其群體的典型學(xué)科。因此,計(jì)算社會(huì)科學(xué)將推動(dòng)人工智能“了解智能”。
經(jīng)過(guò)上述分析,可以發(fā)現(xiàn),無(wú)論是人工智能還是計(jì)算社會(huì)科學(xué),它們都存在進(jìn)一步發(fā)展的阻力或障礙。但是,人工智能可以成為計(jì)算社會(huì)科學(xué)的重要研究工具,而計(jì)算社會(huì)科學(xué)也將推動(dòng)人工智能“了解智能”。那么,如果將二者結(jié)合起來(lái),是否會(huì)遇到新的挑戰(zhàn)?又應(yīng)當(dāng)如何面對(duì)這些挑戰(zhàn)呢?
挑戰(zhàn)
由于彼此之間相輔相成,因此可以考慮將人工智能作為計(jì)算社會(huì)科學(xué)的重要研究工具之一,而計(jì)算社會(huì)科學(xué)得到的相關(guān)結(jié)論也可以幫助人工智能在實(shí)踐智能之前“了解智能”。那么,二者結(jié)合起來(lái)之后是否會(huì)將各自的問(wèn)題放大,甚至產(chǎn)生新的問(wèn)題呢?按照人工智能的實(shí)踐過(guò)程,下面將根據(jù)問(wèn)題產(chǎn)生背景將人工智能浪潮中計(jì)算社會(huì)科學(xué)所面對(duì)的挑戰(zhàn)分為四層,即數(shù)據(jù)層、算法層、應(yīng)用層,以及三者共同構(gòu)成的生態(tài)系統(tǒng)。
以隱私為核心的數(shù)據(jù)層挑戰(zhàn)。數(shù)據(jù)既是人工智能得以廣泛應(yīng)用的重要基礎(chǔ),也是計(jì)算社會(huì)科學(xué)誕生的背景和驅(qū)動(dòng)力所在?;跀?shù)據(jù)從產(chǎn)生到應(yīng)用的生命周期來(lái)看,數(shù)據(jù)層將面對(duì)數(shù)據(jù)收集時(shí)的壟斷問(wèn)題、數(shù)據(jù)分析和利用之前的融合問(wèn)題,以及貫穿整個(gè)數(shù)據(jù)生命周期的隱私問(wèn)題。
首先是數(shù)據(jù)壟斷。基于約3000萬(wàn)用戶(hù)的APP使用數(shù)據(jù)、162個(gè)維度的用戶(hù)畫(huà)像,以及近30萬(wàn)個(gè)APP信息,包括名稱(chēng)、類(lèi)別、開(kāi)發(fā)者、版本、權(quán)限、大小和評(píng)分等,我們得到了數(shù)據(jù)擁有者與收集者的隱私風(fēng)險(xiǎn)指數(shù),并通過(guò)群體分析、組合分析和成因分析得到了區(qū)域、人群、行為等多角度的隱私風(fēng)險(xiǎn)分析結(jié)果。其中,數(shù)據(jù)收集者的隱私風(fēng)險(xiǎn)量化結(jié)果表明,10%的收集者獲取了99%的權(quán)限數(shù)據(jù),形成了遠(yuǎn)超傳統(tǒng)“二八定律”的數(shù)據(jù)壟斷。而且這些數(shù)據(jù)壟斷者之間還在進(jìn)行著類(lèi)似于2017年順豐菜鳥(niǎo)之爭(zhēng)的數(shù)據(jù)爭(zhēng)奪戰(zhàn)。如何評(píng)價(jià)現(xiàn)有的數(shù)據(jù)壟斷和數(shù)據(jù)爭(zhēng)奪戰(zhàn)?真正產(chǎn)生這些數(shù)據(jù)的用戶(hù)又應(yīng)當(dāng)如何維護(hù)自己的權(quán)益?
其次是大數(shù)據(jù)融合。從PC時(shí)代到互聯(lián)網(wǎng)時(shí)代,再到大數(shù)據(jù)時(shí)代,數(shù)據(jù)產(chǎn)生方式從被動(dòng)到主動(dòng)再到自動(dòng),當(dāng)前數(shù)據(jù)也呈現(xiàn)出多源異構(gòu)、分布廣泛和動(dòng)態(tài)演化等特征,數(shù)據(jù)的關(guān)聯(lián)、交叉和融合更為迫切。價(jià)值挖掘是大數(shù)據(jù)應(yīng)用的重要驅(qū)動(dòng)力。而“大數(shù)據(jù)價(jià)值鏈”[7]則反映了大數(shù)據(jù)所含價(jià)值的挖掘過(guò)程。具體而言,其是一個(gè)“離散數(shù)據(jù)集成化數(shù)據(jù)知識(shí)理解普適機(jī)理凝練解釋客觀(guān)現(xiàn)象、回歸自然”的螺旋式上升過(guò)程,每個(gè)環(huán)節(jié)都是大數(shù)據(jù)的一次增值。那具體應(yīng)當(dāng)如何實(shí)現(xiàn)呢?
最后是數(shù)據(jù)隱私。數(shù)據(jù)獲取、分析和運(yùn)用中,必然會(huì)帶來(lái)隱私問(wèn)題。與傳統(tǒng)隱私問(wèn)題相比,大數(shù)據(jù)隱私的來(lái)源和波及范圍更廣,相應(yīng)產(chǎn)生的影響也更為深遠(yuǎn),尤其是個(gè)人隱私。其目前面臨的問(wèn)題與20世紀(jì)臭名昭著的塔斯基吉梅毒實(shí)驗(yàn)十分相似,都表現(xiàn)出BCD特征。第一,Beyond Users,即凌駕于用戶(hù)之上的目標(biāo)。大數(shù)據(jù)收集者不僅將數(shù)據(jù)用于改善用戶(hù)體驗(yàn),也通過(guò)數(shù)據(jù)交易提高收益。而梅毒實(shí)驗(yàn)工作人員不惜以被試身體健康為代價(jià),收集用于推動(dòng)梅毒研究的實(shí)驗(yàn)數(shù)據(jù)。第二,Cheap Service,即為用戶(hù)提供廉價(jià)服務(wù)。大數(shù)據(jù)收集者通過(guò)為用戶(hù)提供廉價(jià)的產(chǎn)品來(lái)獲取更為昂貴的個(gè)人數(shù)據(jù)。而梅毒實(shí)驗(yàn)工作人員則通過(guò)為被試提供廉價(jià)的食物來(lái)獲取更為昂貴的實(shí)驗(yàn)數(shù)據(jù)。第三,Deceptive Means,即通過(guò)欺騙性手段挖掘更多用戶(hù)價(jià)值。大數(shù)據(jù)收集者可能會(huì)向用戶(hù)申請(qǐng)其提供服務(wù)并不需要的權(quán)限。而梅毒實(shí)驗(yàn)工作人員為進(jìn)一步獲取實(shí)驗(yàn)數(shù)據(jù),聲稱(chēng)(實(shí)際并沒(méi)有)為被試提供醫(yī)療服務(wù)。
以公平為核心的算法層挑戰(zhàn)。算法是人工智能的核心所在,那么算法本身有沒(méi)有問(wèn)題呢?就算法的提出、訓(xùn)練、測(cè)試和最終應(yīng)用來(lái)看,公平問(wèn)題較為突出。心理學(xué)家亞當(dāng)斯的公平理論認(rèn)為,人們對(duì)公平的感知取決于社會(huì)或歷史比較;社會(huì)學(xué)領(lǐng)域強(qiáng)調(diào)同工同酬;而哲學(xué)家羅爾斯則寄希望于通過(guò)“無(wú)知之幕”下的社會(huì)契約論來(lái)實(shí)現(xiàn)公平?!缎乱淮斯ぶ悄苤卫碓瓌t》中將“公平公正”列為原則之一,指出人工智能發(fā)展應(yīng)促進(jìn)公平公正,保障利益相關(guān)者的權(quán)益,促進(jìn)機(jī)會(huì)均等。通過(guò)持續(xù)提高技術(shù)水平,改善管理方式,在數(shù)據(jù)獲取、算法設(shè)計(jì)、技術(shù)開(kāi)發(fā)、產(chǎn)品研發(fā)和應(yīng)用過(guò)程中消除偏見(jiàn)和歧視。
筆者認(rèn)為人工智能算法中的公平主要包括兩個(gè)涵義:第一,面向數(shù)據(jù)集公平,即在算法相同的前提下,基于相似的數(shù)據(jù)集可以訓(xùn)練出相似的模型。第二,面向數(shù)據(jù)個(gè)體公平,即對(duì)于訓(xùn)練好的模型而言,輸入相似的數(shù)據(jù)個(gè)體可以得到相似的輸出結(jié)果。但實(shí)際應(yīng)用并非如此。由于現(xiàn)實(shí)社會(huì)的復(fù)雜性,人天生帶有偏見(jiàn),而這些偏見(jiàn)會(huì)被有意識(shí)或無(wú)意識(shí)地帶入訓(xùn)練數(shù)據(jù)標(biāo)注中;再加上訓(xùn)練數(shù)據(jù)規(guī)模和質(zhì)量的差異,很容易導(dǎo)致測(cè)試結(jié)果的不同;在這些因素的共同作用下,最終模型就會(huì)帶有偏見(jiàn),進(jìn)而將這種偏見(jiàn)體現(xiàn)在實(shí)踐應(yīng)用的每個(gè)數(shù)據(jù)個(gè)體上。因此,理想情況下,公平的人工智能可以足夠反映客觀(guān)現(xiàn)實(shí),即面向數(shù)據(jù)集公平;同時(shí),也可以做到糾正主觀(guān)偏見(jiàn),即面向數(shù)據(jù)個(gè)體公平。
以研究方法論為核心的應(yīng)用層挑戰(zhàn)。人工智能可以提高計(jì)算社會(huì)科學(xué)的數(shù)據(jù)挖掘和預(yù)測(cè)等能力,但其研究方法論在根本上決定了這個(gè)學(xué)科能夠走多遠(yuǎn)。計(jì)算社會(huì)科學(xué)固然可以推動(dòng)人工智能對(duì)人類(lèi)智能的“了解”,但最終效果依舊有賴(lài)于計(jì)算社會(huì)科學(xué)本身對(duì)人類(lèi)的認(rèn)知。因此,要真正發(fā)揮人工智能與計(jì)算社會(huì)科學(xué)的綜合效應(yīng),應(yīng)當(dāng)從計(jì)算社會(huì)科學(xué)的研究方法論入手。
計(jì)算社會(huì)科學(xué)是一門(mén)典型的交叉學(xué)科,它以前所未有的廣度、深度和規(guī)模大量收集和分析數(shù)據(jù),并通過(guò)計(jì)算建模的方法實(shí)現(xiàn)社會(huì)—技術(shù)系統(tǒng)的行為預(yù)測(cè),是科學(xué)研究范式從實(shí)驗(yàn)科學(xué)、理論科學(xué)發(fā)展到計(jì)算科學(xué)、探索科學(xué)的產(chǎn)物。誠(chéng)然,雖來(lái)自于自然科學(xué),這四大科學(xué)研究范式在提出之后卻同時(shí)推動(dòng)了計(jì)算社會(huì)科學(xué)的發(fā)展。但是,計(jì)算社會(huì)科學(xué)和自然科學(xué)的研究對(duì)象具有本質(zhì)差異,前者面向人,后者面向物。從學(xué)科分類(lèi)體系來(lái)看,計(jì)算社會(huì)科學(xué)是總體邏輯思維,自然科學(xué)是類(lèi)型邏輯思維??傮w邏輯思維關(guān)注獨(dú)立各異個(gè)案的整體分布,其認(rèn)為變異是社會(huì)現(xiàn)實(shí)的本質(zhì),研究工作是從變異中尋求規(guī)律,以經(jīng)驗(yàn)為基礎(chǔ),以量化為導(dǎo)向地去概括總體變異的系統(tǒng)模式。這種量化無(wú)法挖掘出普適規(guī)律來(lái)描述和解釋所有個(gè)體行為。類(lèi)型邏輯思維則認(rèn)為應(yīng)該重點(diǎn)關(guān)注典型對(duì)象,只要理解了典型對(duì)象的規(guī)律,就可以將其概括并推廣到個(gè)體和具體問(wèn)題。因此,實(shí)證主義等社會(huì)科學(xué)向自然科學(xué)看齊的研究方法并不能從根本上適應(yīng)社會(huì)科學(xué)。計(jì)算社會(huì)科學(xué)需要在方法論上進(jìn)行革新。
以數(shù)據(jù)治理為核心的生態(tài)系統(tǒng)挑戰(zhàn)。在人工智能與計(jì)算社會(huì)科學(xué)相輔相成的背景下,我們稱(chēng)數(shù)據(jù)層、算法層和應(yīng)用層均存在的問(wèn)題為生態(tài)系統(tǒng)的大數(shù)據(jù)治理挑戰(zhàn)。“治理”(Governance)一詞最早起源于拉丁文“掌舵”(steering),起初用于“政府治理”。后受到企業(yè)認(rèn)同和重視,出現(xiàn)了“企業(yè)治理”。隨著IT資源和數(shù)據(jù)資源的不斷豐富,出現(xiàn)了“IT治理”和“數(shù)據(jù)治理”的概念。而“大數(shù)據(jù)治理”則是“數(shù)據(jù)治理”的延伸,同時(shí)又具有其獨(dú)特性。Sunil Sores認(rèn)為,[8]“大數(shù)據(jù)治理是廣義信息治理計(jì)劃的一部分,即制定與大數(shù)據(jù)有關(guān)的數(shù)據(jù)優(yōu)化、隱私保護(hù)與數(shù)據(jù)變現(xiàn)的政策”。但正如信息安全領(lǐng)域經(jīng)典的“七分靠管理,三分靠技術(shù)”所言,筆者認(rèn)為,“大數(shù)據(jù)治理”不應(yīng)僅具有政策內(nèi)涵,還應(yīng)包括相關(guān)技術(shù)手段。這里的大數(shù)據(jù)治理挑戰(zhàn)具體包括數(shù)據(jù)獲取,數(shù)據(jù)發(fā)布,數(shù)據(jù)權(quán)利、責(zé)任、角色和風(fēng)險(xiǎn),利益相關(guān)者,以及外部影響五個(gè)方面。[9]
第一,即使是在大數(shù)據(jù)時(shí)代,數(shù)據(jù)也并非無(wú)源之水。數(shù)據(jù)獲取需要大量社會(huì)資源的持續(xù)投入。第二,數(shù)據(jù)既沒(méi)有專(zhuān)利完善的保護(hù)措施,也沒(méi)有論文發(fā)表的成熟機(jī)制,因此在發(fā)布方面存在數(shù)據(jù)投資、保存和應(yīng)用的制度和技術(shù)問(wèn)題。第三,當(dāng)數(shù)據(jù)成為重要資源,產(chǎn)學(xué)研政各界都將開(kāi)始圍繞數(shù)據(jù)展開(kāi)價(jià)值挖掘活動(dòng)。但如何將數(shù)據(jù)所有權(quán)、使用權(quán)、許可權(quán)等權(quán)利,數(shù)據(jù)維護(hù)和監(jiān)督等責(zé)任,以及數(shù)據(jù)泄露和不完整等帶來(lái)的一系列風(fēng)險(xiǎn)分配給不同角色卻依舊懸而未決。第四,數(shù)據(jù)的利益相關(guān)者包括企業(yè)、高校、科研機(jī)構(gòu)、學(xué)者、學(xué)生、圖書(shū)館、博物館、出版商、資助機(jī)構(gòu)以及政府單位等。如何在不同利益相關(guān)者之間分配數(shù)據(jù)采集和繁雜的數(shù)據(jù)監(jiān)護(hù)[10]任務(wù),并進(jìn)一步構(gòu)建大數(shù)據(jù)時(shí)代的數(shù)據(jù)人才基礎(chǔ)設(shè)施?第五,從產(chǎn)生到投入實(shí)踐,數(shù)據(jù)面臨的外部影響主要包括經(jīng)濟(jì)與數(shù)據(jù)價(jià)值、數(shù)據(jù)產(chǎn)權(quán)和倫理觀(guān)三個(gè)方面的問(wèn)題。我們又應(yīng)當(dāng)如何緩解或解決這些新問(wèn)題呢?
綜上,將人工智能應(yīng)用于計(jì)算社會(huì)科學(xué),并同時(shí)實(shí)現(xiàn)計(jì)算社會(huì)科學(xué)反哺人工智能,將會(huì)面臨數(shù)據(jù)層的數(shù)據(jù)壟斷、大數(shù)據(jù)融合和數(shù)據(jù)隱私問(wèn)題,算法層的公平問(wèn)題,應(yīng)用層的計(jì)算社會(huì)科學(xué)研究方法論問(wèn)題,以及整個(gè)生態(tài)系統(tǒng)都可能存在的大數(shù)據(jù)治理問(wèn)題。如何克服這些挑戰(zhàn),從而真正發(fā)揮二者相輔相成的協(xié)同作用呢?
機(jī)遇
人工智能浪潮中的計(jì)算社會(huì)科學(xué)縱然面臨眾多挑戰(zhàn),但同時(shí),相關(guān)技術(shù)的發(fā)展和制度的完善也為二者的協(xié)同進(jìn)步奠定了基礎(chǔ)。下面將分別從數(shù)據(jù)層、算法層、應(yīng)用層和生態(tài)系統(tǒng)四個(gè)方面闡釋解決方案。
基于隱私保護(hù)的數(shù)據(jù)層解決方案。作為計(jì)算社會(huì)科學(xué)和人工智能的基礎(chǔ),數(shù)據(jù)層面臨的挑戰(zhàn)主要包括數(shù)據(jù)壟斷甚至爭(zhēng)奪、大數(shù)據(jù)融合和數(shù)據(jù)隱私三方面。針對(duì)這些問(wèn)題,筆者建議從數(shù)據(jù)共享,大數(shù)據(jù)融合,以及隱私保護(hù)技術(shù)、聯(lián)邦學(xué)習(xí)和隱私保護(hù)制度著手進(jìn)行現(xiàn)狀改善。
首先是針對(duì)數(shù)據(jù)壟斷的數(shù)據(jù)共享。從歷史角度來(lái)看,數(shù)據(jù)已經(jīng)從“About Enterprise”轉(zhuǎn)變?yōu)?ldquo;About People”,從而進(jìn)一步擴(kuò)大了數(shù)據(jù)生態(tài)的馬太效應(yīng),以至于目前10%的數(shù)據(jù)收集者掌握著用戶(hù)99%的權(quán)限數(shù)據(jù)。導(dǎo)致這種現(xiàn)狀的另一原因是數(shù)據(jù)收集者之間的數(shù)據(jù)收集方法、云計(jì)算技術(shù)水平、分析方法,以及經(jīng)濟(jì)實(shí)力等方面存在較大差異??蓮囊?guī)范數(shù)據(jù)收集和鼓勵(lì)數(shù)據(jù)共享兩個(gè)方面入手緩解該問(wèn)題。規(guī)范數(shù)據(jù)收集將在隱私保護(hù)部分做進(jìn)一步解釋?zhuān)@里重點(diǎn)闡述鼓勵(lì)數(shù)據(jù)共享。一方面,組建數(shù)據(jù)共享中心。傳統(tǒng)意義上,數(shù)據(jù)共享意味著數(shù)據(jù)在不同使用者之間的物理拷貝和流通。但是,這種共享方式帶來(lái)的安全問(wèn)題較多;且數(shù)據(jù)存儲(chǔ)和計(jì)算等成本非常高,經(jīng)濟(jì)實(shí)力較弱的數(shù)據(jù)收集者依舊無(wú)法承擔(dān)。因此,可以考慮組建數(shù)據(jù)共享中心,其成員不僅可以使用中心的數(shù)據(jù),也可以使用相關(guān)基礎(chǔ)設(shè)施和計(jì)算資源。另一方面,完善數(shù)據(jù)共享相關(guān)制度。目前,國(guó)內(nèi)已組建了貴州、上海等大數(shù)據(jù)交易中心,并推出了“數(shù)+12”戰(zhàn)略的數(shù)據(jù)交易生態(tài)等。不過(guò),還應(yīng)當(dāng)針對(duì)掌握大量用戶(hù)數(shù)據(jù)的企業(yè)出臺(tái)相關(guān)數(shù)據(jù)共享的激勵(lì)和合規(guī)政策。
其次是大數(shù)據(jù)融合相關(guān)技術(shù)。單個(gè)數(shù)據(jù)源的價(jià)值有限,要進(jìn)一步實(shí)現(xiàn)價(jià)值提升,就必須進(jìn)行大數(shù)據(jù)融合。其獨(dú)特性與問(wèn)題包括:第一,割裂的多源異構(gòu)數(shù)據(jù),如生物領(lǐng)域的基因組、蛋白質(zhì)和文獻(xiàn)等;第二,數(shù)據(jù)規(guī)模與數(shù)據(jù)價(jià)值之間的矛盾,即相關(guān)數(shù)據(jù)越多,可挖掘的知識(shí)越多,數(shù)據(jù)價(jià)值就越高,但相應(yīng)數(shù)據(jù)挖掘的難度也會(huì)更大;第三,跨媒體、跨語(yǔ)言的關(guān)聯(lián),如圖片、音視頻與文本數(shù)據(jù)的關(guān)聯(lián);第四,實(shí)體和關(guān)系的動(dòng)態(tài)演化,如學(xué)者更換其所在單位;第五,知識(shí)的隱含性,如學(xué)者之間的“合作”關(guān)系可能暗含“師生”關(guān)系。作為大數(shù)據(jù)背景下的數(shù)據(jù)處理手段,“大數(shù)據(jù)融合”[11]用于從大數(shù)據(jù)中發(fā)現(xiàn)知識(shí),并按照知識(shí)的語(yǔ)義邏輯關(guān)聯(lián)融合形成更接近人類(lèi)思維的知識(shí),是一種數(shù)據(jù)融合與知識(shí)融合雙環(huán)驅(qū)動(dòng)的大數(shù)據(jù)價(jià)值發(fā)現(xiàn)方法。其中數(shù)據(jù)融合包括模式對(duì)齊、實(shí)體鏈接、數(shù)據(jù)一致性和數(shù)據(jù)溯源;而知識(shí)融合則指知識(shí)抽象和建模、關(guān)系推理、深度知識(shí)發(fā)現(xiàn),以及普適機(jī)理的剖析和歸納。
最后是數(shù)據(jù)隱私問(wèn)題。數(shù)據(jù)從“About Enterprise”轉(zhuǎn)變?yōu)?ldquo;About People”帶來(lái)的第一個(gè)問(wèn)題就是隱私泄露。目前,可以從技術(shù)和制度兩方面進(jìn)行隱私保護(hù)。技術(shù)上主要包括基于擾動(dòng)的隱私保護(hù)技術(shù)、基于密碼學(xué)的隱私保護(hù)技術(shù)和基于分布式訓(xùn)練的聯(lián)邦學(xué)習(xí)技術(shù)。第一,基于擾動(dòng)的隱私保護(hù)技術(shù)指差分隱私、K匿名等,其計(jì)算效率高,目前已有成熟應(yīng)用。但是,這種隱私保護(hù)技術(shù)與決策可解釋性之間存在矛盾。一方面,為了保證決策可解釋性,就必須保證數(shù)據(jù)的準(zhǔn)確性,這樣很容易出現(xiàn)隱私泄露問(wèn)題;另一方面,要保護(hù)隱私,就一定會(huì)導(dǎo)致數(shù)據(jù)準(zhǔn)確性降低,決策可解釋性隨之降低。因此,如何在大數(shù)據(jù)隱私和決策可解釋性之間達(dá)到良好平衡,是一個(gè)亟待解決的問(wèn)題。第二,基于密碼學(xué)的隱私保護(hù)技術(shù)指同態(tài)加密、安全多方計(jì)算等,其安全性較高,數(shù)據(jù)可恢復(fù),但效率較低,無(wú)法廣泛應(yīng)用。第三,基于分布式訓(xùn)練的聯(lián)邦學(xué)習(xí)技術(shù),其旨在通過(guò)共享模型參數(shù)而非具體數(shù)據(jù)來(lái)完成機(jī)器學(xué)習(xí)訓(xùn)練過(guò)程。相比于集中訓(xùn)練方式,聯(lián)邦學(xué)習(xí)更適用于隱私保護(hù)場(chǎng)景,但其隱私攻擊既可能來(lái)自于服務(wù)端,也可能來(lái)自于其他惡意設(shè)備。而且目前仍處于起步階段,依舊存在通信帶寬受限、模型難收斂、強(qiáng)依賴(lài)于云服務(wù)等問(wèn)題。
從制度上來(lái)看,國(guó)內(nèi)外都已經(jīng)出臺(tái)了一系列隱私保護(hù)法律法規(guī)與條例。自2018年5月1日起,我國(guó)開(kāi)始實(shí)施《信息安全技術(shù)個(gè)人信息安全規(guī)范》;2018年5月25日,歐盟推出《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation,GDPR);2018年11月2日,美國(guó)參議院公布新的隱私立法草案;2019年4月16日,舊金山通過(guò)了《停止秘密監(jiān)視》條例的修訂;2019年5月28日,國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布《數(shù)據(jù)安全管理辦法(征求意見(jiàn)稿)》;2019年6月17日,國(guó)家新一代人工智能治理專(zhuān)業(yè)委員會(huì)發(fā)布《新一代人工智能治理原則——發(fā)展負(fù)責(zé)任的人工智能》,并強(qiáng)調(diào)人工智能發(fā)展應(yīng)尊重和保護(hù)個(gè)人隱私。但是,隱私保護(hù)的美好愿景和現(xiàn)實(shí)生活中的大規(guī)模數(shù)據(jù)泄露之間存在根本矛盾,如Facebook數(shù)據(jù)泄露等事件一再出現(xiàn)。在這樣大規(guī)模數(shù)據(jù)泄露的背景之下,實(shí)現(xiàn)隱私保護(hù)是否真的可能?在未來(lái)會(huì)不會(huì)演變?yōu)闊o(wú)隱私(No Privacy)?
基于數(shù)據(jù)透明的算法層解決方案。根據(jù)前述分析可以發(fā)現(xiàn),雖然算法公平問(wèn)題最終表現(xiàn)在決策階段,但成因可能在數(shù)據(jù)標(biāo)注、模型訓(xùn)練和測(cè)試等階段。因此,要解決公平問(wèn)題,就需要從數(shù)據(jù)和算法兩方面入手。相應(yīng)的計(jì)算機(jī)技術(shù)是數(shù)據(jù)透明。數(shù)據(jù)透明有廣義和狹義之分,廣義的數(shù)據(jù)透明包括狹義的數(shù)據(jù)透明和算法透明。其中,前者[12]指有效獲取數(shù)據(jù)在產(chǎn)生、處理及決策過(guò)程中所涉信息的能力;后者則指算法可解釋?zhuān)磾?shù)據(jù)收集前,用戶(hù)需考慮個(gè)人數(shù)據(jù)將作何種用途;數(shù)據(jù)收集后,第三方需考慮數(shù)據(jù)來(lái)源的真實(shí)性;決策階段,要重點(diǎn)關(guān)注決策過(guò)程的可解釋性。
由于保證了數(shù)據(jù)利益相關(guān)者對(duì)數(shù)據(jù)的知情權(quán)等權(quán)利,以數(shù)據(jù)透明為基礎(chǔ),可以建立和完善數(shù)據(jù)獲取和應(yīng)用的問(wèn)責(zé)機(jī)制、實(shí)現(xiàn)用戶(hù)控制。以數(shù)據(jù)生命周期為標(biāo)準(zhǔn),可以將數(shù)據(jù)透明分為獲取透明、流通透明、使用透明和刪除透明。其中,獲取透明指基于訪(fǎng)問(wèn)控制的數(shù)據(jù)收集;流通透明指基于區(qū)塊鏈的數(shù)據(jù)共享和交易;使用透明包括算法透明和可驗(yàn)證性計(jì)算;而刪除透明則包含了覆蓋刪除和密碼學(xué)刪除。因此,當(dāng)大規(guī)模數(shù)據(jù)泄露不斷出現(xiàn),隱私保護(hù)已不再現(xiàn)實(shí),就可以使用數(shù)據(jù)透明來(lái)保證數(shù)據(jù)的合理運(yùn)用。
就算法透明而言,《新一代人工智能治理原則——發(fā)展負(fù)責(zé)任的人工智能》中提出了“安全可控”原則,即人工智能系統(tǒng)應(yīng)不斷提升透明性、可解釋性、可靠性、可控性,逐步實(shí)現(xiàn)可審核、可監(jiān)督、可追溯、可信賴(lài)。
綜上,建立數(shù)據(jù)透明的治理體系是解決人工智能時(shí)代隱私、效率和公平的關(guān)鍵,中國(guó)應(yīng)該先行一步。
基于新型研究范式的應(yīng)用層解決方案。計(jì)算社會(huì)科學(xué)從誕生到進(jìn)一步發(fā)展的成長(zhǎng)過(guò)程中曾受惠于四大科學(xué)研究范式。但是,由于與自然科學(xué)在研究對(duì)象、邏輯思維以及現(xiàn)實(shí)復(fù)雜性等方面存在本質(zhì)區(qū)別,其面臨的方法論挑戰(zhàn)日益嚴(yán)峻。當(dāng)下的計(jì)算社會(huì)科學(xué)能否實(shí)現(xiàn)新一輪的方法論革新,并將其上升為新型科學(xué)研究范式,實(shí)現(xiàn)科學(xué)研究范式轉(zhuǎn)移,進(jìn)而惠及其他交叉學(xué)科,乃至自然科學(xué)?答案是肯定的。后大數(shù)據(jù)時(shí)代的計(jì)算模式將成為未來(lái)社會(huì)的重要基礎(chǔ)設(shè)施。而智能萬(wàn)物互聯(lián)的信息技術(shù)將以更加豐富的方式描述現(xiàn)實(shí)世界,從而推動(dòng)社會(huì)學(xué)等領(lǐng)域的專(zhuān)家學(xué)者更加了解人類(lèi)賴(lài)以生存的社會(huì)系統(tǒng)。同時(shí),中國(guó)的城市化、網(wǎng)絡(luò)化等發(fā)展趨勢(shì)與萬(wàn)物互聯(lián)天然契合,將有望成為科學(xué)研究范式轉(zhuǎn)移實(shí)現(xiàn)的沃土。當(dāng)技術(shù)和社會(huì)背景同時(shí)發(fā)生變革,誕生于二者交織背景下的計(jì)算社會(huì)科學(xué)應(yīng)當(dāng)如何化挑戰(zhàn)為機(jī)遇?
一方面,計(jì)算社會(huì)科學(xué)應(yīng)當(dāng)充分把握與生俱來(lái)的技術(shù)和社會(huì)優(yōu)勢(shì),在“技術(shù)推動(dòng)社會(huì)發(fā)展,社會(huì)豐富技術(shù)內(nèi)涵”的相輔相成機(jī)制中進(jìn)一步向前邁進(jìn)。在未來(lái)萬(wàn)物互聯(lián)和以城市化為中心的中國(guó)社會(huì),社會(huì)科學(xué)將不再一味地依賴(lài)信息技術(shù)的發(fā)展。這里以萬(wàn)物互聯(lián)的重要技術(shù)基礎(chǔ)5G為例進(jìn)行闡釋。近來(lái),5G技術(shù)的發(fā)展及其作用已經(jīng)被過(guò)分夸大,其未來(lái)發(fā)展不是帶寬問(wèn)題,而是內(nèi)涵問(wèn)題??墒牵?jì)算機(jī)信息技術(shù)只能滿(mǎn)足帶寬需求,因此,只有依靠計(jì)算社會(huì)科學(xué),5G的內(nèi)涵才能進(jìn)一步得以豐富。
另一方面,計(jì)算社會(huì)科學(xué)不應(yīng)一味向自然科學(xué)看齊,而要基于對(duì)現(xiàn)實(shí)世界的準(zhǔn)確描述,構(gòu)建自己的理論框架,形成自己的方法論。根據(jù)前述內(nèi)容,我們有理由相信如果充分利用萬(wàn)物互聯(lián)時(shí)代的優(yōu)勢(shì),同時(shí)從社會(huì)背景和現(xiàn)實(shí)需求出發(fā)進(jìn)一步豐富萬(wàn)物互聯(lián)的技術(shù)內(nèi)涵,進(jìn)而使二者相互促進(jìn),以社會(huì)科學(xué)家為代表的學(xué)者們可能提出真正植根于社會(huì)科學(xué)的第五科學(xué)研究范式。新的研究范式將以大量社會(huì)科學(xué)活動(dòng)為積淀,旨在挖掘新社會(huì)需求,豐富新技術(shù)內(nèi)涵,在促進(jìn)交叉學(xué)科研究的同時(shí),推動(dòng)社會(huì)前進(jìn)。
基于數(shù)據(jù)治理的生態(tài)系統(tǒng)解決方案。歷史地看,數(shù)據(jù)發(fā)展共有兩條主線(xiàn)。第一條是Data about Enterprise,數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)集成都是典型代表;進(jìn)入大數(shù)據(jù)時(shí)代之后,Data about People成為第二條主線(xiàn),數(shù)據(jù)思維、數(shù)據(jù)智能與數(shù)據(jù)生態(tài)等名詞層出不窮。現(xiàn)有數(shù)據(jù)生態(tài)的特殊性決定了數(shù)據(jù)確權(quán)、定價(jià)、交易等不能解決數(shù)據(jù)壟斷、隱私和公平等問(wèn)題。
人工智能和計(jì)算社會(huì)科學(xué)均因數(shù)據(jù)而蓬勃發(fā)展。正如在“大數(shù)據(jù)融合”挑戰(zhàn)中所闡釋的那樣,要真正從多元異構(gòu)、價(jià)值不一的數(shù)據(jù)中提取信息,并進(jìn)一步轉(zhuǎn)化為知識(shí),就需在傳統(tǒng)數(shù)據(jù)分析工具的基礎(chǔ)上進(jìn)一步改進(jìn),運(yùn)用大數(shù)據(jù)融合相關(guān)技術(shù)。但數(shù)據(jù)從產(chǎn)生到處理,到存儲(chǔ),到進(jìn)一步價(jià)值提升,再到最終應(yīng)用等都會(huì)面臨數(shù)據(jù)產(chǎn)權(quán)等一系列相關(guān)問(wèn)題。而“數(shù)據(jù)治理”則旨在解決這一系列數(shù)據(jù)挑戰(zhàn)。
為了在充分挖掘數(shù)據(jù)價(jià)值的同時(shí),尊重?cái)?shù)據(jù)相關(guān)權(quán)利,從而促進(jìn)科學(xué)研究進(jìn)步,推動(dòng)社會(huì)向前發(fā)展,在產(chǎn)學(xué)研政企等利益相關(guān)者之間建立合作共贏(yíng)的數(shù)據(jù)共享模式、制定合理的規(guī)章制度非常必要。同時(shí),需要推動(dòng)相關(guān)技術(shù)向前發(fā)展。惟其如此,才能在降低信息泄露風(fēng)險(xiǎn)、維護(hù)公平的同時(shí),又保留數(shù)據(jù)價(jià)值。
總之,人工智能將成為計(jì)算社會(huì)科學(xué)的重要研究工具;同時(shí),計(jì)算社會(huì)科學(xué)也將推動(dòng)人工智能“了解智能”。因此,計(jì)算社會(huì)科學(xué)應(yīng)當(dāng)在人工智能浪潮中充分提升其數(shù)據(jù)挖掘和預(yù)測(cè)能力;同時(shí)也可以為人工智能的發(fā)展貢獻(xiàn)力量。
注釋
[1]Samuel A L, "Artificial intelligence - a frontier of automation", The Annals of the American Academy of Political and Social Science, 1962, 4(1), pp. 173-177.
[2]Sculley D, Holt G, Golovin D, et al, "Hidden technical debt in machine learning systems", International Conference on Neural Information Processing Systems, MIT Press, 2015.
[3][美]阿萊克斯·彭特蘭:《智慧社會(huì)》,汪小帆、汪容譯,杭州:浙江人民出版社,2015年,第19頁(yè)。
[4]Lazer D, Pentland A, Adamic L, et al, "Computational social science", Science, 2009, 323(1), pp. 721-723.
[5]Conte R, Gilbert N, Bonelli G, et al, "Manifesto of computational social science", The European Physical Journal Special Topics, 2012, 214(1), pp. 325-346.
[6]孟小峰、李勇、祝建華:《社會(huì)計(jì)算:大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)》,《計(jì)算機(jī)研究與發(fā)展》,2013年第12期,第2483~2491頁(yè)。
[7][11]孟小峰、杜治娟:《大數(shù)據(jù)融合研究:?jiǎn)栴}與挑戰(zhàn)》,《計(jì)算機(jī)研究與發(fā)展》, 2016年第2期,第231~246頁(yè)。
[8][美]桑尼爾·索雷斯:《大數(shù)據(jù)治理》,匡斌譯,北京:清華大學(xué)出版社,2014年,第4頁(yè)。
[9]Christine L.Borgman, Big data, little data, no data: scholarship in the networked world, The MIT Press, 2015, pp. 271-288.
[10]Lord, Philip, and Alison M.," E-science curation report: data curation for e-science in the UK: an audit to establish requirements for future curation and provision", Digital Archiving Consultancy Limited, 2003.
[12]Elisa B, "Big data-security and privacy and transparency", Privacy and Security in Big Data Ecosystem, Keynote, 2017.
責(zé) 編/張 曉
孟小峰,中國(guó)人民大學(xué)信息學(xué)院教授、博導(dǎo),中國(guó)計(jì)算機(jī)學(xué)會(huì)會(huì)士(2013)。研究方向?yàn)榇髷?shù)據(jù)管理系統(tǒng),包括數(shù)據(jù)融合、大數(shù)據(jù)實(shí)時(shí)分析、大數(shù)據(jù)隱私管理以及交叉性研究。主要著作有《大數(shù)據(jù)管理概論》《Web數(shù)據(jù)管理:概念與技術(shù)》《移動(dòng)數(shù)據(jù)管理:概念與技術(shù)》等。
Computational Social Science and the Burgeoning Artificial Intelligence
Meng Xiaofeng
Abstract: After several rounds of ups and downs in the last 60 years, artificial intelligence (AI) has finally ushered in a new golden period of development. Computational social science is a subject born out of data, and AI will become an important research tool of it. At the same time, the computational social science will also push AI to "understand intelligence". In the new era, their combination is an imperative. However, this will pose challenges in the data level, algorithm level, application level and the eco-system level. This paper will analyze these challenges and propose corresponding solutions, aiming to further advance AI and computational social science by means of "technology + system".
Keywords: artificial intelligence, computational social science, data, algorithm, eco-system