隨著人工智能的快速發(fā)展,大模型技術(shù)已成為當(dāng)今人工智能領(lǐng)域的熱門話題。2022年底以來,認(rèn)知大模型掀起通用人工智能的全新熱潮,其歷史意義被認(rèn)為“不亞于PC和互聯(lián)網(wǎng)的誕生”。2024年12月底,深度求索公司先后發(fā)布DeepSeek V3和DeepSeekR1大模型,并快速“出圈”,提升了我國(guó)在全球人工智能領(lǐng)域的影響力,引發(fā)國(guó)內(nèi)外廣泛關(guān)注,在全球范圍掀起又一輪大模型發(fā)展浪潮。鑒于此,梳理大模型技術(shù)的進(jìn)展和產(chǎn)業(yè)發(fā)展現(xiàn)狀,剖析其面臨的困難挑戰(zhàn)以及未來發(fā)展趨勢(shì),并找到針對(duì)性的對(duì)策,有助于我們?nèi)嫔钊氲卣莆沾竽P瓦@一前沿領(lǐng)域,加快推動(dòng)我國(guó)大模型技術(shù)與產(chǎn)業(yè)的發(fā)展邁上新臺(tái)階。
大模型技術(shù)及產(chǎn)業(yè)發(fā)展現(xiàn)狀
2017年,Google提出Transformer架構(gòu),成為大模型領(lǐng)域主流算法基礎(chǔ)。次年,OpenAI發(fā)布GPT-1、Google推出BERT,預(yù)訓(xùn)練大模型由此成為自然語言處理主流。此后,AI大模型技術(shù)不斷突破。2020年起,OpenAI陸續(xù)推出GPT-3、GPT-3.5、GPT-4,AI能力多輪提升。至2024年,全球大模型井噴式發(fā)展。OpenAI發(fā)布的文生視頻Sora模型,推動(dòng)大模型技術(shù)向語音、視覺等多模態(tài)及學(xué)科交叉方向拓展;隨后推出的GPT-4o能夠?qū)崟r(shí)處理多類型信息,顯著提升了人機(jī)對(duì)話響應(yīng)速度;發(fā)布的o1-Preview大模型則大幅提高了復(fù)雜推理能力。同年末,又推出了o1pro、o3等新一代推理大模型,向通用人工智能進(jìn)一步邁進(jìn)。在國(guó)內(nèi),眾多公司以及高校和科研機(jī)構(gòu)均加大投入,發(fā)布眾多通用大模型,形成了“百花齊放”的景象。例如,百度的“文心一言”、阿里的“通義千問”、字節(jié)跳動(dòng)的“豆包”以及科大訊飛的“訊飛星火”,特別是深度求索公司發(fā)布的DeepSeekV3和DeepSeekR1大模型,通過打破傳統(tǒng)的“算力競(jìng)賽”規(guī)則并完全開源,成為國(guó)內(nèi)的一個(gè)里程碑事件。
在產(chǎn)業(yè)應(yīng)用方面,國(guó)外微軟、谷歌等大廠積極探索企業(yè)級(jí)服務(wù)商業(yè)化路徑,加快產(chǎn)業(yè)落地。微軟先后把ChatGPT/GPT-4能力融入Bing搜索引擎、Office全家桶、Azure云服務(wù)和Teams程序等,推出Microsoft 365Co-pilot,顯著提升Office生產(chǎn)力與交互體驗(yàn)。OpenAI借助插件接入互聯(lián)網(wǎng),能調(diào)用各類APP、解決復(fù)雜任務(wù),甚至被美國(guó)國(guó)防部、NASA等政府機(jī)構(gòu)用于情報(bào)分析、軍事戰(zhàn)略規(guī)劃等領(lǐng)域。隨著我國(guó)新基建、新經(jīng)濟(jì)推進(jìn),眾多團(tuán)隊(duì)加速大模型場(chǎng)景創(chuàng)新應(yīng)用。如在教育領(lǐng)域,大模型賦能智慧課堂、個(gè)性化學(xué)習(xí)等,助力教育公平與教學(xué)質(zhì)量提升;在醫(yī)療領(lǐng)域,大模型全方位提升“醫(yī)、教、研、管”各環(huán)節(jié)診療水平。此外,在金融、工業(yè)、政府、科研、電商、文旅、司法等其他領(lǐng)域,大模型也得到廣泛應(yīng)用,為各行業(yè)發(fā)展注入新的動(dòng)力。通過融合Deep-Seek等深度搜索技術(shù)的優(yōu)勢(shì),國(guó)內(nèi)團(tuán)隊(duì)也在不斷探索如何進(jìn)一步提升大模型在特定應(yīng)用場(chǎng)景下的信息檢索與處理能力,以滿足更加復(fù)雜多樣的用戶需求。
面臨的困難和挑戰(zhàn)
盡管大模型技術(shù)及其產(chǎn)業(yè)生態(tài)已取得階段性顯著成果,但其發(fā)展之路仍布滿復(fù)雜且亟待解決的難題與挑戰(zhàn)。
國(guó)產(chǎn)大模型的創(chuàng)新升級(jí)在較大程度上依賴于國(guó)外的先進(jìn)算力。當(dāng)前國(guó)產(chǎn)算力軟件系統(tǒng)的生態(tài)還不成熟,每一次大模型算法創(chuàng)新,都需要額外投入數(shù)月的時(shí)間來進(jìn)行大量的國(guó)產(chǎn)適配移植和效率優(yōu)化工作。此外,國(guó)產(chǎn)大模型訓(xùn)練高度依賴進(jìn)口算力,除個(gè)別模型外,多數(shù)可下載的大模型均基于英偉達(dá)卡訓(xùn)練。考慮到未來我國(guó)獲取英偉達(dá)先進(jìn)制程算力資源的渠道可能會(huì)進(jìn)一步受限,若不能盡快解決國(guó)產(chǎn)自主可控人工智能產(chǎn)業(yè)生態(tài)薄弱、適配困難等問題,我們或?qū)⒚媾R“在他國(guó)基石上構(gòu)筑高樓”的困境。
國(guó)產(chǎn)大模型在落地應(yīng)用生態(tài)方面缺乏成熟有效的工具鏈體系支持。盡管國(guó)家已出臺(tái)多項(xiàng)政策措施,鼓勵(lì)和支持基于國(guó)產(chǎn)硬件開展大模型的落地應(yīng)用,但大模型在實(shí)際行業(yè)應(yīng)用中需要語言、語音及多模態(tài)等多個(gè)大模型的組合創(chuàng)新,同時(shí)還需要針對(duì)行業(yè)/私域知識(shí)和特定場(chǎng)景任務(wù)進(jìn)行定制優(yōu)化,這迫切需要成熟、高效且易用的工具鏈體系來支撐。然而,當(dāng)前國(guó)產(chǎn)落地工具鏈體系的缺失和不足,正嚴(yán)重制約大模型在行業(yè)中的廣泛、快速應(yīng)用,以及創(chuàng)新創(chuàng)業(yè)生態(tài)的構(gòu)建和發(fā)展。
人工智能生成的虛假信息泛濫正在威脅網(wǎng)絡(luò)信息安全。在技術(shù)機(jī)理上,現(xiàn)行人工智能系統(tǒng)主要依托深度神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行統(tǒng)計(jì)建模,這種數(shù)據(jù)驅(qū)動(dòng)范式導(dǎo)致模型存在知識(shí)記憶模糊、幻覺等問題。以O(shè)penAI發(fā)布的GPT-4.5為例,雖將幻覺發(fā)生率較GPT-4o降低40%,但在SimpleQA基準(zhǔn)測(cè)試中仍高達(dá)37.1%。隨著具備長(zhǎng)思維鏈的推理模型用戶增多,由于推理模型在生成內(nèi)容邏輯自洽性、結(jié)構(gòu)嚴(yán)謹(jǐn)性方面的優(yōu)勢(shì),幻覺數(shù)據(jù)會(huì)變得更具迷惑性和欺騙性。普通民眾對(duì)AI技術(shù)了解不足,極易將算法輸出的幻覺數(shù)據(jù)誤判為真實(shí)可信信息。更嚴(yán)峻的是,這些帶算法偏差的虛假信息會(huì)被迭代訓(xùn)練的新一代AI系統(tǒng)重新學(xué)習(xí),并通過搜索引擎等渠道指數(shù)級(jí)擴(kuò)散,最終形成“數(shù)據(jù)污染—算法吸收—再污染”的惡性循環(huán)。
通用大模型技術(shù)的發(fā)展趨勢(shì)及應(yīng)對(duì)策略
當(dāng)前大模型性能的上限天花板在不斷地被抬高,大模型訓(xùn)練和推理的成本也實(shí)現(xiàn)了成倍的降低,預(yù)示著大模型的賦能價(jià)值和產(chǎn)業(yè)規(guī)模都有了更大的發(fā)展空間。面對(duì)上述困難和挑戰(zhàn),我們需時(shí)刻保持敬畏之心,緊跟大模型發(fā)展趨勢(shì),盡快實(shí)現(xiàn)我國(guó)大模型核心技術(shù)突破,全方位推動(dòng)大模型落地。
一是加大并保持對(duì)通用大模型底座“主戰(zhàn)場(chǎng)”的持續(xù)投入。我國(guó)通用人工智能戰(zhàn)略的實(shí)施,可以圍繞以下幾個(gè)核心目標(biāo)展開。其一,確保以中英文為代表的通用底座大模型能力持續(xù)追趕并努力對(duì)標(biāo)國(guó)際最高水平;其二,在示范行業(yè)應(yīng)用的效果和落地價(jià)值形成趕超優(yōu)勢(shì);其三,加大多語種大模型的研發(fā)力度,積極在海外布局大模型推廣,為世界提供多樣化的選擇。對(duì)此,可以采取以下措施:建立全國(guó)性的計(jì)算資源共享及調(diào)度平臺(tái),統(tǒng)籌調(diào)配算力資源,并加快制定算力資源的合理分配、獲取、使用和監(jiān)管政策。支持開展創(chuàng)新算法及核心技術(shù)研究,探索大模型高效并行訓(xùn)練技術(shù),以及邏輯和知識(shí)推理、指令學(xué)習(xí)、人類意圖對(duì)齊等調(diào)優(yōu)方法。深入研究基于增量預(yù)訓(xùn)練的行業(yè)大模型訓(xùn)練技術(shù)、多源異構(gòu)行業(yè)知識(shí)檢索等關(guān)鍵技術(shù),并結(jié)合教育、醫(yī)療、金融、司法等應(yīng)用場(chǎng)景,設(shè)計(jì)適合特定垂直領(lǐng)域的算法架構(gòu)。
二是加快構(gòu)建國(guó)產(chǎn)算力平臺(tái)上的自主可控大模型及產(chǎn)業(yè)生態(tài)。近期,DeepSeek的推出引發(fā)了國(guó)際社會(huì)對(duì)我國(guó)人工智能發(fā)展的高度關(guān)注,未來可能會(huì)面臨對(duì)人工智能芯片、存儲(chǔ)、計(jì)算架構(gòu)等技術(shù)要素的更嚴(yán)格限制,國(guó)產(chǎn)自主可控比以往任何時(shí)候都更加迫切。為此,我們要鼓勵(lì)基于自主可控國(guó)產(chǎn)算力平臺(tái)的大模型研發(fā)和應(yīng)用,加速基于國(guó)產(chǎn)算力的大模型算法創(chuàng)新。鼓勵(lì)國(guó)有企業(yè)尤其是央企優(yōu)先采購(gòu)基于國(guó)產(chǎn)算力平臺(tái)研發(fā)的全棧自主可控大模型。加快推進(jìn)面向教育、醫(yī)療、工業(yè)、科研等領(lǐng)域的國(guó)家人工智能行業(yè)應(yīng)用基地建設(shè),推動(dòng)國(guó)產(chǎn)大模型在各基地落地應(yīng)用,持續(xù)形成迭代“數(shù)據(jù)飛輪”。鼓勵(lì)依托自主可控算力底座建立的大模型開發(fā)者生態(tài)發(fā)展和開源社區(qū)建設(shè),通過專項(xiàng)支持加快形成國(guó)產(chǎn)大模型生態(tài)體系和工具鏈,加速我國(guó)自主可控人工智能產(chǎn)業(yè)生態(tài)發(fā)展。支持全國(guó)產(chǎn)化大模型“線上”開放平臺(tái)建設(shè),推動(dòng)國(guó)產(chǎn)化大模型能力和工具開放共享,降低中小企業(yè)國(guó)產(chǎn)化開發(fā)門檻。
三是構(gòu)建預(yù)防大模型幻覺數(shù)據(jù)泛濫的專項(xiàng)治理體系?;糜X數(shù)據(jù)不僅影響AI行業(yè)的深度應(yīng)用,更危及互聯(lián)網(wǎng)和數(shù)字經(jīng)濟(jì)時(shí)代的社會(huì)安全。為此,應(yīng)建立針對(duì)不同可信度和危害程度的數(shù)據(jù)標(biāo)簽體系,搭建分層分類的數(shù)據(jù)信息可信等級(jí)認(rèn)證與溯源體系,為公眾提供安全可靠的信息和知識(shí)來源。定期清理幻覺數(shù)據(jù),及時(shí)澄清重大事件真相,降低輿情風(fēng)險(xiǎn)和社會(huì)危害。推動(dòng)國(guó)家級(jí)高質(zhì)量訓(xùn)練數(shù)據(jù)的開放和共享,為AI模型訓(xùn)練提供優(yōu)質(zhì)的數(shù)據(jù)集和知識(shí)檢索增強(qiáng)信源。重點(diǎn)攻克深度推理模型的長(zhǎng)思維鏈幻覺治理難題,確保思考推理過程及結(jié)果的可信可溯源,特別是在教育、醫(yī)療、安全等高敏感行業(yè),研發(fā)專業(yè)思維鏈融合和行業(yè)知識(shí)數(shù)據(jù)增強(qiáng)等技術(shù)。同時(shí),組織研發(fā)AIGC幻覺治理與數(shù)據(jù)安全防護(hù)技術(shù)及平臺(tái),突破幻覺自動(dòng)分析、AIGC深度鑒偽、虛假信息檢測(cè)、有害內(nèi)容識(shí)別以及互聯(lián)網(wǎng)傳播溯源等關(guān)鍵技術(shù)。此外,構(gòu)建公眾可用的AIGC幻覺信息檢測(cè)工具與服務(wù)平臺(tái)。
四是加快出臺(tái)更加客觀、公正、可信的評(píng)測(cè)方法。目前業(yè)界大模型缺乏有公信力、標(biāo)準(zhǔn)化的科學(xué)方法評(píng)測(cè)體系,構(gòu)建和制定全面、科學(xué)、權(quán)威的大模型質(zhì)量評(píng)測(cè)體系,規(guī)范評(píng)測(cè)亂象,對(duì)牽引和推動(dòng)行業(yè)應(yīng)用更良性發(fā)展具有重要意義。因此,要加快構(gòu)建涵蓋文本生成、語言理解、知識(shí)問答、邏輯推理等多維能力的認(rèn)知大模型測(cè)評(píng)體系。聯(lián)合國(guó)家級(jí)權(quán)威機(jī)構(gòu)和行業(yè)龍頭企業(yè)等組織,共同發(fā)布具有公信力的行業(yè)大模型評(píng)測(cè)標(biāo)準(zhǔn)和應(yīng)用指南,指導(dǎo)各行業(yè)甄別和選型大模型??茖W(xué)認(rèn)識(shí)大模型能力的邊界,以更少的算力、更高的效率打造專屬模型和專屬應(yīng)用。支持大模型朝通專結(jié)合的方向發(fā)展,強(qiáng)化云邊端一體化+軟硬件一體化,用更小的算力作出相對(duì)更優(yōu)的效果。
五是堅(jiān)持源頭核心技術(shù)系統(tǒng)性創(chuàng)新,在戰(zhàn)略性、前瞻性的基礎(chǔ)研究領(lǐng)域做好布局。重點(diǎn)布局大模型的寬基礎(chǔ)研究,力求在大模型能力涌現(xiàn)機(jī)理、可信訓(xùn)練推理、強(qiáng)化學(xué)習(xí)技術(shù)、自主學(xué)習(xí)技術(shù)等方面形成突破。加強(qiáng)腦科學(xué)與類腦智能、量子計(jì)算等領(lǐng)域與人工智能關(guān)鍵研究的協(xié)同攻關(guān),形成交叉學(xué)科的突破性研究。促進(jìn)通用人工智能和各科學(xué)領(lǐng)域的交叉融合,打造AI for Science的科研新范式,研究基于科學(xué)數(shù)據(jù)的AI建模和科學(xué)知識(shí)提取技術(shù),助力科研人員更高效地進(jìn)行科學(xué)研究和探索。在生命科學(xué)、化學(xué)、制藥、物理、材料等多個(gè)科研領(lǐng)域,引入人工智能通識(shí)課,培養(yǎng)一批具備專業(yè)科研能力和高水平通用人工智能理解能力的人才,為可能涌現(xiàn)的交叉學(xué)科重大突破作儲(chǔ)備。
六是加速通用人工智能技術(shù)相關(guān)的法律法規(guī)制定與審議。全世界都在呼吁人工智能技術(shù)的設(shè)計(jì)、開發(fā)、應(yīng)用要以維護(hù)人類安全、隱私、利益為初衷,但現(xiàn)行法律法規(guī)在面對(duì)人工智能技術(shù)引發(fā)的倫理等問題時(shí),往往難以對(duì)法律責(zé)任進(jìn)行合理評(píng)判。大模型的可信度、可解釋性是未來發(fā)展的重要方向,為此可以從當(dāng)前人工智能技術(shù)應(yīng)用過程中的人工智能事故責(zé)任中劃分出倫理問題、人工智能后臺(tái)數(shù)據(jù)泄露問題、人工智能技術(shù)濫用問題、大數(shù)據(jù)平臺(tái)的漏洞問題和著作權(quán)保護(hù)等細(xì)分問題,并著手制定相應(yīng)的法律法規(guī)。鼓勵(lì)企業(yè)和研究機(jī)構(gòu)開展數(shù)據(jù)隱私保護(hù)技術(shù)的研發(fā)和應(yīng)用,提高數(shù)據(jù)的安全性和隱私性。鼓勵(lì)企業(yè)創(chuàng)新內(nèi)容安全審核算法,以更優(yōu)的人工智能初步篩查構(gòu)建高效、準(zhǔn)確的審核流程體系。
(作者系語音及語言信息處理國(guó)家工程研究中心主任、科大訊飛股份有限公司董事長(zhǎng))
