最近一段時(shí)間,以DeepSeek、阿里、群核科技等為代表的國(guó)內(nèi)科技企業(yè)密集發(fā)布高性能開(kāi)源大模型,引發(fā)廣泛關(guān)注。美國(guó)AI社區(qū)多位業(yè)內(nèi)人士預(yù)測(cè),接下來(lái)幾個(gè)月,中國(guó)將會(huì)出現(xiàn)一波開(kāi)源人工智能(AI)模型的浪潮。美國(guó)CNBC電視臺(tái)網(wǎng)站發(fā)布標(biāo)題為《中國(guó)對(duì)開(kāi)源的擁抱顛覆了圍繞人工智能的傳統(tǒng)看法》的文章,稱(chēng)“中國(guó)正在積極擁抱開(kāi)源AI模型,這一趨勢(shì)推動(dòng)國(guó)內(nèi)人工智能技術(shù)的普及與創(chuàng)新”。可以看到,中國(guó)開(kāi)源力量的崛起已在全球AI競(jìng)爭(zhēng)中激起層層漣漪。
開(kāi)閉源之爭(zhēng)出現(xiàn)新轉(zhuǎn)折點(diǎn)
一直以來(lái),開(kāi)閉源之爭(zhēng)從未停止過(guò),卻也保持著微妙的平衡。開(kāi)源和閉源實(shí)際上是兩種開(kāi)發(fā)模式。開(kāi)源模型指由開(kāi)源社區(qū)或組織開(kāi)發(fā)、維護(hù)和共享的大型軟件模型,模型源代碼是公開(kāi)的,所有人都可以查看、修改和分發(fā)。閉源大模型的源代碼、數(shù)據(jù)集和技術(shù)細(xì)節(jié)不對(duì)外公開(kāi),通常作為商業(yè)產(chǎn)品進(jìn)行銷(xiāo)售或通過(guò)API服務(wù)提供。
DeepSeek的出現(xiàn)刷新了國(guó)際上對(duì)于中國(guó)開(kāi)源大模型技術(shù)的認(rèn)知,同時(shí)也標(biāo)志著開(kāi)源模型的一次巨大成功。就連OpenAI首席執(zhí)行官Sam Altman也不得不承認(rèn):“我們?cè)谶@里站在了歷史的錯(cuò)誤一邊,需要找出一個(gè)不同的開(kāi)源策略。”
“DeepSeek是一款完完全全的開(kāi)源模型,將各個(gè)環(huán)節(jié)包括數(shù)據(jù)、代碼、權(quán)重、推理鏈的運(yùn)行思路、工程構(gòu)建方法都開(kāi)放出來(lái),讓更多人愿意參與進(jìn)去。”賽迪研究院信軟所軟件產(chǎn)業(yè)研究室副主任黃文鴻解釋說(shuō)道。就好比建造一所房子,真正的開(kāi)源不僅公開(kāi)圖紙、材料、房屋結(jié)構(gòu),還會(huì)清晰地告訴你每一步應(yīng)該建什么,有了這些信息就可以1:1還原房子。DeepSeek開(kāi)放程度之高前所未有,這也是其一經(jīng)發(fā)布就產(chǎn)生巨大影響的原因之一。
與此同時(shí),DeepSeek從軟硬件的適配到應(yīng)用推廣甚至產(chǎn)品宣傳,都是由全球廠商和開(kāi)發(fā)者共同完成的,這極大降低了其生態(tài)建設(shè)成本。國(guó)際市場(chǎng)上,微軟、英偉達(dá)、亞馬遜、英特爾、AMD等全球科技巨頭皆已上線DeepSeek開(kāi)源模型推理服務(wù);國(guó)內(nèi)互聯(lián)網(wǎng)科技廠如阿里、騰訊、百度以及運(yùn)營(yíng)商、車(chē)企等也都相繼宣布接入DeepSeek。在分享DeepSeek帶來(lái)的流量紅利的同時(shí),實(shí)際上這些廠商也將反哺DeepSeek,助其進(jìn)一步拓展模型生態(tài),快速提升用戶(hù)數(shù)量和市占率。
國(guó)際評(píng)級(jí)機(jī)構(gòu)Counterpoint Research人工智能首席分析師孫薇評(píng)論稱(chēng),OpenAI和DeepSeek分別代表了AI領(lǐng)域的兩極:開(kāi)源陣營(yíng)通過(guò)互相借鑒持續(xù)創(chuàng)新,閉源企業(yè)則面臨維護(hù)高成本尖端模型的壓力。DeepSeek的成功證明開(kāi)源戰(zhàn)略能夠帶來(lái)更快的創(chuàng)新速度和更廣泛的應(yīng)用。零一萬(wàn)物創(chuàng)始人李開(kāi)復(fù)指出,開(kāi)源模式最終將占據(jù)主導(dǎo)地位,Deepseek 采取免費(fèi)、開(kāi)源的模式,對(duì) OpenAI 構(gòu)成了根本性的挑戰(zhàn)。Meta首席AI科學(xué)家楊立昆更是直言:R1的出現(xiàn)是“開(kāi)源模型的勝利”。
不只有DeepSeek開(kāi)源
實(shí)際上,不止是DeepSeek,國(guó)內(nèi)還有不少企業(yè)都在開(kāi)源模型領(lǐng)域取得了不俗的成績(jī)。比如阿里在2018年底便啟動(dòng)了大模型研發(fā),在超大模型、語(yǔ)言及多模態(tài)能力、低碳訓(xùn)練、平臺(tái)化服務(wù)、落地應(yīng)用等多個(gè)方面,為中文大模型的發(fā)展做了前沿性、引領(lǐng)性的工作。作為全球較早研發(fā)并開(kāi)放類(lèi)GPT語(yǔ)言模型的科技公司之一,阿里一直堅(jiān)持走開(kāi)源之路。
記者了解到,截至目前,阿里已開(kāi)源200多款模型,包括文本生成模型、視覺(jué)理解/生成模型、語(yǔ)音理解/生成模型、文生圖及視頻模型等多模態(tài),覆蓋從0.5B到110B參數(shù)的各類(lèi)尺寸。通義千問(wèn)全球下載量已突破2億,穩(wěn)居全球最大AI開(kāi)源社區(qū)Hugging Face趨勢(shì)榜榜首。旗下魔搭社區(qū)模型總數(shù)已超4萬(wàn)個(gè),成為國(guó)內(nèi)最大的AI開(kāi)源社區(qū)。
值得關(guān)注的是,3月27日,阿里開(kāi)源首個(gè)全模態(tài)大模型Qwen2.5-Omni7B,已經(jīng)可以在手機(jī)上部署運(yùn)行。在權(quán)威的多模態(tài)融合任務(wù)OmniBench等測(cè)評(píng)中,Qwen2.5-Omni刷新業(yè)界紀(jì)錄,全維度遠(yuǎn)超Google的Gemini-1.5-Pro等同類(lèi)模型。
3月28日消息,被譽(yù)為杭州“六小龍”之一的群核科技發(fā)布的空間理解開(kāi)源模型SpatialLM登上全球最大AI開(kāi)源社區(qū)Hugging Face趨勢(shì)榜第二位。據(jù)悉,SpatialLM是群核科技自主研發(fā)的一款空間理解模型,該模型僅通過(guò)一段視頻即可生成物理正確的3D場(chǎng)景布局。不同于傳統(tǒng)大語(yǔ)言模型,SpatialLM突破了對(duì)物理世界幾何與空間關(guān)系的理解局限,將在機(jī)器類(lèi)人的空間認(rèn)知和解析能力上發(fā)揮重大作用。該模型的開(kāi)源,將為像具身智能領(lǐng)域的企業(yè)或機(jī)構(gòu)科研團(tuán)隊(duì)提供一個(gè)空間認(rèn)知理解的基礎(chǔ)訓(xùn)練框架。尤其是對(duì)那些不具備模型開(kāi)發(fā)能力的具身智能企業(yè),可以基于SpatialLM模型進(jìn)行微調(diào),降低具身智能訓(xùn)練門(mén)檻。目前,SpatialLM已在HuggingFace、GitHub、魔搭社區(qū)等平臺(tái)面向全球開(kāi)發(fā)者開(kāi)源。在開(kāi)源后一周,SpatialLM在海外社交平臺(tái)LinkedIn、Twitter受到行業(yè)人士追捧。
值得一提的是,目前Hugging Face趨勢(shì)榜前三名皆為中國(guó)科技企業(yè)推出的開(kāi)源大模型(通義千問(wèn)Qwen2.5-Omni、DeepSeek、群核科技SpatialLM)。據(jù)業(yè)內(nèi)人士統(tǒng)計(jì),在最新的 Hugging Face 熱門(mén)模型榜單中,中國(guó)模型的含量已經(jīng)超過(guò)了50%。越來(lái)越多國(guó)際開(kāi)發(fā)者選擇中國(guó)基礎(chǔ)模型作為微調(diào)起點(diǎn),以DeepSeek和Qwen系列模型為基點(diǎn)的衍生模型越來(lái)越多。
科技大V、天使投資人、技術(shù)創(chuàng)始人Balaji預(yù)測(cè),接下來(lái)幾個(gè)月里,中國(guó)還會(huì)有一波開(kāi)源AI模型的浪潮,涵蓋從計(jì)算機(jī)視覺(jué)到機(jī)器人技術(shù),再到圖像生成的各個(gè)領(lǐng)域。“中國(guó)如今成了開(kāi)源AI的先鋒,這實(shí)在令人驚訝。”
中國(guó)正重塑全球AI發(fā)展格局
工信部消息顯示,中國(guó)已成為全球開(kāi)源參與者數(shù)量排名第二、增長(zhǎng)速度最快的國(guó)家。“中國(guó)愿意與世界分享AI資源,促進(jìn)AI的普惠化發(fā)展,這意味著中國(guó)正在重塑全球AI的發(fā)展格局。”克羅地亞AI研究專(zhuān)家德拉戈·奇利加表示。
群核科技SpatialLM模型開(kāi)源頁(yè)面
騰訊研究院發(fā)布的報(bào)告指出,2022年以來(lái),開(kāi)源模型呈趕超之勢(shì)。開(kāi)源與閉源模型在性能和應(yīng)用領(lǐng)域的差距迅速縮小,甚至在某些方面實(shí)現(xiàn)超越。這一方面是因?yàn)殚_(kāi)源的“集市協(xié)作模式”正在AI領(lǐng)域重演,開(kāi)源大模型將底層能力公開(kāi),公眾可免費(fèi)下載權(quán)重自行部署,進(jìn)行“二次創(chuàng)作”,在不同行業(yè)和場(chǎng)景中微調(diào)形成專(zhuān)用版本,靈活適配性大大增強(qiáng)。開(kāi)發(fā)者共同分享工程經(jīng)驗(yàn),參與技術(shù)路線試錯(cuò),加速了AI發(fā)展進(jìn)化。
另一方面也是因?yàn)殚_(kāi)源模型提升了AI系統(tǒng)的透明度和安全性,由于模型架構(gòu)、權(quán)重開(kāi)放,外部研究者可以深入“解剖”模型,及時(shí)發(fā)現(xiàn)偏見(jiàn)或漏洞并共同改進(jìn)。相反,封閉模型如同“黑箱”,外界難以對(duì)其進(jìn)行監(jiān)督。
此外,開(kāi)源打破了AI領(lǐng)域的既有封閉格局。此前最先進(jìn)的AI模型往往為少數(shù)巨頭掌握,產(chǎn)業(yè)下游通過(guò)API付費(fèi)使用,對(duì)其缺乏議價(jià)或約束能力。開(kāi)源減少了單一供應(yīng)商的鎖定效應(yīng),提升了技術(shù)自主權(quán)。在大模型領(lǐng)域,開(kāi)源社區(qū)用更低算力復(fù)現(xiàn)了商業(yè)閉源模型的大部分能力,也迫使大型科技公司不得不重新評(píng)估策略,保障了行業(yè)的良性競(jìng)爭(zhēng)。
黃文鴻認(rèn)為,信息技術(shù)領(lǐng)域具有強(qiáng)者恒強(qiáng)的發(fā)展規(guī)律,我國(guó)在開(kāi)源模型上是有先發(fā)優(yōu)勢(shì)的,必須進(jìn)一步筑牢技術(shù)“護(hù)城河”。但目前各行各業(yè)真正懂開(kāi)源模型的人才并不多,基于開(kāi)源大模型的下游企業(yè),以及做工程優(yōu)化、模型調(diào)優(yōu)的研發(fā)人員相對(duì)較少,高校應(yīng)該培養(yǎng)更多相關(guān)人才,共同促成“創(chuàng)新—共享—再創(chuàng)新”,助力產(chǎn)業(yè)生態(tài)更加完備。
阿里云高級(jí)總監(jiān)朱迅垚建議,從國(guó)家到地方再到企業(yè),應(yīng)以更加積極的態(tài)度擁抱開(kāi)源,同時(shí)在智能算力、高質(zhì)量數(shù)據(jù)集、上云用云等方面加快創(chuàng)新步伐,緊跟世界先進(jìn)水平。這樣的舉措不僅有助于降低技術(shù)門(mén)檻,也將為用戶(hù)提供更方便的工具,幫助他們更好地進(jìn)行技術(shù)實(shí)現(xiàn)和創(chuàng)新。
“大模型的格局將從比拼底層模型的技術(shù)指標(biāo),走向擁抱開(kāi)源的底層模型,進(jìn)行商業(yè)賦能。”李開(kāi)復(fù)表示,中國(guó)有超大、超常、超多的場(chǎng)景,所以2025年一定會(huì)有很多廠商開(kāi)始擁抱開(kāi)源底層模型,加速行業(yè)賦能,預(yù)計(jì)在全球會(huì)有非常優(yōu)異的表現(xiàn)。
