文章源自《中國(guó)科學(xué)院院刊》2025年第3期專題“科學(xué)觀察:開源創(chuàng)新與開源范式”
2025蛇年春節(jié)前后,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(以下簡(jiǎn)稱“DeepSeek”)發(fā)布的開源大模型引起了國(guó)內(nèi)外廣泛關(guān)注。首先是模型基準(zhǔn)測(cè)試性能與世界領(lǐng)先的OpenAI閉源模型GPT-4o比肩,其次是訓(xùn)練成本相比其他模型大幅降低,且?guī)伎兼湹耐评砟P蚏1及其蒸餾版本可以在多種計(jì)算能力設(shè)備上部署,最后是其代碼、文檔、模型權(quán)重等在MIT許可協(xié)議(極為寬松的一種開源許可協(xié)議)下完全開源。這一套集高性能、低成本、開源開放于一體的“組合拳”,使得DeepSeek在短時(shí)間內(nèi)成為國(guó)內(nèi)外人工智能(AI)領(lǐng)域的焦點(diǎn),后續(xù)接踵而至的各行各業(yè)推廣部署,讓大模型應(yīng)用在中國(guó)真正實(shí)現(xiàn)了“飛入尋常百姓家”。
大模型從形態(tài)上是一種軟件。雖然模型文件通過訓(xùn)練生成,通過參數(shù)和數(shù)據(jù)迭代,以概率性輸出結(jié)果,無(wú)法精確斷點(diǎn)調(diào)試,黑盒特征明顯;但與傳統(tǒng)軟件一樣,它可復(fù)制、可復(fù)用,需要操作系統(tǒng)提供運(yùn)行環(huán)境,需要存儲(chǔ)系統(tǒng),需要處理用戶輸入并輸出反饋。因此,DeepSeek大模型這一來自中國(guó)本土的技術(shù)創(chuàng)新和開源開放實(shí)踐,也為中國(guó)軟件行業(yè)提供了可深入分析并學(xué)習(xí)借鑒的模式。
本文將DeepSeek的創(chuàng)新模式歸納為“以軟補(bǔ)硬”“開源傳播”和“生態(tài)優(yōu)先”。同時(shí),也從生態(tài)入口、開源軟件供應(yīng)鏈、開源基礎(chǔ)設(shè)施3個(gè)方面,分析當(dāng)前我國(guó)AI開源創(chuàng)新仍然面臨的問題和風(fēng)險(xiǎn)。最后從大模型操作系統(tǒng)布局、軟件供應(yīng)鏈保障、開源基礎(chǔ)設(shè)施建設(shè)、軟硬件協(xié)同發(fā)展4個(gè)維度,提出加強(qiáng)我國(guó)科技基礎(chǔ)能力的建議,以期更好支撐中國(guó)創(chuàng)新團(tuán)隊(duì)的長(zhǎng)足進(jìn)步發(fā)展,不斷搶占AI和軟件領(lǐng)域的全球科技制高點(diǎn)。
一、DeepSeek的創(chuàng)新模式分析
1.1“以軟補(bǔ)硬”開辟大模型創(chuàng)新路徑
在算力資源受限的背景下,DeepSeek通過軟件架構(gòu)創(chuàng)新和算法優(yōu)化,使其模型在保持高性能的同時(shí),大幅降低了對(duì)硬件投入的依賴,并為全球開發(fā)者提供了可復(fù)現(xiàn)、可負(fù)擔(dān)的“以軟補(bǔ)硬”技術(shù)方案。這讓近年來大模型領(lǐng)域普遍推崇的規(guī)模定律(scaling law)出現(xiàn)了拐點(diǎn),依賴大規(guī)模硬件投資建立的算力壟斷“高墻”出現(xiàn)了缺口,大模型研究和應(yīng)用的門檻被大大拉低,資源有限的中小企業(yè)、研究機(jī)構(gòu)甚至個(gè)人,都迎來了AI創(chuàng)新和AI賦能的可能性。
軟件在這一輪大模型浪潮中往往被忽視。事實(shí)上,對(duì)于硬件架構(gòu)確定、優(yōu)化目標(biāo)明確的場(chǎng)景,軟件改進(jìn)帶來的總體收益通常大于硬件。2017年圖靈獎(jiǎng)獲得者漢尼斯和帕特森于2018年4月在國(guó)際計(jì)算機(jī)學(xué)會(huì)(ACM)做獲獎(jiǎng)演講時(shí),給出了用不同編程方法計(jì)算兩個(gè)4096×4096矩陣相乘的性能對(duì)比,該數(shù)據(jù)引用了美國(guó)麻省理工學(xué)院(MIT)計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)雷瑟斯等人發(fā)表在Science上的文章There’s plenty of room at the Top: What will drive computer performance after Moore’s law?(《頂端仍大有可為:摩爾定律之后什么將驅(qū)動(dòng)計(jì)算機(jī)性能發(fā)展?》,這里的“頂端”指代軟件),具體對(duì)比數(shù)據(jù)見表1。從表中可以看到,用C語(yǔ)言編寫比Python要快47倍,分治法并行優(yōu)化后可得到6727倍的加速,而采用SIMD指令集則可加速6萬(wàn)多倍。同樣,DeepSeek使用英偉達(dá)PTX,即介于CUDA高級(jí)編程語(yǔ)言和實(shí)際GPU機(jī)器代碼之間的中間代碼表示語(yǔ)言,也起到了極大的加速效果。
在過去幾年中,華為鴻蒙操作系統(tǒng)同樣采用了“以軟補(bǔ)硬”的方法,在處理器制程受限的情況下,通過操作系統(tǒng)、編譯器、渲染引擎等多種軟件優(yōu)化手段,在手機(jī)上保持了良好的用戶體驗(yàn)。
更重要的是,軟件優(yōu)化方案為快速傳播奠定了基礎(chǔ)。軟件之于硬件的一大優(yōu)勢(shì),就是傳播的便捷和迅速,通過網(wǎng)絡(luò)下載就可以快速到達(dá)最終用戶。試想,如果這次DeepSeek發(fā)布的是“星際門”一樣的硬件堆疊方案,又或是使用了某種硬件加速方案(如同當(dāng)年谷歌為深度神經(jīng)網(wǎng)絡(luò)專門設(shè)計(jì)的TPU),將很難如此快速傳播推廣。
1.2以開源開放實(shí)現(xiàn)用戶高速增長(zhǎng)
軟件的核心競(jìng)爭(zhēng)力是用戶。大規(guī)模、高質(zhì)量、多樣化的用戶群體,不僅是軟件價(jià)值變現(xiàn)的堅(jiān)實(shí)基礎(chǔ),更是推動(dòng)軟件持續(xù)迭代創(chuàng)新的強(qiáng)勁動(dòng)力。正如中國(guó)科學(xué)院計(jì)算技術(shù)研究所包云崗研究員所說,在開源模式下,軟件的價(jià)值計(jì)算和傳播效應(yīng)遵循梅特卡夫定律(Metcalfe’s Law),即網(wǎng)絡(luò)的價(jià)值與網(wǎng)絡(luò)中用戶數(shù)量的平方成正比。
具體表現(xiàn)為兩個(gè)方面:
一是用戶規(guī)模效應(yīng):用戶越多,價(jià)值越大,反饋和改進(jìn)更多,生態(tài)系統(tǒng)更豐富。
二是網(wǎng)絡(luò)效應(yīng):更多開發(fā)者參與,就會(huì)有更多的應(yīng)用場(chǎng)景,繼而更快的迭代速度。當(dāng)眾多用戶轉(zhuǎn)變?yōu)殚_發(fā)者和測(cè)試者,就會(huì)極大地降低軟件開發(fā)測(cè)試成本,驅(qū)動(dòng)軟件升級(jí)演化和價(jià)值提升,繼而吸引更多的開發(fā)者參與,形成持續(xù)的良性循環(huán)。
前面提到大模型本身也是一種軟件,因此開源軟件曾經(jīng)創(chuàng)造的發(fā)展模式,完全可以被大模型所復(fù)用。然而,DeepSeek開源模式創(chuàng)造了比傳統(tǒng)軟件更為迅速的用戶增長(zhǎng)奇跡。據(jù)統(tǒng)計(jì),DeepSeek連續(xù)登頂蘋果App Store和谷歌Play Store全球下載榜首,上線18天累計(jì)下載量突破1600萬(wàn)次,遠(yuǎn)超Chat-GPT發(fā)布首月的900萬(wàn)下載量。其中固然有大模型概念熱度的加持,但更有DeepSeek幾乎毫無(wú)保留地開放了模型文件、權(quán)重文件、核心代碼和技術(shù)文檔的原因。由此在短短半年內(nèi)吸引了全球超過百萬(wàn)開發(fā)者,建立了活躍的開發(fā)者社區(qū),不僅貢獻(xiàn)了大量的代碼和工具,還形成了自發(fā)的技術(shù)交流和學(xué)習(xí)氛圍,例如GitHub上DeepSeek所維護(hù)的awesome-deepseek-integration頁(yè)面。這種社區(qū)驅(qū)動(dòng)的創(chuàng)新模式,為AI技術(shù)的快速迭代和應(yīng)用落地提供了強(qiáng)大的動(dòng)力。DeepSeek的經(jīng)驗(yàn)也表明,即便在AI時(shí)代,開源開放仍然比封閉壟斷更具競(jìng)爭(zhēng)力。
1.3以標(biāo)準(zhǔn)化接口和工具構(gòu)建上下游生態(tài)
DeepSeek在建立生態(tài)方面同樣展現(xiàn)出了很高的效率,在短短一個(gè)月內(nèi),DeepSeek R1從滿血版671B到70B、32B、7B甚至1.5B等大小不同模型得到快速部署,大到云服務(wù)廠商、互聯(lián)網(wǎng)巨頭、國(guó)資央企、高校院所,小到街道辦、實(shí)驗(yàn)室、個(gè)人用戶等,從制造業(yè)到服務(wù)業(yè),從教育到醫(yī)療,DeepSeek滲透到各行各業(yè),推動(dòng)效率提升和智能化轉(zhuǎn)型。
生態(tài)快速壯大背后則是其對(duì)調(diào)用接口和AI軟件工具包的標(biāo)準(zhǔn)化,以及因此而快速聚集的上下游生態(tài)伙伴。標(biāo)準(zhǔn)化調(diào)用接口簡(jiǎn)化了AI應(yīng)用的接入流程,使得DeepSeek很容易被Ollama、vLLM、SGLang等大模型服務(wù)框架所支持,也使得ChatBox、AnythingLLM等大模型入口應(yīng)用能夠很快接入DeepSeek。標(biāo)準(zhǔn)化軟件工具包大幅降低了AI應(yīng)用部署門檻,同時(shí)還提供了豐富的預(yù)訓(xùn)練模型和數(shù)據(jù)集,使得開發(fā)者可以通過領(lǐng)域精調(diào)和檢索增強(qiáng)生成(RAG)實(shí)現(xiàn)自身業(yè)務(wù)需求,進(jìn)一步開展應(yīng)用創(chuàng)新;同時(shí),使得華為昇騰、寒武紀(jì)等其他非英偉達(dá)芯片能很快完成適配,形成百花齊放的國(guó)產(chǎn)軟硬件協(xié)同適配景象。
從更宏觀的生態(tài)視角看,DeepSeek已經(jīng)在中國(guó)建立了事實(shí)上的大模型標(biāo)準(zhǔn)。自從2020年底Chat-GPT發(fā)布以來,無(wú)論美國(guó)還是中國(guó)都進(jìn)入了“百模大戰(zhàn)”的格局,盡管OpenAI引領(lǐng)了發(fā)展,建立了提示詞工程(Prompt Engineering)等事實(shí)標(biāo)準(zhǔn),但因其選擇閉源策略,且其最大投資者微軟公司的Windows操作系統(tǒng)同樣閉源,使得“應(yīng)用—模型—系統(tǒng)—硬件”生態(tài)鏈路參與者無(wú)法自主開展大模型和系統(tǒng)的適配,阻礙了參與者的參與意愿和創(chuàng)新動(dòng)力。例如,對(duì)于大量非英偉達(dá)的硬件加速卡廠商來說,因?yàn)闊o(wú)法修改基礎(chǔ)模型和相關(guān)代碼,只能模擬與轉(zhuǎn)譯英偉達(dá)GPU指令集,無(wú)法實(shí)現(xiàn)與模型的原生適配;對(duì)于亞馬遜、谷歌、阿里等云平臺(tái)服務(wù)商來說,由于與微軟Azure的競(jìng)爭(zhēng)關(guān)系,也無(wú)法與OpenAI實(shí)現(xiàn)充分的業(yè)務(wù)整合。
DeepSeek開源發(fā)布之后,不僅出現(xiàn)了微信、WPS等應(yīng)用整合,也出現(xiàn)了華為云、阿里云、騰訊云等服務(wù)集成,還出現(xiàn)了華為昇騰、寒武紀(jì)、沐曦、海光、申威等硬件原生適配,甚至出現(xiàn)了大量本地部署的一體機(jī)解決方案。以DeepSeek為大模型事實(shí)標(biāo)準(zhǔn),中國(guó)正在形成“應(yīng)用—模型—系統(tǒng)—硬件”全鏈路的生態(tài)聚集。長(zhǎng)遠(yuǎn)來看,這一變化必將重塑中國(guó)乃至全球AI的發(fā)展格局。
二、我國(guó)AI開源創(chuàng)新面臨的風(fēng)險(xiǎn)挑戰(zhàn)
在看到DeepSeek成功一面的同時(shí),還需要看到當(dāng)前中國(guó)AI開源創(chuàng)新面臨的一些風(fēng)險(xiǎn)挑戰(zhàn)。
2.1大模型入口程序的風(fēng)險(xiǎn)
所謂大模型入口程序,對(duì)于部署者是指Ollama、SGLang、vLLM等大模型服務(wù)框架程序,用來啟動(dòng)大模型服務(wù)進(jìn)程;對(duì)于用戶是指通過封裝多個(gè)大模型服務(wù),為用戶提供更加方便易用、靈活可配置的交互界面程序,如ChatBox、AnythingLLM等。
以O(shè)llama為代表的大模型服務(wù)框架,在啟動(dòng)大模型服務(wù)時(shí)通常以網(wǎng)絡(luò)守護(hù)進(jìn)程的方式出現(xiàn),會(huì)打開某個(gè)端口并監(jiān)聽來自網(wǎng)絡(luò)的服務(wù)請(qǐng)求。這樣的守護(hù)進(jìn)程一旦出現(xiàn)漏洞,攻擊者很容易通過服務(wù)端口入侵服務(wù)主機(jī)。事實(shí)上,近期已經(jīng)發(fā)現(xiàn)了Ollama導(dǎo)致的、可被利用的大模型服務(wù)漏洞。
而對(duì)于用戶交互的入口程序來說,盡管ChatBox等通過開源來證明自身程序的安全性,但無(wú)法證明用戶隱私數(shù)據(jù)的安全性,畢竟所有的對(duì)話信息都會(huì)被入口程序轉(zhuǎn)發(fā)和截取。
對(duì)主流入口程序的掌控和主導(dǎo),會(huì)成為大模型競(jìng)爭(zhēng)的焦點(diǎn)之一,但目前為止,大模型的入口程序還是運(yùn)行在已有主流操作系統(tǒng)之上,因此操作系統(tǒng)不自主可控的風(fēng)險(xiǎn)將會(huì)延伸到大模型入口程序,畢竟操作系統(tǒng)很大程度上決定了誰(shuí)能成為入口,20世紀(jì)90年代網(wǎng)景公司NetScape瀏覽器在與微軟IE瀏覽器競(jìng)爭(zhēng)中敗北就是前車之鑒。
2.2軟件供應(yīng)鏈的安全可靠風(fēng)險(xiǎn)
DeepSeek的開發(fā)依賴大量開源或閉源組件。例如:基礎(chǔ)框架中的PyTorch深度學(xué)習(xí)框架、CUDA GPU加速庫(kù);訓(xùn)練相關(guān)的Megatron-LM分布式訓(xùn)練框架、Flash Attention高效注意力機(jī)制;推理優(yōu)化相關(guān)的FasterTransformer推理加速引擎、TensorRT推理優(yōu)化庫(kù)、ONNX模型轉(zhuǎn)換標(biāo)準(zhǔn)庫(kù);工具鏈中的版本控制Git、容器化部署Docker;數(shù)據(jù)處理中的NumPy數(shù)值計(jì)算庫(kù)、pandas數(shù)據(jù)處理庫(kù),以及HuggingFace數(shù)據(jù)集管理工具等。
以上僅是基于公開信息的判斷,實(shí)際使用的工具可能更多,有些專有工具可能未公開。而在這些互相高度依賴的軟件供應(yīng)鏈中,有些關(guān)鍵環(huán)節(jié)仍然被Meta公司等國(guó)際競(jìng)爭(zhēng)對(duì)手掌控(如PyTorch開發(fā)框架,以及前面所述的Ollama入口程序),或?qū)儆谀臣夜舅接挟a(chǎn)品(如英偉達(dá)CUDA),均存在斷供可能。此外,根據(jù)奇安信的最新報(bào)告,已出現(xiàn)一些專門針對(duì)DeepSeek的供應(yīng)鏈偽造或投毒攻擊。這些都構(gòu)成了我國(guó)AI面臨的軟件供應(yīng)鏈安全可靠風(fēng)險(xiǎn)。
健康的大模型生態(tài)需要一個(gè)同樣健康的開源軟件生態(tài)。對(duì)于軟件供應(yīng)鏈,特別是開源軟件供應(yīng)鏈關(guān)鍵節(jié)點(diǎn)的認(rèn)真梳理和持續(xù)維護(hù),仍然是企業(yè)和行業(yè),甚至國(guó)家實(shí)現(xiàn)人工智能高水平科技自立自強(qiáng)必須要付出的投入。
2.3開源基礎(chǔ)設(shè)施的風(fēng)險(xiǎn)
不僅DeepSeek,國(guó)內(nèi)主要開源大模型項(xiàng)目幾乎都選擇在美國(guó)微軟公司旗下的GitHub平臺(tái)發(fā)布,這是因?yàn)镚itHub全球開發(fā)者集中度最高,有完整的開源基礎(chǔ)設(shè)施能力、成熟協(xié)作工具鏈和已經(jīng)發(fā)展壯大的程序員社交網(wǎng)絡(luò),因此國(guó)際影響力更大,更有利于項(xiàng)目推廣。然而,選擇GitHub未來也面臨挑戰(zhàn)和風(fēng)險(xiǎn),包括但不限于地緣政治風(fēng)險(xiǎn)、數(shù)據(jù)主權(quán)問題、潛在的訪問限制風(fēng)險(xiǎn)等。這并不是DeepSeek和國(guó)內(nèi)開源項(xiàng)目維護(hù)者的問題,而是國(guó)內(nèi)缺乏與GitHub競(jìng)爭(zhēng)的開源基礎(chǔ)設(shè)施,從設(shè)施完善程度、開發(fā)者聚集規(guī)模、國(guó)際化程度、運(yùn)營(yíng)能力等,國(guó)內(nèi)現(xiàn)有基礎(chǔ)設(shè)施與GitHub相比都存在較大差距。
Hugging Face近年來隨著大模型爆發(fā)而異軍突起,成為全球最流行的模型托管平臺(tái),國(guó)內(nèi)的阿里魔搭等平臺(tái)雖然已經(jīng)起步并初具規(guī)模,但與Hugging Face相比,同樣在功能、規(guī)模、國(guó)際化、運(yùn)營(yíng)等方面存在顯著差異。
三、加強(qiáng)我國(guó)AI創(chuàng)新能力的建議
基于以上分析,本文提出加強(qiáng)我國(guó)AI創(chuàng)新能力的如下建議。
3.1盡快啟動(dòng)大模型操作系統(tǒng)的研發(fā)探索。
大模型仍然以軟件的形態(tài)存在于現(xiàn)有操作系統(tǒng)生態(tài)體系,雖然出現(xiàn)了ChatBox等新的入口程序,但不足以撼動(dòng)Windows、iOS、Android的生態(tài)主導(dǎo)地位。美國(guó)蘋果公司和我國(guó)華為公司先后提出了面向意圖的開發(fā)框架,旨在整合大模型的能力,繼續(xù)掌控用戶入口。微軟公司通過預(yù)裝Copilot并與辦公套件、瀏覽器等深度捆綁,鞏固其桌面領(lǐng)域壟斷地位。上海交通大學(xué)陳海波團(tuán)隊(duì)提出了大模型操作系統(tǒng)的3種技術(shù)路線,即漸進(jìn)路線(大模型作為操作系統(tǒng)外掛組件)、激進(jìn)路線(大模型即操作系統(tǒng))和融合路線(大模型與操作系統(tǒng)深度融合),并建議采用融合路線,從而在利用大模型能力的同時(shí),最大程度兼容現(xiàn)有操作系統(tǒng)應(yīng)用生態(tài)。鑒于大模型帶來的機(jī)器智能躍升和交互范式變革,無(wú)論采用何種路線,大模型操作系統(tǒng)研發(fā)工作都迫在眉睫。隨著大模型和操作系統(tǒng)各自發(fā)展,不同技術(shù)路線會(huì)自然合并,然而一旦錯(cuò)過生態(tài)初始構(gòu)建的機(jī)會(huì)窗口期,將面臨新的、更難突破的生態(tài)壟斷。
3.2加強(qiáng)開源軟件供應(yīng)鏈治理。
開源軟件已經(jīng)成為組裝大型復(fù)雜系統(tǒng)軟件的“原材料”和“元器件”。一個(gè)Linux開源操作系統(tǒng)發(fā)行版(如Debian、openEuler等)往往包含上萬(wàn)個(gè)開源組件,通過這些組件的彼此依賴關(guān)系編譯組裝而成。一個(gè)大模型從開發(fā)、訓(xùn)練到部署、運(yùn)行、推理,也依賴于大大小小的開源組件。隨著大模型成為像操作系統(tǒng)一樣的戰(zhàn)略基礎(chǔ)軟件,其開源軟件供應(yīng)鏈的保障必不可少。中國(guó)科學(xué)院軟件研究所從2019年發(fā)起“開源軟件供應(yīng)鏈點(diǎn)亮計(jì)劃”,梳理全球開源軟件知識(shí)圖譜,找出操作系統(tǒng)等大型復(fù)雜基礎(chǔ)軟件的關(guān)鍵供應(yīng)鏈節(jié)點(diǎn),通過“開源之夏”等活動(dòng),持續(xù)培養(yǎng)能夠看護(hù)關(guān)鍵開源軟件的高水平人才。建議圍繞大模型的開源組件依賴情況,持續(xù)梳理開源軟件供應(yīng)鏈,對(duì)其中關(guān)鍵節(jié)點(diǎn)進(jìn)行重點(diǎn)布局,投入或培養(yǎng)相應(yīng)的人力資源,確保具備持續(xù)開源維護(hù)的能力。
3.3加快對(duì)標(biāo)GitHub和Hugging Face的開源基礎(chǔ)設(shè)施建設(shè)。
面對(duì)GitHub和Hugging Face托管平臺(tái)的壟斷局面,一方面繼續(xù)完善現(xiàn)有國(guó)產(chǎn)代碼托管平臺(tái),提升平臺(tái)穩(wěn)定性和功能完整度,優(yōu)化開發(fā)者體驗(yàn)。另一方面也要有過渡策略,采用多平臺(tái)同步策略,建立戰(zhàn)略備份機(jī)制。從2019年中國(guó)科學(xué)院軟件研究所啟動(dòng)建設(shè)“源圖”開源軟件供應(yīng)鏈基礎(chǔ)設(shè)施,迄今已形成對(duì)全球關(guān)鍵開源軟件的全量備份,并提供可信軟件倉(cāng)、可信編譯構(gòu)建環(huán)境等平臺(tái)服務(wù)。后續(xù)還需要面向大模型的新需求、新場(chǎng)景,加快打造新一代開源開發(fā)基礎(chǔ)設(shè)施,聯(lián)合國(guó)內(nèi)優(yōu)勢(shì)力量逐步培育本土開源基礎(chǔ)設(shè)施生態(tài),并以更加開源開放的模式,吸引國(guó)外機(jī)構(gòu)和開發(fā)者參與,共同對(duì)沖潛在的地緣政治風(fēng)險(xiǎn)。
3.4加大開源軟硬件協(xié)同力度。
在新一屆美國(guó)政府不斷升級(jí)管控施壓的背景下,英偉達(dá)GPU硬件供應(yīng)限制和CUDA軟件生態(tài)壁壘,已經(jīng)成為中國(guó)實(shí)現(xiàn)AI領(lǐng)域高水平科技自立自強(qiáng)面臨的最主要障礙之一。例如,DeepSeek訓(xùn)練優(yōu)化所使用的PTX仍然屬于CUDA生態(tài)體系。建議加大RISC-V開源指令集下軟硬件協(xié)同,特別是AI相關(guān)擴(kuò)展指令集的協(xié)同力度。RISC-V指令集的崛起,不僅為了從指令集層面打破x86/ARM的生態(tài)壟斷,同時(shí)也有望打破英偉達(dá)GPU私有指令集和私有算子的壟斷。隨著RISC-V向量指令集、矩陣/張量指令集的制訂和完善,新的軟硬件接口標(biāo)準(zhǔn)規(guī)范有望取代CUDA私有接口規(guī)范,并配合編譯器等在RISC-V專用AI加速卡上實(shí)現(xiàn)軟硬協(xié)同。一旦某款RISC-V加速卡在性能功耗比上超越英偉達(dá)的旗艦GPU,整個(gè)RISC-V生態(tài)也將迎來“DeepSeek時(shí)刻”。
需要強(qiáng)調(diào)的是,以上風(fēng)險(xiǎn)分析和建議,并非為了形成封閉的、防御式的技術(shù)體系,而是為了中國(guó)乃至全球都有更為開源開放的選擇,平等參與AI新技術(shù)、新產(chǎn)品、新服務(wù)的研發(fā)應(yīng)用,共同打造AI時(shí)代的人類命運(yùn)共同體。
武延軍 中國(guó)科學(xué)院軟件研究所副所長(zhǎng)、研究員。開放原子開源基金會(huì)開源安全委員會(huì)主席,中國(guó)計(jì)算機(jī)學(xué)會(huì)開源發(fā)展委員會(huì)執(zhí)行委員。主要研究方向?yàn)椴僮飨到y(tǒng)。
文章源自:武延軍. DeepSeek引發(fā)的AI創(chuàng)新和開源生態(tài)發(fā)展的思考. 中國(guó)科學(xué)院院刊, 2025, 40(3): 446-452, doi: 10.16418/j.issn.1000-3045.20250225007.
責(zé)任編輯:張鵬輝