周城雄(中國(guó)科學(xué)院科技戰(zhàn)略咨詢研究院)
2025年春節(jié)期間,深度求索(DeepSeek)公司的通用大模型DeepSeek-R1引發(fā)全球科技界震動(dòng)。這款模型以1.8萬(wàn)億參數(shù)規(guī)模實(shí)現(xiàn)接近人類水平的數(shù)學(xué)推理能力,在權(quán)威測(cè)試集GSM8K上取得98.7%的準(zhǔn)確率,超越GPT-4等國(guó)際主流模型。其訓(xùn)練效率較傳統(tǒng)方法提升3倍,能耗成本降低40%,被外媒稱為“中國(guó)AI的里程碑時(shí)刻”。
近年來(lái),全球的人工智能已從“點(diǎn)狀應(yīng)用”進(jìn)入“系統(tǒng)性成熟”階段,其經(jīng)濟(jì)邏輯與技術(shù)邏輯的耦合開(kāi)始推動(dòng)產(chǎn)業(yè)變革。DeepSeek-R1的誕生加速了這一進(jìn)程,隨著算力成本下降和算法效率提升,綜合性大模型具備了商業(yè)可行性,動(dòng)搖了硅谷依賴算力堆砌的技術(shù)優(yōu)越性敘事。紐約大學(xué)教授Gary Marcus指出,其開(kāi)源策略可能重構(gòu)OpenAI的商業(yè)模式,吸引更多開(kāi)發(fā)者生態(tài)資源。
構(gòu)建技術(shù)護(hù)城河。DeepSeek-R1在純強(qiáng)化學(xué)習(xí)訓(xùn)練、算法—系統(tǒng)協(xié)同優(yōu)化及開(kāi)源生態(tài)構(gòu)建三方面實(shí)現(xiàn)顯著突破,可以用“更聰明、更便宜、更開(kāi)放”來(lái)概括。其性能對(duì)標(biāo)國(guó)際頂尖模型,同時(shí)以低成本推動(dòng)技術(shù)普惠。盡管面臨算力依賴(如仍需英偉達(dá)H800集群)和泛化能力挑戰(zhàn),但其創(chuàng)新模式已為全球AI發(fā)展提供新范式——證明“算法創(chuàng)新可突破算力瓶頸”,并為中國(guó)在基礎(chǔ)模型領(lǐng)域提升了話語(yǔ)權(quán)。
一是自主學(xué)習(xí),減少依賴。傳統(tǒng)大模型需要海量人工標(biāo)注的數(shù)據(jù)來(lái)訓(xùn)練,成本極高。而DeepSeek-R1采用了“純強(qiáng)化學(xué)習(xí)”技術(shù),讓AI像人類一樣通過(guò)試錯(cuò)和獎(jiǎng)勵(lì)機(jī)制自主優(yōu)化。例如,在數(shù)學(xué)題訓(xùn)練中,系統(tǒng)不需要標(biāo)準(zhǔn)答案,只需告訴它“解題步驟合理且結(jié)果正確”,AI就能自己摸索出解題方法。這種方法不僅省去了數(shù)據(jù)標(biāo)注的麻煩,還讓模型在數(shù)學(xué)推理等復(fù)雜任務(wù)中達(dá)到了接近人類頂尖選手的水平。
二是分階段訓(xùn)練,精打細(xì)算。研發(fā)團(tuán)隊(duì)設(shè)計(jì)了四步訓(xùn)練法:先用少量高質(zhì)量數(shù)據(jù)打好基礎(chǔ)(冷啟動(dòng)),再針對(duì)推理任務(wù)專項(xiàng)優(yōu)化,接著篩選優(yōu)質(zhì)答案提升質(zhì)量,最后融合人類偏好確保安全性。這種“先學(xué)走再學(xué)跑”的策略,配合智能分配計(jì)算資源的技術(shù),讓訓(xùn)練成本大幅降低。
三是開(kāi)源共享,推動(dòng)普惠。DeepSeek-R1選擇全面開(kāi)源,允許任何人免費(fèi)使用和改進(jìn)技術(shù)。這種開(kāi)放策略吸引了全球2000多個(gè)開(kāi)發(fā)者參與,香港大學(xué)團(tuán)隊(duì)僅用30美元就復(fù)現(xiàn)了基礎(chǔ)功能。開(kāi)源不僅加速了技術(shù)普及,還讓中小企業(yè)和研究者能用上高性能AI,打破了巨頭壟斷的局面。
四是性能對(duì)標(biāo)國(guó)際頂尖水平。在數(shù)學(xué)解題(97.3%正確率)、代碼生成(超過(guò)96%程序員水平)、多語(yǔ)言處理等任務(wù)上,DeepSeek-R1已與OpenAI等頂尖模型持平甚至超越。更驚人的是,其API調(diào)用成本僅為GPT-4的三十分之一,用“小成本辦大事”的模式顛覆了行業(yè)認(rèn)知。
DeepSeek引發(fā)硅谷震動(dòng)的深層邏輯,首先是技術(shù)路徑的范式?jīng)_擊。DeepSeek“有限算力+算法創(chuàng)新”的模式,打破“大模型需天量投入”的行業(yè)假設(shè),在AGI關(guān)鍵指標(biāo)上的突破動(dòng)搖了硅谷的技術(shù)優(yōu)越性敘事。
其次是訓(xùn)練成本與效率優(yōu)勢(shì)。DeepSeek-V3的訓(xùn)練成本僅為558萬(wàn)美元,是Meta Llama 3.1的1/14,且性能相當(dāng)。其采用FP8混合精度訓(xùn)練和DualPipe流水線并行技術(shù),將顯存占用降低50%,同時(shí)通過(guò)動(dòng)態(tài)量化實(shí)現(xiàn)模型壓縮,使本地部署成為可能。這種“小算力驅(qū)動(dòng)大模型”的策略,直接沖擊了依賴大規(guī)模算力堆砌的硅谷模式。
第三是人才與生態(tài)重構(gòu)。DeepSeek的開(kāi)放式創(chuàng)新模式首次在AI基礎(chǔ)層構(gòu)建全球人才網(wǎng)絡(luò)。DeepSeek的跨國(guó)協(xié)作模式與敏捷商業(yè)化能力,展現(xiàn)出迥異于傳統(tǒng)實(shí)驗(yàn)室的創(chuàng)新效率。這種“技術(shù)主導(dǎo)型國(guó)際化”路徑,正在改變?nèi)騽?chuàng)新要素向硅谷單向流動(dòng)的態(tài)勢(shì)。DeepSeek從論文發(fā)表到API開(kāi)放僅用45天,其快速構(gòu)建的“模型即服務(wù)”生態(tài),形成技術(shù)與市場(chǎng)的正向循環(huán)。
DeepSeek的成功給我國(guó)AI發(fā)展帶來(lái)諸多啟示:
硬核創(chuàng)新的成功范式。DeepSeek的突破源于對(duì)“第一性原理”的堅(jiān)持:五年深耕數(shù)學(xué)基礎(chǔ)理論、開(kāi)發(fā)自主芯片架構(gòu)、構(gòu)建產(chǎn)學(xué)研協(xié)同體系。其MoE架構(gòu)通過(guò)細(xì)粒度專家拆分(256個(gè)路由專家)和共享通才機(jī)制,實(shí)現(xiàn)資源最優(yōu)分配。這種模式為行業(yè)樹(shù)立了“硬核創(chuàng)新與長(zhǎng)期投入”的標(biāo)桿。
系統(tǒng)性差距仍需正視。盡管DeepSeek取得突破,但是我國(guó)AI發(fā)展仍面臨三方面的短板:一是AI芯片整體算力僅為美國(guó)的38%,大模型訓(xùn)練仍需進(jìn)口GPU集群;二是數(shù)據(jù)質(zhì)量差距大,高質(zhì)量多模態(tài)數(shù)據(jù)集數(shù)量不足硅谷1/5,標(biāo)注成本高30%;三是人才差距較大,頂尖AI理論研究者數(shù)量?jī)H為美國(guó)1/3,原創(chuàng)性算法仍待突破。這些差距警示我們,僅僅依靠DeepSeek的單點(diǎn)突破,仍不足以扭轉(zhuǎn)劣勢(shì)。為應(yīng)對(duì)DeepSeek的挑戰(zhàn),OpenAI就快速發(fā)布了一款名為“深層研究”(deep research),并且美國(guó)國(guó)會(huì)中與中國(guó)進(jìn)行AI人才爭(zhēng)奪的聲音日益增強(qiáng),這表明我國(guó)發(fā)展AI的道路不會(huì)一帆風(fēng)順。
AI革命的核心在于“創(chuàng)造力解放”,而DeepSeek的進(jìn)展揭示了雙重可能性:既可通過(guò)技術(shù)迭代縮短差距,也可能因范式革新實(shí)現(xiàn)“換道超車(chē)”。因此,我國(guó)應(yīng)當(dāng)持續(xù)在以下三個(gè)方面發(fā)力——擴(kuò)大智慧城市場(chǎng)景、推動(dòng)數(shù)據(jù)制度變革、構(gòu)建算力體系,讓以DeepSeek為代表的AI產(chǎn)業(yè)形成“技術(shù)突破—場(chǎng)景落地—生態(tài)構(gòu)建”的閉環(huán),持續(xù)加強(qiáng)我國(guó)AI技術(shù)發(fā)展的內(nèi)生動(dòng)力。