張大偉 制圖
◎記者 溫婷
DeepSeek風(fēng)頭正盛,金融機構(gòu)爭相接入。
截至2月11日,有北京銀行、江蘇銀行、蘇商銀行、重慶農(nóng)村商業(yè)銀行等多家銀行及國泰君安等頭部券商“嘗鮮”DeepSeek。恒生電子、金證股份、星環(huán)科技等金融科技服務(wù)公司的大模型服務(wù)也接入了DeepSeek。
通過部署DeepSeek,一些金融機構(gòu)看到了AI支出“降本增效”的可能性。專家表示,DeepSeek的出現(xiàn)在通用大模型領(lǐng)域產(chǎn)生了很強的“鲇魚效應(yīng)”,但從“好用”到“用好”,仍面臨數(shù)據(jù)安全、惡意訓(xùn)練、模型幻覺等挑戰(zhàn)。
爭相接入DeepSeek
日前,北京銀行宣布全面啟動“all in AI”戰(zhàn)略,攜手華為率先實現(xiàn)DeepSeek全棧國產(chǎn)化金融應(yīng)用。江蘇銀行依托“智慧小蘇”大語言模型服務(wù)平臺,本地化部署微調(diào)DeepSeek-VL2多模態(tài)模型、輕量DeepSeek-R1推理模型,分別運用于智能合同質(zhì)檢和自動化估值對賬場景。重慶農(nóng)村商業(yè)銀行借助騰訊云大模型知識引擎的能力,在企業(yè)微信上線基于DeepSeek模型的智能助手應(yīng)用“AI小渝”。
據(jù)公開信息,接入DeepSeek的金融機構(gòu)類型涵蓋銀行、證券、基金、非銀行支付機構(gòu)等。目前,多家銀行已實現(xiàn)DeepSeek系列大模型本地化部署,應(yīng)用場景包括智能合同管理、客服助手等。
作為最早一批本地化部署DeepSeek的非銀行支付機構(gòu)之一,移卡最初選擇DeepSeek的原因就是“好用”,這也成為DeepSeek擁躉眾多的主要原因。
移卡執(zhí)行董事、CTO羅小輝表示,移卡在2024年初就本地化部署了DeepSeek coder,在此基礎(chǔ)上,移卡開發(fā)了編碼助手,其功能包括代碼撰寫、代碼糾錯等?!癉eepSeek是目前開源最徹底的大模型廠商,性能和效率俱佳?!绷_小輝坦言,移卡準(zhǔn)備長期使用以DeepSeek為代表的開源大模型,逐步替換海外AI產(chǎn)品的大模型服務(wù),這將在保證質(zhì)量的前提下大大降低應(yīng)用成本。
奇安信銀行行業(yè)負(fù)責(zé)人徐懿巍認(rèn)為,訓(xùn)練成本更低,性能更強,完全開源、支持免費商用等優(yōu)勢,使DeepSeek在垂直行業(yè)更容易落地。
對此,優(yōu)智科技創(chuàng)始人兼CEO詹毅頗有感觸。目前優(yōu)智科技與中信建投等頭部券商在大模型應(yīng)用領(lǐng)域完成項目上線,正與數(shù)十家金融機構(gòu)推進(jìn)應(yīng)用落地。其核心AI平臺(智遇文檔、智友Agent)已全面接入DeepSeek,為金融機構(gòu)提供包括DeepSeek私有化部署在內(nèi)的完整解決方案。與此同時,優(yōu)智科技正在DeepSeek上持續(xù)訓(xùn)練面向金融場景的模型版本。
“如果用造車來類比的話,金融機構(gòu)青睞更好用的大模型‘整車’,而DeepSeek提供了更好的引擎?!闭惨惴Q,對大模型應(yīng)用而言,2024年更多是頭部機構(gòu)積極推動大模型落地,2025年在DeepSeek的認(rèn)知普及和更多金融標(biāo)桿案例的推動下,中小機構(gòu)大模型應(yīng)用將提速,市場將大幅擴容。
“以往談到大模型,金融機構(gòu)的目標(biāo)往往是‘爭先’;如今更多是‘恐后’,思維方式發(fā)生了質(zhì)變?!闭惨阏f。
“鲇魚效應(yīng)”持續(xù)強化
重金投入,產(chǎn)出未知,一直是影響金融機構(gòu)大模型規(guī)?;度氲闹匾?,而通過部署DeepSeek,不少金融機構(gòu)看到了AI支出“降本增效”的可能性。
據(jù)悉,恒生電子、星環(huán)科技、金證股份等金融科技服務(wù)商的大模型服務(wù)正加速接入DeepSeek。例如,恒生大模型系列應(yīng)用全面接入DeepSeek主流模型(DeepSeek-V3/DeepSeek-R1),覆蓋金融投研、投顧、合規(guī)、運營、投行等核心業(yè)務(wù)場景;星環(huán)科技大模型運營管理平臺Sophon LLMOps全面支持DeepSeek-R1全參版本及蒸餾版本,可用于智能投研與策略支持、智能運營與流程再造等智能金融場景。其測試數(shù)據(jù)也印證了這一趨勢。
以恒生電子為例,實測數(shù)據(jù)顯示,在金融高密度數(shù)據(jù)處理場景中,依托DeepSeek-R1的千億級參數(shù)壓縮和蒸餾技術(shù),本地部署算力資源消耗降低50%;基于DeepSeek獨創(chuàng)的MoE(混合專家)架構(gòu),客戶需求解析速度加快3倍。
“在一些強推理的業(yè)務(wù)場景,DeepSeek提升了訓(xùn)練實效?!毙黔h(huán)科技金融行業(yè)助理副總裁張曉明近期在與客戶的對接測試中發(fā)現(xiàn),一些有大模型應(yīng)用基礎(chǔ)、算力和人才資源儲備的銀行和頭部券商正積極接入DeepSeek,DeepSeek在通用大模型領(lǐng)域產(chǎn)生了很強的“鲇魚效應(yīng)”。
當(dāng)然,DeepSeek優(yōu)勢突出并不意味著其他大模型被放棄。張曉明坦言,整個大模型市場還是一個多元需求的市場,目前已有金融客戶用星環(huán)科技大模型運營管理平臺Sophon LLMOps適配了70多個主流模型,可適應(yīng)不同業(yè)務(wù)場景的需求,“DeepSeek熱浪下,應(yīng)該思考如何將大模型轉(zhuǎn)化為生產(chǎn)力”。
恒生電子首席科學(xué)家、恒生研究院院長白碩稱,DeepSeek擅長慢思考,在需要快慢思考結(jié)合的具體應(yīng)用場景中,通義千問和DeepSeek可以相得益彰,發(fā)揮更大的效果。
對于未來DeepSeek的應(yīng)用場景,羅小輝提出了兩方面設(shè)想:“一是面向企業(yè)內(nèi)部員工的效率工具;二是面向用戶或客戶的產(chǎn)品開發(fā)。”在應(yīng)用模式上,除當(dāng)作問答助手外,將大模型植入具體的應(yīng)用場景能讓其發(fā)揮更大的作用。
不容忽視的挑戰(zhàn)
新生事物都是機遇和挑戰(zhàn)并存,DeepSeek應(yīng)用也不例外。專家表示,金融機構(gòu)由于其業(yè)務(wù)性質(zhì),對數(shù)據(jù)的安全性、隱私保護(hù)及合規(guī)性有著極高要求,因此在部署大模型時也面臨更大挑戰(zhàn)。
徐懿巍表示,金融領(lǐng)域大模型往往包含復(fù)雜的算法和市場分析能力,開發(fā)成本較高,并承載重要業(yè)務(wù)和數(shù)據(jù),自身安全性的重要性不言而喻。在OWASP發(fā)布的大模型應(yīng)用十大安全風(fēng)險中,“提示注入”位居首位。攻擊者可通過設(shè)計特定的提示詞來誤導(dǎo)大模型產(chǎn)生錯誤的結(jié)果,特別是涉及投資決策、風(fēng)險管理等關(guān)鍵領(lǐng)域時,這種攻擊可能導(dǎo)致重大經(jīng)濟(jì)損失。
金融行業(yè)大模型的幻覺問題也是一大安全隱患。大模型生成的內(nèi)容有時可能與現(xiàn)實不符,這對于高度依賴準(zhǔn)確信息的金融行業(yè)來說,是一個潛在的風(fēng)險,尤其在提供市場預(yù)測、風(fēng)險評估或投資建議時,其危害不容忽視。
徐懿巍表示,金融機構(gòu)在部署大模型時,安全風(fēng)險不僅來自單個大模型服務(wù),更來自整家公司。因此,金融企業(yè)要做好整個公司風(fēng)險暴露面管理,實施嚴(yán)格的訪問控制措施,如身份驗證和授權(quán)機制,限制對API、數(shù)據(jù)庫的訪問。同時,做好網(wǎng)絡(luò)、終端、云、服務(wù)器、數(shù)據(jù)庫等基礎(chǔ)網(wǎng)絡(luò)安全防護(hù)措施,最大程度減少外部威脅。在具體保障措施方面,應(yīng)圍繞數(shù)據(jù)來源合規(guī)、內(nèi)容安全合規(guī)、敏感數(shù)據(jù)識別過濾、訓(xùn)練數(shù)據(jù)標(biāo)注安全、數(shù)據(jù)分類分級與安全保護(hù)、數(shù)據(jù)訪問控制等,打造體系化的防護(hù)方案。
除安全外,基礎(chǔ)設(shè)施特別是GPU資源也成為大模型部署的一大“掣肘”?!翱紤]到模型對于資源的需求較多,我們大多采用混合部署的方式,即部分本地化、部分外部接口的方式。我們正在密切關(guān)注大模型的小型化方案,期待通過這種方式來緩解資源壓力,同時希望涌現(xiàn)更多GPU資源,本土大模型與計算設(shè)備的結(jié)合是接下來重點研究的事項。”羅小輝說。
張曉明建議,金融機構(gòu)部署DeepSeek要綜合考慮算力、預(yù)算和基礎(chǔ)設(shè)施的投入情況,因“材”施策?!袄?,中大型機構(gòu)可通過部署R1全參版本,發(fā)揮算力、人才等綜合優(yōu)勢,加速大模型的平臺能力部署;中小機構(gòu)可以立足業(yè)務(wù)導(dǎo)入蒸餾版,開發(fā)更適合DeepSeek落地的應(yīng)用和工具,循序漸進(jìn),真正通過大模型實現(xiàn)降本增效。”張曉明說。