
如果說 2025 年年初最火爆的 AI 話題是 DeepSeek R1,那么近日橫空出世的「摩爾線程 IPO」則為 2025 年的結(jié)束錦上添花,二者共同為中國 AI 科技創(chuàng)新開龍擺尾,向業(yè)內(nèi)乃至國際傳遞了一個(gè)有力的信號(hào):
中國的人工智能,從底層算力到上層模型,如果有需要,是有能力擺脫對(duì)海外技術(shù)的依賴、實(shí)現(xiàn)全國產(chǎn)自主自研的。
盡管這只是初具雛形——以 AI 芯片為例,華為、商湯等許多企業(yè)的實(shí)踐都已證明,國產(chǎn)芯片的性能較之英偉達(dá)等寡頭雖有不足,但通過軟硬協(xié)同的生態(tài)模式,也能用于 AI 大模型的訓(xùn)練與推理。
摩爾線程于 12 月 5 日上市,作為「國產(chǎn) GPU 第一股」,其上市首日股價(jià)就暴漲超 400%,上市五天后市值更進(jìn)一步飆升至約 4500 億元、較發(fā)行時(shí)市值增長(zhǎng)超過 7 倍——雖然市場(chǎng)占有率與技術(shù)先進(jìn)性相比英偉達(dá)尤有不足,但摩爾線程 IPO 的這一亮眼成績(jī),恰恰表明了市場(chǎng)在用腳投票,看好中國科技自主創(chuàng)新的未來。
不過,DeepSeek 代表的是國產(chǎn) AI 在模型層的自主創(chuàng)新,而非從算力集群層與模型層的系統(tǒng)國產(chǎn)化創(chuàng)新。早前就有媒體報(bào)道,DeepSeek-R1 內(nèi)部用于模型訓(xùn)練與推理的算力集群主要基于英偉達(dá) GPU、不采用國產(chǎn)卡。作為專注 AGI的 理想主義者與資源有限的創(chuàng)業(yè)者,DeepSeek 的選擇更符合對(duì)效率的追求,無可厚非。
然而,在 AI 技術(shù)發(fā)展道路上,需要有人追求智能的上限突破,也需要有人提前作進(jìn)一步的考慮:除了模型層的自主可控,底層架構(gòu)、算力乃至上層產(chǎn)品與應(yīng)用也需要自主可控,并且還要性能趕超。R1 之后,中國 AI 發(fā)展的下一個(gè)步該往哪去?
再次走到十字路口,“我們需要用創(chuàng)新來打破當(dāng)前的技術(shù)發(fā)展瓶頸”,這是商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家林達(dá)華給出的答案。
市場(chǎng)上能夠洞察趨勢(shì)的人很多,但真正有實(shí)力、有膽量并付諸行動(dòng)的則屈指可數(shù)。作為少數(shù)者,商湯已經(jīng)沖在 AI 底層創(chuàng)新與國產(chǎn)化的第一線。
算力是開始
如果細(xì)心觀察,大家不難發(fā)現(xiàn):在主攻 AI-Native 的企業(yè)里,商湯是唯一一家同時(shí)在模型與算力上均有出色成果的公司。
BAT 之列的互聯(lián)網(wǎng)大廠雖也是全面開花、既有云又有模型,但終究不是 AI Native 的思維方式——這在短期的市場(chǎng)競(jìng)爭(zhēng)里并不構(gòu)成阻力,事實(shí)也多有證明;然而,在更大的技術(shù)愿景面前,如系統(tǒng)性的 AI 國產(chǎn)化面前,從底層到上層的技術(shù)研發(fā)、產(chǎn)品、應(yīng)用乃至市場(chǎng)運(yùn)營(yíng)等各個(gè)角色的 AI-only 思維,則更有優(yōu)勢(shì)。
這種優(yōu)勢(shì)體現(xiàn)在:本土的AI 公司本就以開拓中國人工智能科技自主創(chuàng)新為起點(diǎn)與終局,「AI 國產(chǎn)化」的需求與他們的創(chuàng)業(yè)使命跟努力方向自然高度吻合。當(dāng)內(nèi)在動(dòng)力與外部需求達(dá)成一致,兩股力量扭成一股力量,那么終局的實(shí)現(xiàn)就只是時(shí)間問題。
以商湯為例。其在 2020 年開始率先投入大裝置的決定,便是基于對(duì) AI 算法需求的深入了解,深諳 AI 模型與底層計(jì)算基礎(chǔ)設(shè)置協(xié)同適配的重要性。這一前沿舉措雖曾在中途歷經(jīng)質(zhì)疑與低谷,但技術(shù)的發(fā)展規(guī)律最終驗(yàn)證了其正確性。
也是基于對(duì)技術(shù)發(fā)展的前瞻認(rèn)知,商湯大裝置并不止步于打造純英偉達(dá) GPU 的算力集群,而是積極擁抱國產(chǎn)芯片、推動(dòng)模型與國產(chǎn)芯片的全面適配,打造從模型到算力的多方位自主可控護(hù)城河。這是技術(shù)發(fā)展的兩大客觀要求:
一方面,模型與應(yīng)用的迭代日新月異,速度與性能都是決定市場(chǎng)競(jìng)爭(zhēng)的重要因素,若支持底層模型訓(xùn)練與推理的「算力開關(guān)」掌握在不可控的競(jìng)爭(zhēng)對(duì)手中,那么無論算法再怎么發(fā)力也是無濟(jì)于事,國產(chǎn) AI 的整體競(jìng)爭(zhēng)力仍會(huì)處于巨大的不確定性中;
另一方面,算法與應(yīng)用的發(fā)展速度超過單一芯片廠商的流片速度。除了語言大模型,多模態(tài)大模型、具身智能、空間智能等等新興技術(shù)方向的成果層出不窮,即使英偉達(dá)的 CUDA 軟件生態(tài)壁壘再高,下游模型與應(yīng)用廠商也必須依賴更多元的芯片供應(yīng)。此外,生態(tài)不完善也是國產(chǎn) GPU 發(fā)展的一大瓶頸,國產(chǎn)模型廠商與國產(chǎn)芯片廠商的合作幾乎是水到渠成。
就在今天,商湯與寒武紀(jì)剛剛聯(lián)合發(fā)布了最新合作進(jìn)展,并一口氣宣布了未來深度優(yōu)化的全套方案與打法。這也是雙方今年10月簽署戰(zhàn)略合作協(xié)議以來,在推進(jìn)軟硬件聯(lián)合優(yōu)化上的關(guān)鍵一步。

尤其在多模態(tài)生成模型領(lǐng)域,商湯日日新 Seko 系列模型已完成對(duì)寒武紀(jì)芯片的適配,包括其最新發(fā)布的行業(yè)首個(gè)多劇集生成智能體 Seko 2.0。配合商湯行業(yè)首創(chuàng)的LightX2V視頻生成推理框架,未來國產(chǎn)芯片將能支持真正意義上的實(shí)時(shí)視頻生成,為國產(chǎn)視頻生成產(chǎn)業(yè)創(chuàng)新發(fā)展提供自主的底層支撐。
根據(jù)規(guī)劃,在適配完成后,商湯和寒武紀(jì)還將在模型核心能力優(yōu)化、提升算力利用率與成本效率、強(qiáng)化大規(guī)模并行處理能力與資源管理機(jī)制等多個(gè)方向進(jìn)一步協(xié)作,為 AGI 接下來在多模態(tài)領(lǐng)域的創(chuàng)新提供可能。
同時(shí),再以商湯與摩爾線程的合作為例。摩爾線程能提供全功能 GPU,兼顧 AI 計(jì)算與圖形渲染。商湯的大模型訓(xùn)練需要極致的浮點(diǎn)運(yùn)算能力,AIGC 視頻生成等應(yīng)用與空間智能等前沿技術(shù)的探索又需要強(qiáng)大的渲染能力,摩爾線程等國產(chǎn)芯片正好符合現(xiàn)實(shí)需求。
而對(duì)國產(chǎn)芯片企業(yè)來說,商湯的日日新大模型體系、大裝置 SenseCore及廣泛的落地場(chǎng)景提供了絕佳的規(guī)模化場(chǎng)景驗(yàn)證平臺(tái),幫助它們驗(yàn)證其 GPU 的性能、打磨產(chǎn)品。比如,在與摩爾線程的合作中,國產(chǎn) GPU就首次在千億參數(shù)級(jí)的大模型訓(xùn)練與推理任務(wù)中接受了工業(yè)級(jí)標(biāo)準(zhǔn)的嚴(yán)苛考驗(yàn)。
除了寒武紀(jì)與摩爾線程,商湯還也與沐曦、華為、璧仞等幾乎所有國產(chǎn)芯片都進(jìn)行了全面適配。
此外,商湯在擁抱國產(chǎn)芯片與硬件上取得的成就還有很多,包括全國首個(gè)完成與華為昇騰 910C 384 超節(jié)點(diǎn)的全面適配。華為昇騰 384 超節(jié)點(diǎn)通過高速互聯(lián),將CPU、NPU、DPU、存儲(chǔ)和內(nèi)存等資源全部互聯(lián)和池化,實(shí)現(xiàn)了更大的算力密度和互聯(lián)帶寬。商湯大裝置與華為合作,在調(diào)度優(yōu)化、跨 POD 訓(xùn)練穩(wěn)定性與多維度故障檢測(cè)與恢復(fù)等問題上取得了多項(xiàng)攻關(guān),有效解決了大模型訓(xùn)練中的算力協(xié)同與通信效率問題。
今年 7 月,商湯還聯(lián)合華為、海光、寒武紀(jì)、庫帕思、摩爾線程、曦望Sunrise、壁仞科技、麒麟軟件等十余家國產(chǎn)芯片生態(tài)伙伴,共同發(fā)布了「商湯大裝置算力Mall」,幫助行業(yè)客戶在「算力市場(chǎng)」中以更低的門檻和成本,獲取經(jīng)過驗(yàn)證的高性能國產(chǎn)芯片,并實(shí)現(xiàn)自主安全可控:
在算力層,「商湯大裝置算力 Mall」可以提供高效穩(wěn)定且具有成本優(yōu)勢(shì)的異構(gòu)計(jì)算基礎(chǔ)設(shè)施;在語料層,庫帕斯等提供高質(zhì)量數(shù)據(jù)集、數(shù)據(jù)清洗、標(biāo)注及合規(guī)安全的管理服務(wù),提升模型訓(xùn)練的數(shù)據(jù)源質(zhì)量;在算法層,商湯「日日新」系列基礎(chǔ)模型與「大裝置 AI 應(yīng)用開發(fā)底座」等 MLOps 工具結(jié)合,能夠幫助客戶快速完成模型微調(diào)和二次開發(fā)能夠解決實(shí)際業(yè)務(wù)問題的模型。
從算力到模型、再到應(yīng)用的全國產(chǎn)化,是一個(gè)需要兼具技術(shù)實(shí)踐與前瞻洞察的愿景,也是行業(yè)的發(fā)展共識(shí)——「能否全國產(chǎn)化」與「是否要國產(chǎn)化」是兩回事,在后者之前、我們首先要實(shí)現(xiàn)前者。商湯并非 AI 賽道中唯一看到這個(gè)方向的玩家,但既有心、又有力去做這件事的企業(yè)鳳毛麟角。
作為少數(shù)的 AI 上市企業(yè),商湯用行動(dòng)與魄力表明,它已在「AI 國產(chǎn)化」這條路上出發(fā)。
系統(tǒng)化是終局
如果說模型與國產(chǎn)芯片的全面適配,只是國產(chǎn)化的起點(diǎn),商湯「AI 國產(chǎn)化」戰(zhàn)略的成敗關(guān)鍵,在于模型底層架構(gòu)創(chuàng)新與產(chǎn)品落地上。

從數(shù)據(jù)的角度看,通用人工智能的發(fā)展此前經(jīng)過了兩個(gè)關(guān)鍵范式的迭代階段:第一階段是 Scaling Law,通過在預(yù)訓(xùn)練階段擴(kuò)“大力出奇跡”,用海量數(shù)據(jù)去訓(xùn)練,提升 AI 模型的智能水平,如 GPT-3 及后續(xù)海內(nèi)外多個(gè)大規(guī)模預(yù)訓(xùn)練語言模型;第二階段是通過高質(zhì)量的指令微調(diào)(SFT)、人類反饋強(qiáng)化學(xué)習(xí)(RLHF)等后訓(xùn)練,將真實(shí)人類用戶的反饋給到模型,讓它能聽懂人類指令。當(dāng) Scaling Law 瓶頸突現(xiàn),AGI 的下一個(gè)突破成為所有從業(yè)者的共同扣問。
在這里,業(yè)內(nèi)有兩個(gè)方向:一是從后訓(xùn)練突破,如 DeepSeek R1 在后訓(xùn)練強(qiáng)化學(xué)習(xí)階段的創(chuàng)新,用可驗(yàn)證獎(jiǎng)勵(lì)強(qiáng)化學(xué)習(xí)(RLVR)挖掘模型邏輯潛能;另一個(gè)方向則是從模態(tài)突破,將通用基礎(chǔ)模型從單一的文本擴(kuò)展到語音、圖像、視頻等模態(tài)。視覺積累深厚的商湯無疑堅(jiān)定地踐行后者,而這一方向的一大瓶頸是能支撐原生多模態(tài)大模型的架構(gòu)。
圍繞這一瓶頸,商湯在不久前發(fā)布并開源了自主研發(fā)的多模態(tài)模型架構(gòu) NEO,為其日日新大模型提供了新的架構(gòu)基石。此前,業(yè)內(nèi)雖也有多模態(tài)大模型架構(gòu),但大多采用「視覺編碼器+投影器+語言模型」的模塊組合,本質(zhì)上仍然以語言為中心,限制了多模態(tài)大模型「智能涌現(xiàn)」的潛力。
作為多模態(tài)大模型的先行者,商湯沒有囿于老思路,從 2024 年就開始在國內(nèi)率先嘗試突破多模態(tài)原生融合訓(xùn)練技術(shù),以單一模型在 SuperCLUE 語言評(píng)測(cè) 和 OpenCompass 多模態(tài)評(píng)測(cè)中奪冠,并基于這一核心技術(shù)打造了日日新 SenseNova 6.0。之后,商湯在 2025 年 7 月發(fā)布的日日新 SenseNova 6.5 通過在多階段的早期融合突破,大幅輕量化視覺編碼器,又把多模態(tài)模型性價(jià)比提升 3 倍。
近日,其發(fā)布的 NEO 架構(gòu)又展示了更大的能力:在測(cè)試中,NEO 架構(gòu)僅需業(yè)界同等性能模型 1/10 的數(shù)據(jù)量(3.9 億圖像文本樣本),就能開發(fā)出頂尖的視覺感知能力,在多項(xiàng)視覺理解任務(wù)中追平 Qwen2-VL、InternVL3 等頂尖多模態(tài)模型,在 MMMU、MMB、MMStar、SEED-I、POPE 等多項(xiàng)公開權(quán)威評(píng)測(cè)中斬獲高分。
繼 NEO 架構(gòu)等原生多模態(tài)訓(xùn)練技術(shù)的探索后,商湯在空間智能模型 SenseNova-SI 上取得優(yōu)異表現(xiàn),不僅超過了 GPT-5 甚至最新的 Gemini-3 Pro,而且也超過了李飛飛團(tuán)隊(duì)最新發(fā)布的空間智能專用模型 Cambrian-S。
除了多模態(tài)模型的等底層技術(shù)創(chuàng)新,商湯開源的行業(yè)首個(gè)能夠做到實(shí)時(shí)視頻生成的推理框架——LightX2V,相關(guān)模型已累計(jì)下載超過 350 萬次,這一項(xiàng)目極大促進(jìn)并完善了視頻生成的國產(chǎn)化生態(tài)。
LightX2V 框架設(shè)計(jì)了強(qiáng)兼容的國產(chǎn)化適配插件模式,可快速完成各類國產(chǎn)硬件的適配,包括寒武紀(jì)、沐曦、海光 DCU、昇騰910B等多款芯片。并且從測(cè)試數(shù)據(jù)來看,在不同 GPU 硬件環(huán)境下,LightX2V 均能實(shí)現(xiàn)高效推理,為不同場(chǎng)景的落地提供了靈活支撐。
實(shí)際上,大模型產(chǎn)品的規(guī)模化應(yīng)用落地,尤其以視頻生成模型為典型代表,其目前最大掣肘是成本。拿關(guān)注度很高的AI短劇為例,通常生成 1 分鐘高質(zhì)量視頻就需要 1 小時(shí)八卡的英偉達(dá)最新 GPU 計(jì)算,成本非常高、大規(guī)模落地幾無可能。而傳統(tǒng)的開源模型每小時(shí)計(jì)算只能生成 20 秒視頻,好一點(diǎn)的商用模型可以生成 80 秒。
而最新報(bào)告顯示,使用SekoTalk——商湯開發(fā)的實(shí)時(shí)語音驅(qū)動(dòng)數(shù)字人技術(shù),同樣質(zhì)量的視頻,一小時(shí)計(jì)算可以生成1280秒。甚至在針對(duì)對(duì)話場(chǎng)景進(jìn)一步優(yōu)化后,使用消費(fèi)級(jí) 5090 顯卡計(jì)算一小時(shí),生成時(shí)長(zhǎng)甚至可以達(dá)到 4500 秒。
值得注意的是,在本周舉行的商湯產(chǎn)品發(fā)布周上,商湯的 Seko、小浣熊等產(chǎn)品都將全面支持國產(chǎn)化。
隨著國產(chǎn)硬件與 AI 模型等的深度融合,將牽引國產(chǎn)化產(chǎn)業(yè)鏈上下游企業(yè)協(xié)同創(chuàng)新,為信創(chuàng)、數(shù)據(jù)安全要求及本地化部署,提供自主可控的關(guān)鍵解法,降低對(duì)海外技術(shù)的依賴。
從底層國產(chǎn)算力適配,到中間模型架構(gòu)算法的自主創(chuàng)新,再到上層應(yīng)用部署的安全可控,商湯在 AI 國產(chǎn)化不只是單點(diǎn)出擊,而是進(jìn)行了系統(tǒng)性的全面布局,在每一環(huán)都有深入?yún)⑴c。
國產(chǎn)化不是唯一路徑,卻是不可或缺的選擇。在這場(chǎng)“必須要打的仗”面前,一個(gè)行業(yè)領(lǐng)頭羊的擔(dān)當(dāng)絕不能是回避,而是要推動(dòng)原始底層創(chuàng)新,并且迎難而上,聯(lián)合行業(yè)與生態(tài)的力量——商湯在做的,恰恰就是這樣一件事。

