本文來源:時代周報 作者:唐洛

過去一年,國產化已成為人工智能領域的“必答題”。然而,真正的挑戰并不在于誰喊得早,而在于能否解決一個更具現實意義的問題:在模型規模持續膨脹、應用深入真實業務場景的背景下,國產算力如何才能實現長期、穩定的運行保障。
在當前全球算力供應鏈不確定性加劇的背景下,這一挑戰已遠超技術路線之爭,直接觸及人工智能產業能否持續穩健擴張的根本所在。
商湯科技給出的答案,顯得尤為克制和務實。在過去一年中,華為昇騰、寒武紀、沐曦等多家國產芯片,被同時納入商湯的AI體系。這并非簡單的“點亮”兼容,而是深度集成至同一套AI基礎設施、同一套模型架構,以及同一條應用交付鏈路之中。這背后,清晰地展現了商湯圍繞“大裝置—大模型—應用”所構建的三位一體戰略。
在這一戰略下,國產化不再是被動應對外部環境的權宜之計,而是被拆解為一項長期任務:算力層面,要構建多元、穩定的國產算力供給;模型層面,要讓多模態大模型真正跑在不同國產芯片之上;應用層面,則必須把算力能力轉化為客戶可用、可交付的產品。
當華為昇騰、寒武紀、沐曦被同時接入,商湯真正關心的,或許并不是某一款芯片的上限,而是如何讓國產算力在真實業務中跑得久、跑得穩。
助力國產算力從“可用”到“好用”
在大模型訓練與推理場景中,算力瓶頸早已不只取決于單卡性能。異構芯片之間的調度復雜度、跨域訓練的穩定性,正在成為影響整體算力效率的關鍵變量。
基于這一判斷,商湯突破口放在基礎設施層。作為商湯的 AI 云原生平臺,商湯大裝置試圖解決的,正是異構算力規模化使用中的系統性問題。通過提供統一調度、彈性擴展和高可靠性的 AI 基礎設施服務,商湯大裝置希望以更高的性價比,推動大模型能力在真實業務中的落地。
目前,寒武紀、壁仞、沐曦、華為昇騰、摩爾線程等多家國產芯片,已完成與商湯大裝置的深度適配,并支撐商湯“日日新”多模態大模型體系的訓練與推理。這意味著,國產 GPU 首次在千億參數級任務中,接受系統級、工業級的持續運行檢驗。
但真正的難點,并不在“接入”本身。不同芯片在架構設計、軟件棧上的差異,使統一訓練與調度的復雜度顯著上升。
為此,上海AI實驗室率先探索并研發了DeepLink超大規模跨域混訓技術方案,通過訓練加速、異構通信、并行策略等核心技術,打破芯片架構差異帶來的協同壁壘,重構計算資源調度體系。
而商湯大裝置發布基于DeepLink的異構混合調度方案,將DeepLink深度融入商湯大裝置核心能力體系。通過這一方案,多種國產芯片之間可實現協同通信與統一調度,并自動進行并行策略優化和負載均衡,真正做到“不同芯片,同一平臺”的協同工作,釋放異構集群的計算潛力。
在集群層面,商湯大裝置與華為昇騰384超節點率先完成全面適配。超節點(SuperPod)是一種通過高速互聯技術,將多個GPU/NPU整合為統一計算單元的新型架構,解決AI大模型訓練中的算力協同與通信效率問題。圍繞昇騰384超節點,商湯在調度優化、跨 POD 訓練穩定性和多層級故障恢復方面進行了針對性設計,使多租戶、大規模、彈性AI云服務成為可能。
在推理環節,商湯還與記憶張量合作,在國產 GPGPU 上跑通了業內首個以“記憶—計算—調度”一體化為核心的 PD 分離商用推理集群。在真實 C 端負載下,該方案實現單卡并發效率提升20%、吞吐提升75%,綜合推理性價比達到英偉達A100的150%,為高性能模型的大規模落地打開了新的降本增效空間。
此外,商湯聯合華為、庫帕思、海光、寒武紀、曦望 Sunrise、壁仞科技、麒麟軟件、摩爾線程等十余家國產廠商,共同發布“商湯大裝置算力 Mall”。這一平臺試圖構建一個“算力超級市場”,讓開發者和企業像選購商品一樣,自由組合算力資源、平臺工具和行業模型服務。
在商湯科技看來,“商湯大裝置算力 Mall”的價值不僅在于降低 AI 應用門檻,更在于為用戶提供靈活、自主的國產算力選擇路徑,從系統層面削弱對單一海外技術體系的依賴,推動中國 AI 產業向更加自主、可控的方向演進。
低成本的視頻生成國產化生態
在多模態應用中,視頻生成對算力的要求幾乎是一個極端場景。相比文本和圖像,視頻不僅引入了“時間”這一維度,使數據規模呈幾何級增長,還對連續性、物理一致性提出更高要求,模型必須在極短時間內完成大量推理計算。這也使得視頻生成成為當前所有 AI 模態中,算力消耗最高的領域。
今年,商湯開源了支持實時視頻生成的推理框架 LightX2V,試圖解決的正是這一問題。LightX2V 的設計目標非常明確:把視頻生成從“實驗室效果”拉進可規模化部署的工程體系。
在具體實現上,LightX2V 通過步數蒸餾、低比特量化、稀疏注意力、特征緩存和張量卸載等一系列工程化手段,將顯存需求壓縮至 8GB 以下,使入門級消費級顯卡也具備運行條件;在速度上,框架支持最高 1:1的實時生成能力,即 5 秒視頻可在 5 秒內完成生成。
在國產化適配上,LightX2V 設計了強兼容的國產化適配插件模式,可快速完成各類國產硬件的適配,目前已支持寒武紀、沐曦、海光、昇騰等多款芯片。與此同時,為更充分釋放國產算力特性,商湯在模型側同步調整,Seko 系列模型在設計階段就引入低比特量化、壓縮通信和稀疏注意力等硬件友好機制,使整體推理性能提升超過 3 倍。
據悉,適配完成后,商湯與寒武紀還將在算力利用率與成本效率、大規模并行處理能力等多個方向進一步展開深度優化,進一步降低多模態AI的使用門檻并提升整體體驗。
由于在加速視頻創作上優勢明顯,可實現極致性價比,截至目前,LightX2V 的累計下載量已超過 350 萬次。這一數字不只是開源項目的熱度指標,更反映出一個趨勢:在視頻生成這一場景中,國產算力開始擁有低成本的國產化生態。
國產化進入產品與交付階段
相較于基礎設施和模型層面的技術驗證,產品與項目交付更能檢驗國產化的“含金量”。是否被持續使用、是否進入業務核心流程,往往比單次跑通技術指標更具說服力。國產化能否成立,最終要看它能否在真實場景中替代、并長期運轉。
在應用層,商湯將這一判斷率先落在生成式內容生產上。12 月15日,商湯科技基于其在生成式 AI 與多模態交互領域的積累,發布 Seko 2.0——行業首個面向多劇集生成的智能體。在長視頻生成場景中,角色一致性、畫面風格穩定性始終是制約規模化生產的核心難題,而Seko 2.0在多劇集視頻生成的一致性方面展現出顯著優勢,其背后依托的是商湯自研的日日新Seko系列模型,包括SekoIDX、SekoTalk等圖像與視頻生成多模態模型所構建的技術底座。
更重要的是,這套能力已完成在國產算力上的適配。商湯日日新 Seko 系列模型已支持寒武紀等國產 AI 芯片,在 AIGC 核心場景中實現了從語言模型到多模態生成的關鍵跨越。這不僅是技術協同的深化,更是國產AI生態的重要完善,為視覺內容的創新開發提供了更堅實、自主的底層支撐。
在終端側,商湯旗下 AI 智能助手“小浣熊”已完成多種國產芯片的適配,并針對個人 PC 使用場景進行專項優化。在端側運行條件下,其模型精度與云端保持一致。同時,小浣熊也已適配多種國產芯片一體機方案,形成軟硬件協同的全國產化部署路徑,為對數據安全和自主可控要求較高的用戶提供現實選擇。
此外,在計算機視覺、金融、醫療以及“大裝置”等私有化業務中,商湯也已完成國產芯片的適配與交付。在外部環境不確定性加大的背景下,企業選擇國產算力并非單一動因,合規要求、供應鏈穩定性以及長期成本結構共同構成決策邏輯。而能否在產品與交付階段順利落地,正是國產算力跨越這一門檻的關鍵。
從大裝置、大模型到應用層,商湯與多家國產 AI 芯片企業展開深度合作,在實際項目中磨合能力邊界,形成“技術互補、資源共享、場景互哺”的協同模式。這種以交付為牽引的合作路徑,不僅推動了國產算力的可用性提升,也在一定程度上緩解了市場對供應鏈不確定性的擔憂。


