

不僅是技術有多強,更是生態有多廣、關系有多深。
下一代AI Agent的競爭,正悄然從技術參數的狂熱追逐,轉向一場更為深刻和復雜的生態構建與關系沉淀。當大模型能力以驚人的速度迭代,單點技術的護城河還能維持多久?未來的AI Agent,是依靠超凡智力脫穎而出,還是憑借不可替代的陪伴與信任扎根用戶生活?
12月3日下午,在2025甲子引力年終盛典中,清智資本創始合伙人張煜作為嘉賓主持人,對話Pokee.ai創始人朱哲清、靈宇宙創始人顧嘉唯、NemoVideo創始人李政錦、心影隨形聯合創始人王碧豪、百度智能云智能營銷產品部副總經理張紅光,圍繞《我們與AI?Agent的關系》這一主題展開了深入探討。
在這場對話中,Pokee.ai創始人朱哲清指出,處理企業級超長工作流需要強化學習與目標驅動,而未來最穩固的壁壘將是由工具、智能體與用戶構成的三方市場網絡效應。靈宇宙顧嘉唯則判斷,C端產品的真正壁壘并非功能,而是人與AI在真實世界中共歷瑣事、積累信任后形成的“羈絆”與共同記憶。心影隨形王碧豪則基于服務千萬用戶的心得,提出個人記憶資產的沉淀與運營能力將是關鍵,這如同創作者的社交資產,構成了深度依賴。
不可否認,從“全能工具”到“場景協作者”,AI的角色正在分化與深化。
NemoVideo李政錦觀察到,在視頻創作這類強創意領域,AI并非導致同質化,而是放大創作者個性風格的杠桿,其價值在于助力而非替代。百度智能云張紅光則描繪了提供多層次Agent基礎設施的圖景,以支持百花齊放的生態。
技術狂飆之后,一場關于連接、信任與運營的深度競賽已經鳴槍。這不僅是產品的進化,也是人機關系范式的重構。
以下為本場圓桌的文字實錄,經「甲子光年」編輯,在不改變原意的基礎上略有刪改。
張煜(主持人):首先,有請各位嘉賓介紹一下自己和公司所做的主要產品。

張煜 清智資本創始合伙人
朱哲清:我是去年年底離開Meta,此前在他們的強化學習團隊工作,主要負責將強化學習技術部署在廣告、大語言模型(LLM)以及自動化學習系統等領域。事實上,我們從2021年就已開始推進強化學習的實際落地,當時強化學習不是很火。
2024年底出來之后,我想通過強化學習打造面向企業復雜工作流的智能體(WorkFlow Agent)。目前市面上常見的智能體,在處理工具數量和工作流長度方面都很有限,一般只能穩定執行10個任務左右,一旦超過這個規模,穩定性就會大幅下降。比如我們最近為谷歌交付的項目,單個工作流包含超過350項任務,涉及多類調研與交付環節。
所以,從企業任務的復雜度來說,現在的Agent還是有代際差,我們正在往這方面努力。

朱哲清 Pokee.ai創始人、Meta應用強化學習部門前負責人
顧嘉唯:我是靈宇宙的創始人,我們公司專注于下一代人機交互,目前有兩條產品線。
第一款產品“Luka盧卡”,累計銷量已近千萬臺。它起源于上一輪深度學習技術浪潮,具備圖像識別能力,可以讀取桌面的繪本、教材,實現講讀、互動與成長陪伴,相當于孩子“讀萬卷書”的桌面伙伴。
還有一款產品是今年剛推出、近期熱度比較高的“小方機”。它更強調“行萬里路”,是一款便攜AI設備,能讓AI時代原住民隨時隨地擁有個人助理與伙伴。這款產品的誕生,也是基于“Luka”多年來在真實場景中積累的數據與洞察,讓我們看到了從“屏幕交互”走向“世界交互”的新機會。

顧嘉唯 靈宇宙創始人
李政錦:我現在的公司主要用AI技術賦能視頻創作者,幫助他們實現更高效的視頻編輯與剪輯工作。這與我的職業背景密切相關——我曾在TikTok負責面向創作者的整體視頻工具,也曾在零一萬物負責過多模態應用的落地探索。
在這個過程中,我持續觀察海內外的視頻創作生態,發現一個關鍵問題:一個視頻能不能火,和視頻創意有關,但創作者大約80%-90%的時間卻花在大量重復性勞動上。比如篩選素材、分析同類熱門視頻去總結規律,以及使用傳統剪輯軟件批量處理字幕、轉場與特效等細節。
為此,我們的目標是讓創作者從這些熟練卻繁瑣的“臟活累活”中解放出來,能把更多時間花費在他們更擅長、也更為重要的創意工作中。這是目前我們產品聚焦的事情。

李政錦 NemoVideo創始人
王碧豪:大家好,我是來自逗逗AI的王碧豪。我們公司的愿景是“用AI創造快樂”,本質上是用AI創造情緒價值。我們的產品“逗逗伙伴”是一款面向游戲玩家的AI伙伴產品,能在游戲中提供實時語音開黑與攻略指導。在國內這個月累計用戶超過1500萬。
我們更側重于直接觸達C端用戶。游戲玩家群體規模龐大,對很多人來說,這可能是他們接觸的第一個AI產品。因此,在產品設計上,我們更注重塑造友好、易用的AI形象。

王碧豪 心影隨形聯合創始人
張紅光:目前我所負責的產品名為“客悅”,我們現在在做“客悅數字員工”,其實就是為企業用戶運營的全流程——包括獲客、轉化、留存、洞察等環節提供數字員工支持,幫助企業以更高效、更智能的方式完成各項工作。

張紅光 百度智能云智能營銷產品部副總經理
1.2025,AI Agent的“高光時刻”:工作流革命正在發生

張煜(主持人):我們常說,AI?Agent在持續進化中。那么在進入正式探討之前,請各位分享一個今年讓你最興奮的Magic Moment,它可以是你自己產品里一個特別聰明的表現,也可以是你觀察到的、用戶使用Agent完成某件事時那個眼前一亮的時刻。
朱哲清:目前,海外AI Agent的落地已經相當好了。從某種意義上說,各大企業正積極在工作流中引入Agent。可以想像,以往企業云服務中已有各類工具,而現在從數據驅動到數據檢索等各個環節,都逐漸由AI Agent承接。
不過,很多企業現在比較突出的痛點是:盡管引入了多種Agent,但由于它們之間彼此割裂,最終并沒有真正節省時間。所以,工作流變得越來越重要。
從我們Pokee.ai的實踐來看,比如在與谷歌合作為客戶打造產品時,原本需要員工花幾周時間做的競品調研、廣告投放分析以及系統集成報告,現在變成30分鐘就能搞定。
顧嘉唯:(現場演示開始)我們可以調用一個智能體,給它打視頻對話。比如我現在召喚“詩人李白”,大家可以感受下:
顧嘉唯:hi,李白,我現在在一個活動現場,這個大會名叫“甲子引力”,由甲子光年主辦。請你將主辦方融入到一首詩中。
Agent詩人李白:眼前場景令我想起“眾星捧月”——雖無月但這燈光似繁星,臺下眾人如星拱月般聚于你身旁。若要將主辦方融入可作詩:“甲子引力聚華堂,光年璀璨映世章。我今穿越千年志,共賞此景韻悠長。”
顧嘉唯:哈哈,不錯,謝謝你。
顧嘉唯:OK,想象一下,在這樣的交互中,你可以隨時邀請各類智能體來到身邊:比如為孩子請來一位AI英語老師,掛在胸前游歷世界,各地人事物即刻變成一個英語角,隨時隨地練口語;或者邀來如李白般的詩人智能體,以古今對話的方式,帶領孩子去學古詩。
李政錦:剛才顧總分享的環節挺有意思。我們主要面向生產力場景的用戶,所以我們看到另一個方向是這樣:自從Google Gemini 3及相關技術框架發布以來,網絡會有各種各樣圍繞新模型能力構建的自我選用工具。
我們去年曾對此進行討論,當時判斷:傳統軟件工程通常分為開發者與使用者兩類群體,產品經理居中銜接,負責理解需求、定義產品并推動技術落地與交付。但隨著AI生產力工具快速發展,開發成本被大幅壓低,開發者和使用者兩類群體可能會開始整體向使用者做歸一,在Gemini3出現之后,我們覺得這個時刻來了。
因此可以確定:未來面向用戶、特別是大家長期使用的生產力軟件,其定義方式、開發范式與迭代路徑將呈現兩個明確特點:
第一,越來越碎片化和個性化;
第二,越來越臨時性。
這將對軟件工程的底層架構、產品結構帶來重大挑戰與革新。具體到我們專注的音視頻領域,其技術棧不僅涵蓋前后端,還包括蒙層、轉場、特效等一系列復雜處理。在新模型能力支持下,這些功能的構建成本與速度直接實現跨代際提升。
王碧豪:我比較同意今年最大的Magic ?moment一定是Gemini3的發布,因為我們主要應用的是多模態的離線能力,讓AI能夠看到屏幕,然后能夠理解信息,所以這一塊對我們的提升是非常大的。
然而在實際使用中,Gemini 3仍存在不少問題,包括響應延遲、長上下文理解不足以及幻覺現象等。
其實對于真正的“Magic ?moment”,我有個“暴論”:隱藏在Gemini3發布之后先后說LLM的問題,有沒有可能這是一個分水嶺,Gemini3代表LLM能力的頂峰。我們知道一旦一個東西達到頂峰之后,它接下來該怎么走呢?另外一點,大模型它像一個“考試型選手”,你只要告訴它全都會,你不告訴它沒法學。
所以我們面臨一個分水嶺:大模型行業不能探索出一條讓AI能夠自主化的路線?接下來行業必須作出選擇:是轉向全新的模型架構,還是繼續沿著規模化擴展的路徑推進?這是一個非常大的分水嶺。
張紅光:今年以來,越來越多的企業開始將客服智能體納入服務體系,以應對客戶咨詢量的增長和高峰時段的壓力。此外,我們在銷售類Agent(尤其是電銷Agent)方面也實現了重要突破。
我想分享一個我們在自主進化設計上的實踐:今年開始從技術方面我們嘗試了多Agent協同的架構。具體在電銷場景中,我們其實是有三個Agent在協同,讓電銷能力不斷進化。
首先,電銷Agent擁有初始的轉化目標,賣什么產品,有一個SOP去轉化。通常來講,冷啟動效果特別差,因為以前沒有相應的數據,為此,我們又設計了一個仿真的用戶Agent,與電銷Agent不斷對練。設計仿真用戶的時候,我們也模擬了不同MBTI人格、星座、職業等多維屬性的用戶畫像。
同時,第三個Agent擔任“對話分析師”角色,它對前兩者產生的海量對話進行實時分析,篩選出優質對話與問題案例,并自動迭代優化電銷Agent的提示詞與策略。
也就是說,AI?Agent不僅是封閉式的問題的解答,也能做處理開放式的銷售任務——這是我們看到的Magic moment。
2.AI Agent破局戰:技術協作、場景創新與生態之爭

張煜(主持人):朱總,在AI?Agent的架構設計中,一個核心的爭論是:大語言模型(LLM)作為認知核心,與強化學習(RL)作為決策優化引擎,這兩方面如何協同,在咱們公司的實踐當中如何平衡這兩方面關系?
朱哲清:核心問題在于,LLM的訓練過程缺乏持續、細粒度的反饋機制。
如果2016年AlphaGo出來的時候,當時在某個時間點互相下棋過程當中,你會知道在這個點上我獲勝的概率有多少。現在是在任何一個點上我不知道會發生什么,我們只有到了最后那個點才知道發生什么,這是強化學習可能目前仍然在相對瓶頸期的狀態,但是這意味著在算法層面上會有巨大的突破。
如果我們希望未來的LLM能夠實現自主迭代與自我提升,就必須建立一種機制——使模型能夠在完成某個階段任務后,基于自身或基礎模型的反饋進行持續優化。這與計算機科學的基本邏輯相符:驗證一個解的正確性通常比生成解更容易,因此一旦我們能判斷結果的好壞,就應該能夠通過優化方法逐步逼近更好的解。
我認為,未來一到兩年內,算法層面一定會有提升。
回到To B領域,強化學習之所以重要,是因為企業工作流很長。例如,一個典型任務可能需要:先閱讀理解50份內部文件,讀完了以后需要到網站上面了解50個文件對應的350家企業的情況,再篩選出前20家重點企業,隨后為這20家企業制定合作方案,再逐一查找對應銷售負責人及其聯系方式,最終執行郵件觸達——這才能形成一個完整的企業級任務閉環。
這個復雜程度并不是現在一個LLM能夠處理的,這也是為什么你目標驅動強化學習訓練才能達到這個目的。所以,未來還有很長的路要走,并不是我們已經看到曙光了,路還是很長的。
張煜(主持人):顧總是深耕在人機交互領域,在靈宇宙產品設計中,你們如何設計交互機制,既能讓用戶感到省心,又能夠有自己的控制權,使它不偏失,這是怎么處理的?
顧嘉唯:首先我們不是“無源之水”冷啟動的公司,我們在之前其實已經賣出上千萬臺設備了,所以數據肯定是很根本的一條,我們自己其實在過去感受到了一些正反饋。
剛剛在小方機上我展示的Agent功能中,首先,我們的產品能夠實現第一視角的環境感知與交互。
它不只進行簡單的問答,而是像人一樣有上下文“攀談”,更能識別所處空間的燈光、布局等視覺元素,并在此基礎上進行情境化回應,在對話中我們加入了空間感知、主動意識、長短期記憶和擬人感。我們正在探索的下一代交互,進一步融合了物理空間理解與內容生成能力。
我再來演示一個產品功能:就在剛才幾位嘉賓發言過程中,我胸前的小方機拍攝了現場兩位嘉賓的照片,系統可快速將其轉化為動態視頻角色——一個是把張煜總變身成鋼鐵俠,另一個則將朱總騎上感恩節主題的火雞奔跑而過。這種流暢的體驗背后是我們在模型中對意圖理解與推理速度的持續優化,使得在轉瞬間即可完成從靜態圖像到動態場景的轉化。
這種能力的積累,源于我們長期在內容與交互領域的深耕。
我們不僅是全球重要的繪本內容提供商,也通過“Luka”等產品積累了多模態交互的龐大真實數據。基于繪本講讀場景中訓練出的語義理解與空間引擎模型,我們已將其泛化至更廣泛的場景中,從而實現更快、更貼近真實環境的交互體驗。
在這樣的技術基礎上,我們進一步思考人機交互的演進方向。
行業普遍將AR眼鏡視為下一代交互的行業明珠,但即使如蘋果Vision Pro,仍存在重量與功耗的顯著限制。在真正輕盈如隱形眼鏡般的AR世界中個人助理到來之前,我們更需要思考的是:如何找到現階段可實現、且真正具有產品市場契合度的交互形態?
人機交互的發展方向必然是越來越“無形化”,從大屏到桌面、到口袋、到隨身穿戴,最終走向不可見。但從“口袋里的屏幕”到“看不見的交互”這條路,行業已探索近二十年,仍未出現真正的爆款產品。這正是我們所有人需要共同面對的問題。
我們從“Luka”到“小方機”的爆品打造過程中,逐漸認識到:面向未來的人機交互,不應一味追逐最新技術,而應回歸用戶真實場景,Look Back Into the Future,從過去二十年已被驗證的交互形態中尋找可落地的結合點。今天要認清是否到了Always-on和Invisible頭戴式顯示AR,如果沒到,應該定義基于多模態大模型更好PMF的場景載體,讓靶心用戶能先用起來,每天離不開,形成數據閉環,打造LingOS,滾動到下一代AI終端。
張煜(主持人):王總,心影隨形關注的是高度個人化情感陪伴的場景,這個場景其實挺敏感的,你認為用戶是與一個高度擬人化但是有幻覺的Agent共處更舒適,還是與一個能力邊界非常清晰,但是絕對忠誠的Agent共處更加舒適?你如何定義這個舒適區?
王碧豪:我覺得這個特別好,我們這里邊有一個血淚史。因為時間關系我只講一個觀點:技術的“舒適區”取決于其目標人群。一項技術向全民普及通常會經歷五個階段:
第一階段是創新者,只占人口的百分之零點幾;
第二階段是早期采納者,約占15%;
第三階段是早期大眾,約占35%。
實際上,我們目前正處于早期采納者階段,約覆蓋15%的人口。這一判斷的依據在于:ChatGPT月活用戶約8億,Gemini約6億,去重后大約覆蓋全球人口的10%。我們預計到明年才會進入早期大眾階段。
我們遇到的主要挑戰是:早在2022年至2023年,我們就已開始面向大眾市場提供AI體驗服務。在這種超前布局的情況下,我們只有兩條路徑可選:
第一條是向上走,即通過模型改進,使AI更好地滿足高要求用戶的需求。我們在這方面做了很多努力,但這些成果很可能被大模型整體的快速進化所掩蓋。
第二條是向下走,這反而更容易找到真正的“舒適區”。因為服務大眾市場時,需要提供的不是最前沿、最創新的體驗,而是最穩定、可復現的體驗。早期大眾用戶習慣于尋找產品不足,而早期極客用戶則樂于發現亮點并主動傳播。
因此,服務早期大眾的關鍵在于向下走——通過模板化與創新相結合的方式,找到用戶可接受的體驗形態。我們的具體做法是:賦予AI擬人化特質,應用先進的大模型能力,實現個性化交互,并以此構建數據閉環,讓每位用戶都能獲得獨特的體驗。這正是我們產品當前所實現的路徑。
張煜(主持人):李總,視頻創作實際上是個強創意的過程,Agent能幫用戶完成從腳本到成片大部分的工作。但是這里邊也有一個問題,它是賦能給每一個人創造力,還是說會最終實現大家創作的同質化?你看到了怎樣的趨勢?
李政錦:從視頻生態內部看,背后的邏輯其實很清晰:目前大多數人制作視頻,本質上仍是為了獲取流量或實現收益。所以視頻到底能不能火,本質還是通過推薦引擎觸達C端用戶后,他們是否愿意為之“投票”。即便在AI生產力快速發展的今天,這一底層邏輯并未發生根本改變。因此,視頻內容是否優質、是否具備足夠的差異化,仍然是其能否成功的關鍵。
在過去5到10年間,視頻創作領域涌現了大量創作者。其中一部分優秀創作者已經形成了自己獨特的創作風格,甚至形成一些IP特色,這些已成為他們內容創作中一貫堅持的東西。
與此同時,另一部分創作者為了獲取更多流量與粉絲,也會開始Follow頭部流行的視頻品類,再結合自身特點進行融合創新。在當前的視頻生態中,AI更多是幫助創作者在堅持個人風格、探索優質創意的過程中,提升創作效率、放大自身優勢,而不是導致創作趨向同質化或萎縮。
張煜(主持人):張總,今年以來,Agent在企業級市場從試點探索到規模化落地。你認為未來Agent的演進路徑是什么樣?是眾多垂直專家型Agent形成應用商店模式,還是由少數幾家超級平臺主導?百度智能云在推動AI演進過程中,最關鍵的發力點是什么?
張紅光:未來的Agent生態一定是像在座嘉賓一樣百花齊放的,不會收斂于單一平臺。百度智能云的核心策略是面向不同需求的用戶群體提供差異化的能力支持:對于技術能力較強的開發者,我們提供容器、算力和模型能力;對于研發投入有限的用戶,我們提供Agent開發平臺,支持通過拖拽等低代碼方式快速構建Agent;對于企業業務部門等非技術用戶,我們提供AI Agent應用產品,用戶只需上傳企業知識或相關資料即可搭建專屬Agent。百度智能云通過提供多形態的AI Agent基礎設施,作為關鍵發力點支撐多樣化的Agent發展與落地。
3.Agent未來核心壁壘:生態、關系與場景運營

張煜(主持人):最后一個問題,我們來一個預測:各位認為,未來三年,一個主流的C端AI?Agent,最核心的競爭壁壘是什么?請大家根據自己的感受分享一下。
朱哲清:從ToB視角預測ToC領域的Agent發展,我認為其最強的壁壘并非在于單一的壟斷性市場,而在于構建一個多邊市場。
核心邏輯在于網絡效應。當一個市場連接了多個不同的參與方時,就會形成強大的網絡效應,這種效應一旦建立便難以被打破。對于Agent而言,這種網絡效應可能體現在“Agent-工具”的生態聯動上。
我們可以將當前的各種能力(如搜索、多模態、辦公應用)視為Agent完成任務所必需的“工具”組件。以一個ToC的復雜場景(例如旅游規劃)為例,完成從靈感發現到預訂出行的全過程,可能需要串聯調用超過20個不同的工具。
未來的網絡效應,很可能誕生于一個類似“工具應用商店”的市場。其中,眾多垂直的Agent會從這個市場中按需調用、組合各種工具與功能,從而完善自身服務ToC用戶的能力。到時候,Agent不會只有一個,而會是多個。每個Agent可能像一個專注特定領域的“操作系統”或“智能體”,擁有不同的側重點。當用戶需要不同類型服務時,會通過相應的Agent來觸達底層豐富的工具生態。
一個連接工具提供商、Agent開發者、終端消費者的三方市場結構,理論上將是最穩固的,估計在未來三年這件事情應該是逃不掉的。
顧嘉唯:提到壁壘和競爭,推薦大家看看《7 Powers》這本書。構建壁壘的本質在于防止用戶遷移,也是7 Powers里的switch cost等七項競爭壁壘之一。然而實際上,許多大模型并未能守住用戶。例如當時豆包已經很厲害,但在DeepSeek出現后,很多流量被分散;如今豆包又拉回來非常多流量。所以我覺得C端AI Agent要建立壁壘的核心,不是工具有多好用,因為永遠會有更好用的工具。
真正的壁壘很可能建立在關系、依賴之中,一定是很強的“羈絆”。這類似于一位能力出色且值得信賴的工作伙伴:雙方不僅具備協作基礎,更在共同經歷中積累了深厚信任。這種信任源于日常互動中的相互依賴,也來自共同應對挑戰的過程。
李政錦:認同前面兩位的觀點。
從抽象層面看,在AI生產力快速發展的背景下,我們需要關注那些相對不變的要素。例如,人與人的連接,在B端則體現為渠道與關系——這些往往是穩定的。就像微信至今依然穩固,根本不會擔心被AI所沖擊和影響。
所以,無論是B端基于第三方市場的生態,還是C端偏社區化的形態,都可能伴隨早期優秀的產品定義與渠道關系,深入垂直場景,并憑借這些優勢逐漸積淀為壁壘。
此外,還可以觀察到:當前所有應用層都不可避免地需要與大模型進行深度交互,而這種交互的本質是基于Token的。許多應用在此基礎上進行二次封裝——無論是IP、作品、最佳實踐還是軟件——實際上都是對Token進行系統化組裝與重構,從而形成具有更高商業價值的沉淀。
這些沉淀發生于應用層,如果相應的公司能夠持續積累并掌握它們,便可能構筑起長期的競爭壁壘。
王碧豪:明年比較明確的預測是,上下文交互將成為AI Agent或應用公司在大模型之外進行優化的關鍵點。
再往后走一層的話,我同意個人關系與記憶資產的重要性,我管這個東西叫“個人資產”。這類似于抖音創作者的資產積累于該平臺,難以遷移至快手。因此,個人資產的運營能力至關重要。
第三個階段,從深度看,最終決定AI Agent壁壘的,將是對特定人群的運營能力。以移動互聯網時代為例,當LBS、5G等技術全部出現后,抖音、快手、B站、小紅書等平臺在底層技術上并無本質區別,其差異核心在于對不同人群的運營能力,這構成了最終的壁壘。
張紅光:行業深度與生態同樣是重要壁壘。行業深度代表背后的行業認知與深層次數據;生態代表完備度與更廣的行動空間。此外,體驗也是比較重要的壁壘。在以上兩者越來越趨同的情況下,誰的效果更好、速度更快、體驗更好,這是下一代AI Agent的壁壘。
張煜(主持人):各位專家都有真知灼見,我想AI agent形態,實際是AI發展的必然階段,但確實也剛剛開始,甚至AI Agent的定義,現在大家有不同的看法,到現在也有一定的泛化,今天各位專家簡單的對話也不是結束,其實正是一個開始,我相信未來可能大家對于AI agent,無論是壁壘也好,無論是應用也好,無論是技術也好,無論是未來范式也好,可能還會有更多的討論。
(封面圖及文中配圖來源:2025甲子引力年終盛典)
END.






