12月12日凌晨,OpenAI在未進行官方預熱的情況下,低調發布了最新AI大模型GPT-5.2系列。此次發布距離上一代GPT-5.1僅一個月,距離GPT-5正式推出也僅過去四個月,如此密集的迭代節奏在OpenAI歷史上實屬罕見。這場緊急發布背后,是OpenAI首席執行官薩姆·奧特曼(Sam Altman)在12月初宣布的"紅色警報"(Code Red)狀態。面對谷歌Gemini 3在上個月驚艷亮相后帶來的激烈競爭壓力,奧特曼要求公司內部暫停所有非核心業務,將全部資源集中投入到ChatGPT的性能優化和用戶體驗提升上。被叫停的項目包括正在測試的廣告銷售業務、AI智能體以及個性化晨報產品Pulse。GPT-5.2系列被拆分為三個版本:Instant(極速版)、Thinking(思考版)和Pro(專業版),分別針對不同使用場景進行優化。Instant版主打快速響應,適用于信息查詢、翻譯和基礎文案創作;Thinking版專注于深度復雜任務,在編碼開發、長文檔分析、數學運算等領域實現突破;Pro版則面向高難度專業場景,提供極致精準的解決方案。在官方公布的基準測試中,GPT-5.2在多個維度展現出強勁實力。在涵蓋44種職業知識工作任務的GDPval測試中,GPT-5.2 Thinking在70.9%的任務上表現優于或持平人類頂尖專家,產出速度比人類快11倍以上,成本不到人類的1%。在數學推理測試AIME 2025中,GPT-5.2更是取得了滿分成績。編程能力方面,GPT-5.2在SWE-bench Pro測試中達到55.6%的新高,在SWE-bench Verified中更是達到80%的準確率。不過,新模型也面臨一些挑戰。根據早期測試者反饋,GPT-5.2 Thinking和Pro版本在處理復雜任務時響應速度較慢,部分用戶反映等待時間過長。同時,API定價相比前代上漲約40%,GPT-5.2 Pro的輸入價格達到每百萬token 21美元,輸出價格高達168美元,這給預算有限的初創企業帶來一定壓力。值得注意的是,奧特曼在GPT-5.2發布后表示,谷歌Gemini 3對公司業績指標的實際影響低于初期預期,公司計劃于2026年1月結束"紅色警報"狀態。這場由谷歌Gemini 3引發的AI巨頭競爭,在GPT-5.2的緊急上線后,似乎暫時進入了一個新的平衡點。(來源于網絡)