12月1日,DeepSeek正式發布兩款新模型——DeepSeek-V3.2與DeepSeek-V3.2-Speciale,在多項智能體評測中均達到當前開源模型的最高水平,大幅縮小了開源模型與閉源模型的差距。
DeepSeek稱,標準版DeepSeek-V3.2適合日常使用,例如問答和通用智能體任務場景。在公開的推理類基準測試中,其性能已達到GPT-5水平,僅略低于Gemini-3.0-Pro,同時輸出長度顯著縮短,降低了計算開銷與用戶等待時間。
值得注意的是,V3.2并沒有針對這些測試集的工具進行特殊訓練,這意味著V3.2在真實應用場景中能夠展現出較強的泛化性。
不同于過往版本在思考模式下無法調用工具的局限,DeepSeek-V3.2還是首個將思考融入工具使用的模型,同時支持思考模式與非思考模式的工具調用。
長思考增強版DeepSeek-V3.2-Speciale進一步結合了DeepSeek-Math-V2的定理證明能力,具備指令跟隨、數學證明與邏輯驗證能力,在主流推理基準測試中的表現可媲美Gemini-3.0-Pro。
據悉,該模型還成功斬獲IMO 2025(國際數學奧林匹克)、CMO 2025(中國數學奧林匹克)、ICPC World Finals 2025(國際大學生程序設計競賽全球總決賽)及IOI 2025(國際信息學奧林匹克)金牌。其中,ICPC與IOI成績分別達到了人類選手第二名與第十名的水平。
目前,DeepSeek官方網頁端、App和API均已更新為正式版DeepSeek-V3.2。Speciale版本目前僅以臨時API服務形式開放,以供社區評測與研究。


產品與服務
聯系站長
關于我們