同行紛紛押注Agent,梁文鋒仍保持深度求索AGI的定力。5月28日下午6時,DeepSeek宣布完成R1模型小版本試升級,并邀請用戶測試官方網頁、APP及小程序功能,API接口和使用方式保持不變。
當日晚10點33分,DeepSeek服務出現5分鐘不可用狀態,這是最近兩個月內少見的服務中斷現象。次日,DeepSeek開源R1最新0528版本,這是自1月20日正式推出以來首次更新,但官方未公布外界期待的R2時間表。
R1基于DeepSeek-V3模型能力復現,而R2可能需等待V4研發成功。V3上次升級是在3月24日,V4尚未有明確推出計劃。5月29日晚間,DeepSeek發布文章稱,此次更新通過后訓練提升了模型思維深度與推理能力,盡管工具調用等能力仍有進化空間。
后訓練是當前大模型競賽中的重要階段,一位投資人表示,國內幾家“六小虎”已放棄基座模型預訓練,轉而加強后訓練與微調投入以推動模型應用落地。傅盛感嘆大模型領域競爭激烈,周期可能僅3至6個月。
今年以來,國內外科技巨頭紛紛押注AI Agent。然而,梁文鋒及其團隊仍專注于模型本身的研究。騰訊迅速響應R1更新,于5月29日晚間宣布多款產品接入DeepSeek-R1-0528。
測試結果顯示,升級后的R1-0528超越阿里Qwen3,在數學與編程能力上接近國際領先水平。新版模型平均每題使用23K tokens,較舊版12K顯著增加。英偉達CEO黃仁勛預測Agentic AI將推動算力需求暴增至少100倍。
此外,DeepSeek蒸餾出DeepSeek-R1-0528-Qwen3-8B,該8B模型在AIME 2024數學測試中表現僅次于DeepSeek-R1-0528,超越Qwen3-8B且準確率與Qwen3-235B相當。強化后訓練后,幻覺率降低45%~50%,此前R1因高幻覺率備受批評。
R1-0528上下文長度仍為64K,落后于部分國際領先模型的128K。更大上下文規模有助于提升模型記憶能力,對工具產品化意義重大。
美國科技公司對DeepSeek的看法逐漸分化,英偉達最新財報顯示其業績強勁增長,CEO黃仁勛稱贊DeepSeek-R1如ChatGPT般越思考越聰明。OpenAI CEO山姆·阿爾特曼則表示不認為DeepSeek找到更高效驅動AI的方法。
DeepSeek承認R1-0528在某些方面仍與OpenAI和Anthropic的最新模型存在差距,如工具調用能力。一位投資人預估差距約為2至3個月。整個AI領域的競爭重心已轉向Agent,谷歌、微軟及Anthropic均在其近期發布會中重點討論Agent相關進展。
盡管行業關注焦點轉移,DeepSeek仍專注模型本身研究。梁文鋒曾強調參與全球科技創新的重要性,認為中國企業不應僅依賴海外技術創新進行商業化,而是要推動技術前沿發展。DeepSeek團隊約130人,以年輕技術人員為主,組織架構分為決策中心與執行層。


產品與服務
聯系站長
關于我們