国产精品成人va在线观看,亚洲乱色熟女一区二区三区,91精品国产美女浴室洗澡无遮挡

　　同行紛紛押注Agent，梁文鋒仍保持深度求索AGI的定力。5月28日下午6時，DeepSeek宣布完成R1模型小版本試升級，并邀請用戶測試官方網頁、APP及小程序功能，API接口和使用方式保持不變。

　　當日晚10點33分，DeepSeek服務出現5分鐘不可用狀態，這是最近兩個月內少見的服務中斷現象。次日，DeepSeek開源R1最新0528版本，這是自1月20日正式推出以來首次更新，但官方未公布外界期待的R2時間表。

　　R1基于DeepSeek-V3模型能力復現，而R2可能需等待V4研發成功。V3上次升級是在3月24日，V4尚未有明確推出計劃。5月29日晚間，DeepSeek發布文章稱，此次更新通過后訓練提升了模型思維深度與推理能力，盡管工具調用等能力仍有進化空間。

　　后訓練是當前大模型競賽中的重要階段，一位投資人表示，國內幾家“六小虎”已放棄基座模型預訓練，轉而加強后訓練與微調投入以推動模型應用落地。傅盛感嘆大模型領域競爭激烈，周期可能僅3至6個月。

　　今年以來，國內外科技巨頭紛紛押注AI Agent。然而，梁文鋒及其團隊仍專注于模型本身的研究。騰訊迅速響應R1更新，于5月29日晚間宣布多款產品接入DeepSeek-R1-0528。

　　測試結果顯示，升級后的R1-0528超越阿里Qwen3，在數學與編程能力上接近國際領先水平。新版模型平均每題使用23K tokens，較舊版12K顯著增加。英偉達CEO黃仁勛預測Agentic AI將推動算力需求暴增至少100倍。

　　此外，DeepSeek蒸餾出DeepSeek-R1-0528-Qwen3-8B，該8B模型在AIME 2024數學測試中表現僅次于DeepSeek-R1-0528，超越Qwen3-8B且準確率與Qwen3-235B相當。強化后訓練后，幻覺率降低45%～50%，此前R1因高幻覺率備受批評。

　　R1-0528上下文長度仍為64K，落后于部分國際領先模型的128K。更大上下文規模有助于提升模型記憶能力，對工具產品化意義重大。

　　美國科技公司對DeepSeek的看法逐漸分化，英偉達最新財報顯示其業績強勁增長，CEO黃仁勛稱贊DeepSeek-R1如ChatGPT般越思考越聰明。OpenAI CEO山姆·阿爾特曼則表示不認為DeepSeek找到更高效驅動AI的方法。

　　DeepSeek承認R1-0528在某些方面仍與OpenAI和Anthropic的最新模型存在差距，如工具調用能力。一位投資人預估差距約為2至3個月。整個AI領域的競爭重心已轉向Agent，谷歌、微軟及Anthropic均在其近期發布會中重點討論Agent相關進展。

　　盡管行業關注焦點轉移，DeepSeek仍專注模型本身研究。梁文鋒曾強調參與全球科技創新的重要性，認為中國企業不應僅依賴海外技術創新進行商業化，而是要推動技術前沿發展。DeepSeek團隊約130人，以年輕技術人員為主，組織架構分為決策中心與執行層。

DeepSeek R1模型更新：強化后訓練與梁文鋒的AGI探索