字節跳動旗下豆包大模型團隊今日公開了最新思考模型Seed-Thinking-v1.5的技術細節。
該模型將于4月17日通過火山引擎開放接口供用戶使用。Seed-Thinking-v1.5在數學推理、編程競賽及科學推理等專業領域表現卓越,同時兼顧創意寫作等通用任務需求。其采用MoE架構,總參數達200B,激活參數為20B,單位推理成本較DeepSeek R1降低50%,實現了性能與效率的平衡。
模型數據體系融合可驗證與非可驗證數據,優化處理策略以提升生成質量。訓練方法結合監督精調與強化學習,確保模型具備長思考鏈能力。底層架構支持20B MoE復雜訓練需求,穩定性高達95%。Seed-Thinking-v1.5的推出標志著大模型技術的新突破。


產品與服務
聯系站長
關于我們