11月6日晚,月之暗面(Moonshot AI)發(fā)布全新模型KimiK2Thinking,稱其為“Kimi 迄今能力最強(qiáng)的開源思考模型”。
據(jù)介紹,該模型基于“模型即 Agent”的理念訓(xùn)練,原生具備“邊思考,邊使用工具”的能力,在多項(xiàng)國際基準(zhǔn)測試中達(dá)到 SOTA(業(yè)界最優(yōu))水平。

官方數(shù)據(jù)顯示,Kimi K2 Thinking 在 “Humanity’s Last Exam”(人類最后的考試)、自主網(wǎng)絡(luò)瀏覽(BrowseComp)、復(fù)雜信息收集推理(SEAL-0)等測試中均表現(xiàn)出領(lǐng)先成績,在 Agentic 搜索、Agentic編程、寫作與綜合推理 等任務(wù)中全面提升。
此外,據(jù)悉該模型可在 無人工干預(yù) 情況下,持續(xù)進(jìn)行300輪以上工具調(diào)用與多輪思考。月之暗面稱,這是其在 Test-Time Scaling(測試時(shí)擴(kuò)展) 領(lǐng)域的最新進(jìn)展,通過擴(kuò)展思考 token 數(shù)與調(diào)用輪次,顯著增強(qiáng)模型的持續(xù)推理與執(zhí)行能力。
Kimi K2 Thinking 已同步上線 kimi.com 和最新版 Kimi手機(jī)應(yīng)用,用戶在常規(guī)對話模式中即可體驗(yàn)升級后的推理性能。Kimi Agent 模式的底層模型也將陸續(xù)替換為 K2 Thinking,以支持完整的多輪思考與工具使用功能。


產(chǎn)品與服務(wù)
聯(lián)系站長
關(guān)于我們