一款名為 Kimi-Dev-72B 的開(kāi)源代碼大型語(yǔ)言模型(LLM)現(xiàn)已推出,旨在革新軟件工程領(lǐng)域的問(wèn)題解決方式。該模型在 SWE-bench Verified 基準(zhǔn)測(cè)試中展現(xiàn)出最先進(jìn)的性能,尤其擅長(zhǎng)自主修復(fù) Docker 環(huán)境中的真實(shí)代碼倉(cāng)庫(kù)。

Kimi-Dev-72B 的核心優(yōu)勢(shì)在于其通過(guò)大規(guī)模強(qiáng)化學(xué)習(xí)進(jìn)行優(yōu)化。它能夠獨(dú)立識(shí)別并修復(fù)代碼缺陷,并在整個(gè)測(cè)試套件通過(guò)時(shí)獲得獎(jiǎng)勵(lì),從而確保所提供的解決方案不僅正確,而且魯棒。
該項(xiàng)目已在 Hugging Face 和 GitHub 上開(kāi)源,開(kāi)發(fā)者可以自由下載和部署。Kimi-Dev-72B 提供了一個(gè)簡(jiǎn)化的兩階段框架,專(zhuān)門(mén)用于代碼修復(fù)和測(cè)試編寫(xiě)任務(wù),包括精準(zhǔn)的文件定位和高效的代碼編輯功能。這使得它成為開(kāi)發(fā)者進(jìn)行問(wèn)題排查和代碼維護(hù)的強(qiáng)大工具。


產(chǎn)品與服務(wù)
聯(lián)系站長(zhǎng)
關(guān)于我們