Meta AI 實(shí)驗(yàn)室今日在 Hugging Face 平臺(tái)上推出了一款創(chuàng)新型大模型,專為驗(yàn)證和優(yōu)化鏈?zhǔn)剿季S(Chain-of-Thought, CoT)推理而設(shè)計(jì)。該模型名為“CoT-Verifier”(暫定),基于 Llama3.18B Instruct 架構(gòu)構(gòu)建而成,采用 TopK 轉(zhuǎn)碼器(Transducer)機(jī)制,提供了一種前所未有的白盒方法,幫助開發(fā)者深入剖析并修正 AI 推理過程中的錯(cuò)誤環(huán)節(jié)。
在當(dāng)前的人工智能研究中,思維鏈(CoT)驗(yàn)證方法主要依賴于模型輸出的黑盒方式,或是通過激活信號(hào)的灰盒分析來預(yù)測(cè)推理的正確性。這些方法雖然具有一定的實(shí)用性,但對(duì)于推理失敗的根本原因卻缺乏深入的了解。針對(duì)這一問題,研究團(tuán)隊(duì)引入了 CRV 方法,認(rèn)為不同推理步驟的歸因圖 — 也即模型潛在推理電路的執(zhí)行軌跡 — 在結(jié)構(gòu)特征上存在顯著差異。
研究表明,正確推理步驟的歸因圖與錯(cuò)誤步驟的歸因圖在結(jié)構(gòu)上具有明顯的區(qū)別。這種結(jié)構(gòu)特征的差異性為推理錯(cuò)誤的預(yù)測(cè)提供了新的科學(xué)依據(jù)。通過訓(xùn)練分類器對(duì)這些結(jié)構(gòu)特征進(jìn)行分析,研究人員證明了錯(cuò)誤的結(jié)構(gòu)特征具有高度的預(yù)測(cè)性,進(jìn)一步驗(yàn)證了通過計(jì)算圖直接評(píng)估推理正確性的可行性。
此外,研究發(fā)現(xiàn)這些結(jié)構(gòu)特征在不同推理任務(wù)中表現(xiàn)出高度的領(lǐng)域特異性。這意味著,不同類型的推理失敗反映出不同的計(jì)算模式,為今后的研究提供了新的方向。值得一提的是,研究團(tuán)隊(duì)還通過對(duì)歸因圖的深入分析,成功實(shí)施了針對(duì)模型特征的定向干預(yù),從而糾正了部分推理錯(cuò)誤。
該研究為大型語(yǔ)言模型的推理過程提供了更深入的因果理解,標(biāo)志著從簡(jiǎn)單的錯(cuò)誤檢測(cè)向更加全面的模型理解邁出了重要一步。研究人員希望,通過仔細(xì)審視模型的計(jì)算過程,未來能夠更有效地提升 LLM 的推理能力,并為更復(fù)雜的人工智能系統(tǒng)奠定理論基礎(chǔ)。


產(chǎn)品與服務(wù)
聯(lián)系站長(zhǎng)
關(guān)于我們