近日,IBM 研究人員推出了一款名為 CUGA 的開源 AI 助手,旨在自動化復(fù)雜的企業(yè)工作流程,并能完成超過一半的任務(wù)。CUGA 代表 “可配置通用代理”,該軟件通過多代理編排、API 集成和代碼生成等功能,力求幫助知識工作者更高效地處理日常或復(fù)雜的工作。
根據(jù) IBM 研究團(tuán)隊的描述,CUGA 的設(shè)計目標(biāo)是讓知識工作者能夠安全、可靠地配置和調(diào)整該代理,以滿足他們的工作需求。雖然市場上對于 AI 代理的安全性和可靠性存有疑慮,但 IBM 依然看好自動化的前景,并致力于提升工作效率。
CUGA 在 WebArena 和 AppWorld 基準(zhǔn)測試中取得了61.7% 的網(wǎng)頁任務(wù)完成率和48.2% 的 API 任務(wù)完成率。這些得分雖然不算高,但在當(dāng)前 AI 代理技術(shù)中已算是頂尖表現(xiàn)。IBM 并未使用自己的企業(yè)專用測試標(biāo)準(zhǔn) WebAgentBench 來評估 CUGA,這引發(fā)了一些關(guān)注。
通過對比其他 AI 代理的表現(xiàn),CUGA 的得分顯示出 AI 技術(shù)的進(jìn)步。例如,其他代理在類似測試中平均完成率僅為24.4%。IBM 的研究團(tuán)隊指出,企業(yè)工作流程通常涉及多項政策的同時適用,因此 CUGA 需要具備更強(qiáng)的政策合規(guī)能力。
CUGA 的結(jié)構(gòu)設(shè)計上,首先通過對用戶意圖的分析來理解輸入的任務(wù),然后將任務(wù)分解為多個子任務(wù),并進(jìn)行動態(tài)的重新規(guī)劃。這樣,CUGA 能將特定子任務(wù)分配給專業(yè)代理處理,從而確保結(jié)果盡可能符合企業(yè)的政策。
該系統(tǒng)還與 Langflow 低代碼平臺兼容,并支持多種開源模型的集成。盡管 CUGA 在實際應(yīng)用中可能還存在一些小問題,比如偶爾無法正常退出運行循環(huán),但 IBM 強(qiáng)調(diào),用戶在使用 AI 代理軟件時應(yīng)保持合理的期望。


產(chǎn)品與服務(wù)
聯(lián)系站長
關(guān)于我們