在人工智能領(lǐng)域,圍棋和國際象棋等戰(zhàn)略游戲一直是測(cè)試模型推理能力的重要舞臺(tái)。最近,Google DeepMind 與 Kaggle 聯(lián)合宣布,將于8月5日至7日舉辦一場 AI 國際象棋錦標(biāo)賽。這場比賽不僅匯聚了全球性能最強(qiáng)的人工智能模型,還將通過 Kaggle 全新推出的 Game Arena 平臺(tái)進(jìn)行直播,吸引了廣泛的關(guān)注。
此次比賽將有八位頂尖的人工智能模型參與,包括 OpenAI 的 o3和 o4-mini、Google 的 Gemini2.5Pro 和 Gemini2.5Flash、Anthropic 的 Claude Opus4以及 xAICorp 的 Grok4。比賽采用單敗淘汰賽制,選手們將通過四局兩勝的方式?jīng)Q出勝負(fù)。第一天將進(jìn)行四場四分之一決賽,第二天進(jìn)行兩場半決賽,最后一天則是激動(dòng)人心的決賽。
所有比賽將在 Kaggle.com 上進(jìn)行直播,由著名棋手 Hikaru Nakamura 為每場比賽進(jìn)行實(shí)時(shí)評(píng)論,此外,Levy Rozman 將在其 GothamChess YouTube 頻道上發(fā)布每日的賽事回顧和分析。比賽結(jié)束后,國際象棋冠軍 Magnus Carlsen 也會(huì)在 Take Take Take YouTube 頻道上進(jìn)行賽事總結(jié)。
值得一提的是,這些參賽的 AI 模型將僅通過文本輸入進(jìn)行操作,無法使用任何第三方工具,也不能依賴于 Stockfish 國際象棋引擎來獲取最佳走法。模型們必須依靠自己的推理能力進(jìn)行決策,每一步的時(shí)間限制為60分鐘。此外,Kaggle 還計(jì)劃創(chuàng)建一個(gè)綜合排行榜,基于模型在數(shù)百場非直播的對(duì)抗賽中的表現(xiàn)進(jìn)行排名。
通過這場比賽,Google 希望借助國際象棋等復(fù)雜游戲測(cè)試 AI 模型的推理和適應(yīng)能力。游戲不僅能模擬現(xiàn)實(shí)世界的挑戰(zhàn),還能考驗(yàn)?zāi)P偷膽?zhàn)略規(guī)劃、記憶和心理推理能力。
Kaggle 的 Game Arena 平臺(tái)也將動(dòng)態(tài)更新排行榜,并計(jì)劃未來擴(kuò)展到更多復(fù)雜的多人游戲及現(xiàn)實(shí)世界模擬,為評(píng)估 AI 模型技能提供更全面的基準(zhǔn)。


產(chǎn)品與服務(wù)
聯(lián)系站長
關(guān)于我們