近日,谷歌與 Kaggle 聯(lián)合舉辦的首屆 AI 國際象棋對戰(zhàn)賽事備受矚目。在這一場 “智力的較量” 中,馬斯克旗下的 Grok4展現(xiàn)了非凡的實力,成為首日比賽的絕對焦點。
這場比賽聚集了多款頂尖 AI 模型,參賽選手包括 OpenAI 的 o3和 o4-mini、DeepSeek R1、Kimi K2Instruct、Gemini2.5Pro、Gemini2.5Flash、Claude Opus4和 Grok4。比賽于8月5日至7日每天下午10:30(太平洋時間)準(zhǔn)時直播,國際象棋特級大師中村光(Hikaru Nakamura)也受邀擔(dān)任解說。
首日對決中,Grok4以超凡的戰(zhàn)術(shù)表現(xiàn)和快速反應(yīng)獲得了最高評價,而 DeepSeek R1雖表現(xiàn)強勁,但不敵 o4-mini,Kimi K2則被認為慘遭不公,網(wǎng)友們紛紛為其鳴冤。馬斯克對此次比賽的成功表現(xiàn)淡定回應(yīng):“我們并沒有特別訓(xùn)練,這只是一個副產(chǎn)品。” 可見,他對此次比賽的宣傳價值可謂深諳其道。
雖然比賽結(jié)果引起了熱議,但其真正的意義在于測試 AI 的 “涌現(xiàn)能力”。國際象棋以其明確的規(guī)則和高復(fù)雜度(存在約10^120種可能局面)成為了評估 AI 決策能力的理想舞臺。很多網(wǎng)友表示,這場比賽不僅僅是輸贏的較量,更是 AI 綜合能力的全面展示。
經(jīng)過首輪較量,Grok4與 Gemini2.5Pro、OpenAI 的 o4-mini 和 o3晉級半決賽。各對決中,Grok4如猛獸般的表現(xiàn)讓人驚嘆,而 Kimi K2的頻繁違規(guī)行為則讓其面臨被淘汰的境地,觀眾對此頗有微詞。盡管如此,比賽仍在繼續(xù),大家期待后續(xù)的精彩對決。
為何選擇國際象棋作為 AI 對戰(zhàn)的舞臺?這主要是因為國際象棋規(guī)則清晰但戰(zhàn)略復(fù)雜,能夠有效評估 AI 的決策能力。正如網(wǎng)友所說,這場比賽的結(jié)果不僅是對各模型能力的檢測,更是對 AI 技術(shù)的一次深度探索。


產(chǎn)品與服務(wù)
聯(lián)系站長
關(guān)于我們