字節(jié)跳動Seed團隊近日公布了2025高考全科測試的驚人結(jié)果:豆包Seed1.6-Thinking模型在高考中取得文科683分、理科648分的優(yōu)異成績,達到清華北大錄取分數(shù)線,在國內(nèi)外AI模型高考測試中表現(xiàn)搶眼。
此次測試采用全國新一卷和山東省自主命題試卷,豆包與谷歌Gemini2.5Pro、DeepSeek R1、OpenAI o3等5款國內(nèi)外頂級AI模型同臺競技。豆包文科成績683分在參測模型中獲得最高分,理科成績648分僅次于谷歌Gemini2.5Pro的655分。在單科表現(xiàn)上,豆包在語文、英語、物理、歷史、地理、政治六門學科均獲最高分,數(shù)學成績也超過140分,展現(xiàn)出色的邏輯推理能力。
在這場AI"高考大戰(zhàn)"中,各模型展現(xiàn)了不同的學科優(yōu)勢。DeepSeek R1獲得數(shù)學單科最高分145分,Gemini2.5Pro以82分獲得化學最高分,OpenAI o3則與Gemini2.5Pro并列生物最高分77分。這種差異化表現(xiàn)反映了不同AI模型在知識結(jié)構(gòu)和推理方式上的特色。
Seed團隊發(fā)現(xiàn)了一個重要技術(shù)細節(jié):首次測試中由于網(wǎng)絡版考卷清晰度較低,各大模型在化學、生物等依賴圖像的科目中普遍丟分嚴重。在獲得高清版試題圖片后,團隊采用圖文交織方式重新測試,結(jié)果顯示豆包在化學、生物兩科提升近30分,理科總成績可達676分。這一發(fā)現(xiàn)驗證了全模態(tài)推理對激發(fā)模型潛力的重要作用,為AI在視覺理解和跨模態(tài)推理方面的發(fā)展提供了重要啟示。
山東省采用"3+3"高考模式,語數(shù)英為基礎(chǔ)學科,另選三門科目采用等級賦分制。據(jù)當?shù)刭Y深高中教師分析,豆包賦分成績組合最高可達690分左右,參照2025年山東地區(qū)一分一段表,排名約在前80位,成績足以沖擊清華、北大等頂尖學府。這一表現(xiàn)不僅展示了豆包的絕對實力,更體現(xiàn)了其在復雜評分體系下的適應能力。
豆包在高考中的出色表現(xiàn)不僅展示了其強大的知識儲備和推理能力,更重要的是驗證了多模態(tài)AI在復雜認知任務中的巨大潛力。特別是在圖文結(jié)合的理科題目處理上,豆包展現(xiàn)出的近30分提升幅度,為AI教育應用提供了新的技術(shù)路徑。這一成績的取得,標志著國產(chǎn)AI大模型在綜合認知能力上已達到國際先進水平,為AI在教育領(lǐng)域的深度應用奠定了堅實基礎(chǔ)。


產(chǎn)品與服務
聯(lián)系站長
關(guān)于我們