Moonshot AI 最近開源了 Kimi-VL 和 Kimi-VL-Thinking 兩款視覺語言模型,展現出卓越的多模態理解與推理能力。
這些模型采用輕量級的 MoE 架構,參數僅有30億,卻在多個基準測試中超越了 GPT-4o。Kimi-VL 系列在數學推理、智能體操作和高分辨率圖像處理等方面表現突出,支持超長上下文理解,展現出廣泛的應用潛力。
Kimi-VL 和 Kimi-VL-Thinking 采用輕量級 MoE 架構,參數僅30億,運行效率高。
在 MathVision 和 ScreenSpot-Pro 測試中,Kimi-VL 分別取得36.8% 和34.5% 的優異成績,展示強大的推理能力。
支持高達128K tokens 的上下文輸入,適用于長文檔和視頻分析,展現出廣泛的應用潛力。


產品與服務
聯系站長
關于我們