Mistral AI 公司昨日(11 月 18 日)發布公告,宣布了全新的多模態 AI 模型 Pixtral Large。該模型擁有 1240 億參數,基于 Mistral Large 2,主要用于處理文本和圖片。
Pixtral Large 現已在 Mistral 研究許可證和商業許可證下提供,適用于研究、教育以及商業用途。
Pixtral Large 是 Mistral AI 多模態家族中的第二個模型。援引官方新聞稿,該模型在 MathVista、DocVQA 和 VQAv2 等標準多模態基準測試中表現出色,尤其在 MathVista 中達到了 69.4% 的準確率,超越了所有競爭對手。
在 ChartQA 和 DocVQA 測試中,Pixtral Large 同樣表現優異,超越了 GPT-4o 和 Gemini-1.5 Pro。
該模型配備了 123B 的多模態解碼器和 1B 的視覺編碼器,支持 128K 的上下文窗口,能夠處理至少 30 張高分辨率圖像。Pixtral Large 不僅在視覺數據上表現出色,同時在復雜推理和圖表理解方面也具備強大能力。


產品與服務
聯系站長
關于我們