9月20日消息,近日阿里國際AI團隊宣布發布多模態大模型Ovis。據介紹,Ovis能夠在數學推理問答、物體識別、文本提取和復雜任務決策等方面展現出色表現。例如,Ovis可以準確回答數學問題,識別花的品種,支持多種語言的文本提取,甚至可以識別手寫字體和復雜的數學公式。Ovis 1.0、1.5的數據、模型、訓練和推理代碼都已全部開源,可復現。Ovis1.6系列中的Ovis1.6-Gemma2-9B也已開源權重。
網經社教育臺(EDU.100EC.CN)獲悉,多模態大模型能夠處理和理解多種不同類型的數據輸入,例如文本、圖像。與大型語言模型(LLMs)相比,大語言模型在處理和生成文本數據方面有專長,而多模態大模型能夠處理非文本數據,如圖像等等。


產品與服務
聯系站長
關于我們