近日,中國研究團隊成功創建了“Infinity-MM”數據集,同時訓練出了性能卓越的小型新模型“Aquila-VL-2B”。
這一舉措標志著開放源代碼模型在AI研究中逐漸趕超傳統閉源系統的趨勢,尤其在合成訓練數據的利用方面展現出良好前景。
數據集“Infinity-MM”包含1000萬條圖像描述和2440萬條視覺指令數據。
新模型Aquila-VL-2B在多個基準測試中表現優異,打破了同類模型的記錄。
合成數據的使用顯著提升了模型性能,研究團隊決定向社區開放數據集和模型。
近日,中國研究團隊成功創建了“Infinity-MM”數據集,同時訓練出了性能卓越的小型新模型“Aquila-VL-2B”。
這一舉措標志著開放源代碼模型在AI研究中逐漸趕超傳統閉源系統的趨勢,尤其在合成訓練數據的利用方面展現出良好前景。
數據集“Infinity-MM”包含1000萬條圖像描述和2440萬條視覺指令數據。
新模型Aquila-VL-2B在多個基準測試中表現優異,打破了同類模型的記錄。
合成數據的使用顯著提升了模型性能,研究團隊決定向社區開放數據集和模型。
海報生成中...