近日,小米發布了大規模預訓練語言模型MiLM-6B ,參數規模為64億。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。
據悉,在 C-Eval 評估中,MiLM-6B 的平均分為60.2,在 STEM、Social Sciences、Humanities 和 Others 等不同學科和難度級別上也表現出色。
在 CMMLU 評估中,MiLM-6B 在 zero-shot 和 five-shot 測試中的平均分分別為60.37和57.17,表現出良好的知識和推理能力。
目前,該模型相關信息還在不斷更新中。


產品與服務
聯系站長
關于我們