Google發布了Gemini1.5Pro模型的技術報告,報告介紹了Gemini1.5Pro的模型架構、訓練數據與基礎設施、長文本評測和通用能力評測。Gemini1.5Pro是一個高效能的多模態混合專家模型,可以處理和分析來自數百萬Token的信息,包括長篇文檔和數小時的視頻和音頻內容。
Gemini1.5Pro在長篇信息檢索任務中展現出幾乎完美的記憶回溯能力,刷新了長篇文檔問答、長視頻問答和自動語音識別領域的技術高度,超越了前代產品Gemini1.0Ultra。在預測下一個Token方面,Gemini1.5Pro取得了顯著進步,在處理超過1000萬Token的任務時,準確率達到了99%以上,是一次巨大的飛躍。
此外,Gemini1.5Pro還展現出驚人的能力,當接觸到Kalamang語法手冊時,即使Kalamang是一種全球使用人數不足200人的小眾語言,它也能夠學會將英語翻譯成Kalamang,其翻譯水平媲美于人類。
綜上所述,Gemini1.5Pro在處理跨多種媒體格式的長篇信息時表現出色,不僅在技術性能上超越了前代產品,還展現出了驚人的翻譯能力,為多模態混合專家模型的發展開辟了新的可能性。


產品與服務
聯系站長
關于我們