Jina AI 公布了其第二代文本嵌入模型的最新進展:jina-embeddings-v2。這個最先進的模型是唯一支持8K(8192個token)上下文長度的開源解決方案。這一成就使其在功能和在大規模文本嵌入基準 (MTEB) 排行榜上的性能方面與 OpenAI 的專有模型 text-embedding-ada-002相當。
Jina-embeddings-v2是開源文本嵌入模型的一大步,在容量和基準性能方面可與已建立的專有對應物相媲美。它的性能優于 OpenAI 的8K 模型 jina-embeddings-v2。值得注意的是,與 OpenAI 相比,Jina-embedding-v2在分類平均值、重新排名平均值、檢索平均值和摘要平均值等關鍵指標上表現出更出色的性能。
研究人員表示,Jina-embeddings-v2以其先進的功能徹底改變了各種應用程序。在法律文件分析中,它捕捉和分析大量法律文本中的每一個錯綜復雜的細節。對于醫學研究,它嵌入了科學論文,促進了整體分析并促進了突破性的發現。該模型深入研究文學分析中的長篇內容,捕捉主題元素以進行更豐富的理解。財務預測使用戶能夠從詳細的財務報告中獲得卓越的洞察力,從而增強決策過程。在對話式 AI 中,Jina Embeddings V2顯著改善了聊天機器人對復雜用戶查詢的響應。憑借其多功能和強大的功能,Jina Embeddings V2站在改變我們處理各個領域復雜數據集和從中獲取見解的方式的最前沿。
測試表明,這種支持上下文的 jina-embeddings-v2優于其他領先的基礎嵌入模型,強調了更長上下文功能的實際優勢。
研究人員表示,他們計劃發表一篇學術論文,詳細介紹Jina-embeddings-v2的技術復雜性和基準,為AI社區提供更深入地探索該模型能力的機會。該團隊正在開發一個類似于 OpenAI 的嵌入 API 平臺,該平臺已進入高級階段,可確保用戶根據他們的需求量身定制的嵌入模型的無縫可擴展性。此外,Jina AI正在通過涉足多語言嵌入來擴大其語言能力,并打算引入德語-英語模型。此次擴張旨在增強他們的產品組合,并鞏固他們作為人工智能創新領導者的地位。
該模型可以在 Hugging Face 上輕松免費下載。基礎模型專為需要高精度的苛刻任務而制定,適用于學術研究或商業分析等領域。相比之下,小型型號的體積僅為0.07G,專為輕量級任務而設計,非常適合計算資源有限的移動應用程序或設備上的應用程序。認識到人工智能社區的不同需求,Jina AI提出了這兩種不同的模型選項,允許用戶選擇最適合其計算需求并符合其應用偏好的模型。


產品與服務
聯系站長
關于我們