本文來自于微信公眾號 ?頭號AI玩家公眾號,作者:石瀨。
AI的“記憶力”越來越好了!
過去,如果你把一份長文本粘貼到ChatGPT對話框,或者忍不住和它多聊了兩句,它會告訴你“文本過長,請開個對話框重新聊。”
如今只需把文件傳給AI,就能在幾分鐘之內完成多個長文本的總結、檢索和提取。
或者直接丟一個網址鏈接,讓AI模仿你最喜歡的原神角色,輕松實現超長多輪對話聊天。
以上兩款長文本AI工具,一個是出自國外Anthropic公司的Claude;另一個則是國內MoonshotAI公司的KimiChat。
雖然遠隔重洋,但兩家初創公司不約而同地把賭注押在了大模型的長文本能力上,近期又都動作不斷,Anthropic先后從亞馬遜、谷歌等巨頭手中拿到了巨額融資,旗下被譽為“ChatGPT最強競品”的Claude2上線全球95個國家和地區;
而之前一直很低調的MoonshotAI,10月初上線了首個智能助手產品KimiChat,稱把大模型上下文輸入長度提升到了20萬漢字。
目前,Claude2可以通過官方測試網站或Poe免費體驗(每天有一定額度),KimiChat也開放了內測通道,申請拿到權限后即可使用。
體驗網站和申請鏈接已整理放到文末,歡迎自取。
長文本能力加持下的AI工具,實際應用優勢在哪里?都是主打“長文本”,Claude2和KimiChat誰更好用?“頭號AI玩家”拿到KimiChat的內測資格,第一時間對兩家產品測評了一番。看不完的報告論文, AI為你“量子速讀”
大家最為熟悉的免費版ChatGPT,即ChatGPT3.5處理長文本一般需要寫“咒語”引導并分段上傳。
即便付費使用的GPT4,處理上下文token最多也才32K,而Claude2直接擴展到了100K(約7.5萬個單詞),翻了三倍不止。
多的三倍文本量能用來做什么?
不止內容創作者,像律師、分析師、咨詢師、市場營銷員等職業在日常工作中也都離不開大量報告、文件、論文的整理。
比如,39頁的全英文資料總結,放在以前只能寫prompt一段一段投喂AI,還要面臨ChatGPT隨時“失憶”的風險。現在直接上傳文件到Claude2,或是KimiChat,簡單輸入需求就能讓AI替你工作。
MoonshotAI稱,KimiChat實際使用效果能夠支持約20萬漢字的上下文,2.5倍于Anthropic公司的Claude-100k(實測約8萬字)。
考慮到實際工作中報告動不動就上百頁,我們繼續提提難度,讓Claude和KimiChat一起分析下貴州茅臺2022年127頁的財務報告。
從營業總收入到財報最重要的三張表,Claude不到1分鐘都整理總結了出來。不過與報告對比,數據上有一些明顯的錯誤。
KimiChat則在一開始上傳文件時有些波折,會提示“內容超過對話長度”或“無法解析文件”,最后通過多次嘗試才成功上傳了文件。
但相比Claude,KimiChat的財務分析報告更完整,沒有額外“調教”下的排版表現也更好。
跨文本分析、整理發票、數據分析…
多文檔打開AI工具新玩法
不止單文件分析,兩款長本文AI工具的超能力還體現在多文檔處理。
Claude2目前支持同時上傳5個文件,每個文件不超過10MB,格式包括pdf、txt、csv等;而KimiChat可最多上傳50個文件,每個文件100MB,支持pdf、doc、xlsx、ppt、txt等格式。
于是,我上傳了兩份共計136頁的中文文檔,要求Claude2和KimiChat分析每個文檔的核心主題和觀點,以及它們之間的聯系。
整個體驗非常絲滑,Claude2和KimiChat很快總結好了兩份文檔的核心主題,對比原報告內容都沒有太大出入。
另外,跨文本分析能力也足夠讓人驚喜,它們都從異同點著手,把文檔之間的聯系捋得明明白白。
KimiChat的官方演示里還有一個有趣的多文本玩法:把出差發票拖進KimiChat,快速整理需要的信息。
對此,僅支持上傳5個文件的Claude2只能望塵莫及了。
除了上傳數量限制外,Claude2支持的格式豐富度也不及KimiChat。例如,在KimiChat中,你還可以把Excel表格拖進對話框,讓它提取相關數據,做數據分析。
Claude2vs KimiChat, 誰的中文更厲害?
除了長文本的實際應用優勢,作為國內用戶,也許你還關心的一個問題是:KimiChat作為國產大模型在中文能力上能否吊打Claude2?
作為開胃前菜,先給國外來的AI一點小小的中文震撼。
請合理斷句,并解釋以下這句話中每個“粉碎”的詞性:“用粉碎機粉碎粉碎機粉碎機會被粉碎機粉碎嗎?”
Claude2表現得很禮貌,面對不太熟悉的語言,小心翼翼地詢問自己有沒有答對。相比之下,KimiChat更顯自信。
但Claude2和KimiChat對每個“粉碎”的詞性分析都不完整,且回答有錯誤。
語法分析上沒法分出勝負,不妨再看看雙方寫作能力如何。
先讓它們仿寫下《百年孤獨》的開頭。
原句為:“許多年之后,面對行刑隊,奧雷良諾·布恩地亞上校將會回想起,他父親帶他去見識冰塊的那個遙遠的下午。”
“李明”“馬力”“小藍”……不得不說,Claude2取名還挺有梗,深深懷疑是不是訓練模型時用了太多“李明”寫給外國友人的信。
KimiChat則出現了Bug,重復生成了五次原文,像極了AI被罰抄課文(狗頭)。
多次嘗試上傳文件無果后,我發了《三體》百度百科的鏈接給KimiChat,讓它模仿《三體》第二部的主要情節,寫一篇500字以內的短篇科幻小說。
為了方便對比,Claude2也收到了一樣的要求。需要補充的是,百度百科鏈接Claude2“拒收”了,換了英文版的維基百科鏈接才讓Claude2順利生成內容。
品讀下來,不論是背景設定,如外星人的“思維控制技術”,還是主要情節“心靈迷宮”計劃,KimiChat生成的短篇科幻故事都更吸引我一些。
幾輪實測下來,明顯感受到隨著長文本能力的提升,AI的“記憶力”有了顯著提高。處理更長的文本不僅讓AI更加靠譜,也提升了用戶體驗,解決了之前使用ChatGPT的“字數焦慮”。
總的來說,長文本能力的提升不僅讓AI工具在日常工作流中更好用,還能更好地輔助人類進行跨領域、跨學科主題發散思考。這也就不難理解為什么國內外兩家大模型初創公司都選擇先卷“長文本”。
另一方面,雖然兩家公司都主打“長文本”,但實測下來Claude2在用戶交互上體驗更流暢,KimiChat近期才開放內測,所以在上傳文件、生成內容時偶爾會出Bug。
但瑕不掩瑜的是,KimiChat作為國產大模型,對國內用戶來說足夠友好,使用方便,無需魔法。
此外,KimiChat在處理長文本、跨文本分析等硬實力上并不輸Claude2。而且KimiChat在支持上傳的文檔數量和格式方面提供了更多的可能性,讓用戶有更多探索的空間。


產品與服務
聯系站長
關于我們