歐洲知名AI初創(chuàng)公司Multiverse Computing近日發(fā)布了兩款超小型AI模型,并以動物大腦尺寸命名——分別為"蒼蠅腦"SuperFly和"雞腦"ChickBrain。這家聲稱擁有全球最小高性能AI模型的公司,正試圖將人工智能帶入每一臺物聯(lián)網(wǎng)設(shè)備。
Multiverse Computing總部位于西班牙圣塞巴斯蒂安,擁有約100名員工,由歐洲頂級量子計算和物理學(xué)教授Román Orús、量子計算專家Samuel Mugel以及前Unnim銀行副CEO Enrique Lizaso Olmos共同創(chuàng)立。該公司剛剛在6月完成了1.89億歐元(約2.15億美元)的融資,自2019年成立以來累計融資約2.5億美元。
公司的核心技術(shù)是名為"CompactifAI"的模型壓縮技術(shù)。Orús表示,這是一種基于量子物理原理的壓縮算法,能夠在不犧牲性能的前提下大幅縮減AI模型的尺寸。"我們擁有的壓縮技術(shù)不同于傳統(tǒng)的計算機科學(xué)或機器學(xué)習(xí)壓縮方法,因為我們來自量子物理學(xué)領(lǐng)域,"他解釋道,"這是一種更加精巧和細(xì)致的壓縮算法。"

SuperFly模型是該公司"模型動物園"系列中最小的一款,基于Hugging Face開源模型SmolLM2-135壓縮而成。原始模型擁有1.35億個參數(shù),而SuperFly壓縮至9400萬參數(shù),Orús形象地將其比作蒼蠅大腦的尺寸。
SuperFly專門針對資源受限的設(shè)備設(shè)計,能夠在極小的處理能力下運行。該模型可以嵌入家用電器中,用戶可以通過語音命令操作設(shè)備,比如對洗衣機說"開始快洗",或者詢問故障排除問題。在現(xiàn)場演示中,該模型配合簡單的Arduino處理器就能夠處理語音交互界面。
更強大的ChickBrain模型擁有32億參數(shù),基于Meta的Llama3.18B模型壓縮而成,具備推理能力。盡管參數(shù)量更大,但該模型仍然足夠小巧,可以在MacBook上離線運行。
令人驚訝的是,ChickBrain在多個標(biāo)準(zhǔn)基準(zhǔn)測試中的表現(xiàn)實際上略優(yōu)于原始模型,包括語言技能基準(zhǔn)MMLU-Pro、數(shù)學(xué)技能基準(zhǔn)Math500和GSM8K,以及通用知識基準(zhǔn)GPQA Diamond。這證明了該公司壓縮技術(shù)的有效性——不僅縮小了模型尺寸,還能保持甚至提升性能。
Multiverse已經(jīng)開始與各大設(shè)備制造商進(jìn)行洽談。Orús透露:"我們正在與蘋果、三星、索尼和惠普等公司進(jìn)行對話。惠普還參與了上一輪投資。"該輪融資由知名歐洲風(fēng)投公司Bullhound Capital領(lǐng)投,惠普科技風(fēng)險投資和東芝等多家機構(gòu)參投。
除了直接向設(shè)備制造商銷售模型外,Multiverse還通過托管在AWS上的API為開發(fā)者提供壓縮模型服務(wù),通常token費用比競爭對手更低。該公司已經(jīng)為BASF、Ally、穆迪、博世等客戶提供了包括圖像識別在內(nèi)的各種機器學(xué)習(xí)壓縮技術(shù)服務(wù)。
這些超小型AI模型的推出標(biāo)志著人工智能應(yīng)用的一個重要趨勢——從云端大模型向邊緣設(shè)備小模型的轉(zhuǎn)變。通過將AI能力直接嵌入到物聯(lián)網(wǎng)設(shè)備中,用戶可以享受更快的響應(yīng)速度、更好的隱私保護(hù)以及無需網(wǎng)絡(luò)連接的離線智能體驗。
隨著物聯(lián)網(wǎng)設(shè)備的普及和邊緣計算需求的增長,像Multiverse這樣專注于模型壓縮技術(shù)的公司可能會迎來巨大的市場機遇。其基于量子物理原理的獨特壓縮算法不僅展現(xiàn)了技術(shù)創(chuàng)新的可能性,也為AI技術(shù)的普及化應(yīng)用開辟了新的道路。


產(chǎn)品與服務(wù)
聯(lián)系站長
關(guān)于我們