国产v在线观看,欧美一区二区三区电影,91激情视频在线观看 -->

五倍吞吐量,性能全面包圍Transformer:新架構Mamba引爆AI圈

更多動態

2023年12月06日

鏈接已復制

  本文來自于微信公眾號 機器之心(ID:almosthuman2014),作者:機器之心。

  屹立不倒的Transformer迎來了一個強勁競爭者。

  在別的領域,如果你想形容一個東西非常重要,你可能將其形容為「撐起了某領域的半壁江山」。但在 AI 大模型領域,Transformer 架構不能這么形容,因為它幾乎撐起了「整個江山」。

  自2017年被提出以來,Transformer 已經成為 AI 大模型的主流架構,但隨著模型規模的擴展和需要處理的序列不斷變長,Transformer 的局限性也逐漸凸顯。一個很明顯的缺陷是:Transformer 模型中自注意力機制的計算量會隨著上下文長度的增加呈平方級增長,比如上下文增加32倍時,計算量可能會增長1000倍,計算效率非常低。

  為了克服這些缺陷,研究者們開發出了很多注意力機制的高效變體,但這往往以犧牲其有效性特為代價。到目前為止,這些變體都還沒有被證明能在不同領域發揮有效作用。

  最近,一項名為「Mamba」的研究似乎打破了這一局面。

  在這篇論文中,研究者提出了一種新的架構 ——「選擇性狀態空間模型( selective state space model)」。它在多個方面改進了先前的工作。

  作者表示,「Mamba」在語言建模方面可以媲美甚至擊敗 Transformer。而且,它可以隨上下文長度的增加實現線性擴展,其性能在實際數據中可提高到百萬 token 長度序列,并實現5倍的推理吞吐量提升。

  消息一出,人們紛紛點贊,有人表示已經迫不及待想要把它用在大模型上了。

  作為通用序列模型的骨干,Mamba 在語言、音頻和基因組學等多種模態中都達到了 SOTA 性能。在語言建模方面,無論是預訓練還是下游評估,他們的 Mamba-3B 模型都優于同等規模的 Transformer 模型,并能與兩倍于其規模的 Transformer 模型相媲美。

  這篇論文的作者只有兩位,一位是卡內基梅隆大學機器學習系助理教授 Albert Gu,另一位是 Together.AI 首席科學家、普林斯頓大學計算機科學助理教授(即將上任)Tri Dao。

  Albert Gu 表示,這項研究的一個重要創新是引入了一個名為「選擇性 SSM」的架構,該架構是 Albert Gu 此前主導研發的 S4架構(Structured State Spaces for Sequence Modeling ,用于序列建模的結構化狀態空間)的一個簡單泛化,可以有選擇地決定關注還是忽略傳入的輸入。一個「小小的改變」—— 讓某些參數成為輸入的函數,結果卻非常有效。

  值得一提的是,S4是一個非常成功的架構。此前,它成功地對 Long Range Arena (LRA) 中的長程依賴進行了建模,并成為首個在 Path-X 上獲得高于平均性能的模型。更具體地說,S4是一類用于深度學習的序列模型,與 RNN、CNN 和經典的狀態空間模型(State Space Model,SSM)廣泛相關。SSM 是獨立的序列轉換,可被整合到端到端神經網絡架構中( SSM 架構有時也稱 SSNN,它與 SSM 層的關系就像 CNN 與線性卷積層的關系一樣)。Mamba 論文也討論了一些著名的 SSM 架構,比如 Linear attention、H3、Hyena、RetNet、RWKV,其中許多也將作為論文研究的基線。Mamba 的成功讓 Albert Gu 對 SSM 的未來充滿了信心。

  Tri Dao 則是FlashAttention、Flash Attention v2、Flash-Decoding的作者。FlashAttention 是一種對注意力計算進行重新排序并利用經典技術(平鋪、重新計算)加快速度并將內存使用從序列長度的二次減少到線性的算法。Flash Attention v2、Flash-Decoding 都是建立在 Flash Attention 基礎上的后續工作,把大模型的長文本推理效率不斷推向極限。在 Mamba 之前,Tri Dao 和 Albert Gu 也有過合作。

  另外,這項研究的模型代碼和預訓練的檢查點是開源的。

  方法創新

  論文第3.1節介紹了如何利用合成任務的直覺來啟發選擇機制,第3.2節解釋了如何將這一機制納入狀態空間模型。由此產生的時變 SSM 不能使用卷積,導致了高效計算的技術難題。研究者采用了一種硬件感知算法,利用當前硬件的內存層次結構來克服這一難題(第3.3節)。第3.4節描述了一個簡單的 SSM 架構,不需要注意力,甚至不需要 MLP 塊。第3.5節討論了選擇機制的一些其他特性。

  選擇機制

  研究者發現了此前模型的一個關鍵局限:以依賴輸入的方式高效選擇數據的能力(即關注或忽略特定輸入)。

  序列建模的一個基本方法是將上下文壓縮到更小的狀態,我們可以從這個角度來看待當下流行的序列模型。例如,注意力既高效又低效,因為它根本沒有明確壓縮上下文。這一點可以從自回歸推理需要明確存儲整個上下文(即 KV 緩存)這一事實中看出,這直接導致了 Transformer 緩慢的線性時間推理和二次時間訓練。

  遞歸模型的效率很高,因為它們的狀態是有限的,這意味著恒定時間推理和線性時間訓練。然而,它們的高效性受限于這種狀態對上下文的壓縮程度。

  為了理解這一原理,下圖展示了兩個合成任務的運行示例:

  研究者設計了一種簡單的選擇機制,根據輸入對 SSM 參數進行參數化。這樣,模型就能過濾掉無關信息,并無限期地記住相關信息。

  將選擇機制納入模型的一種方法是讓影響序列交互的參數(如 RNN 的遞歸動力學或 CNN 的卷積核)與輸入相關。算法1和2展示了本文使用的主要選擇機制。其主要區別在于,該方法只需將幾個參數 ?,B,C 設置為輸入函數,并在整個過程中改變張量形狀。這些參數現在都有一個長度維度 L ,意味著模型已經從時間不變變為時間可變。

  硬件感知算法

  上述變化對模型的計算提出了技術挑戰。所有先前的 SSM 模型都必須是時間和輸入不變的,這樣才能提高計算效率。為此,研究者采用了一種硬件感知算法,通過掃描而不是卷積來計算模型,但不會將擴展狀態具體化,以避免在 GPU 存儲器層次結構的不同級別之間進行 IO 訪問。由此產生的實現方法在理論上(與所有基于卷積的 SSM 的偽線性相比,在序列長度上呈線性縮放)和現有硬件上都比以前的方法更快(在 A100GPU 上可快達3倍)。

  架構

  研究者將先前的 SSM 架構設計與 Transformer 的 MLP 塊合并為一個塊,從而簡化了深度序列模型架構,形成了一種包含選擇性狀態空間的簡單、同質的架構設計(Mamba)。

  與結構化 SSM 一樣,選擇性 SSM 也是一種獨立的序列變換,可以靈活地融入神經網絡。H3架構是著名的同質化架構設計的基礎,通常由線性注意力啟發的塊和 MLP(多層感知器)塊交錯組成。

  研究者簡化了這一架構,將這兩個部分合二為一,均勻堆疊,如圖3。他們受到門控注意力單元(GAU)的啟發,該單元也對注意力做了類似的處理。

  選擇性 SSM 以及 Mamba 架構的擴展是完全遞歸模型,幾個關鍵特性使其適合作為在序列上運行的通用基礎模型的骨干:

  高質量:選擇性為語言和基因組學等密集模型帶來了強大的性能。

  快速訓練和推理:在訓練過程中,計算量和內存與序列長度成線性關系,而在推理過程中,由于不需要緩存以前的元素,自回歸展開模型每一步只需要恒定的時間。

  長上下文:質量和效率共同提高了實際數據的性能,序列長度可達100萬。

  實驗評估

  實證驗證了 Mamba 作為通用序列基礎模型骨干的潛力,無論是在預訓練質量還是特定領域的任務性能方面,Mamba 都能在多種類型的模態和環境中發揮作用:

  合成任務。在復制和感應頭等重要的語言模型合成任務上,Mamba 不僅能輕松解決,而且能推斷出無限長的解決方案(>100萬 token)。

  音頻和基因組學。在音頻波形和 DNA 序列建模方面,Mamba 在預訓練質量和下游指標方面都優于 SaShiMi、Hyena、Transformer 等先前的 SOTA 模型(例如,在具有挑戰性的語音生成數據集上將 FID 降低了一半以上)。在這兩種情況下,它的性能隨著上下文長度的增加而提高,最高可達百萬長度的序列。

  語言建模。Mamba 是首個線性時間序列模型,在預訓練復雜度和下游評估方面都真正達到了 Transformer 質量的性能。通過多達1B 參數的縮放規律,研究者發現 Mamba 的性能超過了大量基線模型,包括 LLaMa 這種非常強大的現代 Transformer 訓練配方。

  與類似規模的 Transformer 相比,Mamba 具有5倍的生成吞吐量,而且 Mamba-3B 的質量與兩倍于其規模的 Transformer 相當(例如,與 Pythia-3B 相比,常識推理的平均值高出4分,甚至超過 Pythia-7B)。

海報生成中...

+1

來源:微信公眾號 機器之心 作者:機器之心

延展資訊

最新新聞

熱門新聞

网站黄在线观看| 69p69国产精品| 快播亚洲色图| 国产91免费在线观看| 色婷婷av一区二区三区在线观看| 一本色道久久hezyo无码| 国产欧美日韩精品在线| av在线亚洲男人的天堂| www.亚洲天堂.com| 欧美激情国产精品| 国产精品成人网站| 亚洲国产精品va在线| 亚洲国产精品狼友在线观看| 亚洲福利一区二区三区| 男人天堂新网址| 99久久国产综合精品女不卡| 韩日午夜在线资源一区二区| 性感美女视频一二三| 国产91久久婷婷一区二区| 日韩三级一区二区三区| 亚洲香蕉伊综合在人在线视看 | 色香蕉久久蜜桃| 日韩欧美国产免费| 日本一区二区三区在线观看| 日韩不卡av| 国产精品一区二区在线播放| 国产精品v欧美精品v日韩| 高h放荡受浪受bl| 国产精品黄页免费高清在线观看| 91av久久久| 97久久国产精品| 中文字幕第三页| 97国产精品免费视频| 波多野结衣网站| 欧美激情a在线| 亚洲第一网站在线观看| 九九热99久久久国产盗摄| 日韩 欧美 综合| 精品国内自产拍在线观看| 精品一区二区三区四| 中文国产成人精品| 日本少妇激情舌吻| 日韩在线视频线视频免费网站| 免费毛片在线播放免费| 中文字幕一区日韩电影| 日韩精品在线不卡| 色综合视频网站| www亚洲视频| 韩国日本不卡在线| 国产白浆在线观看| 91精品久久久久久久久久| 成人免费视频国产| www.成人av| 国产精品中文字幕欧美| 亚洲精品成人自拍| 日本一区二区成人在线| 国产淫片av片久久久久久| 天天色综合天天| 一区二区三区四区影院| 欧美一二三四在线| 成年人av电影| 久热在线中文字幕色999舞| 91麻豆精品在线| 国产精品盗摄久久久| 日韩国产欧美在线播放| 日本一区二区三区精品视频| 91免费小视频| 和岳每晚弄的高潮嗷嗷叫视频| 亚洲日本电影在线| av影片在线播放| 精品成人一区二区| 亚洲国产精一区二区三区性色| 欧美黄色成人网| 开心激情综合网| 久久精品中文字幕一区二区三区 | 自慰无码一区二区三区| 欧美性生交xxxxx久久久| 老司机免费视频| 亚洲人成网站在线播| 免费的毛片视频| 亚洲永久免费观看| 99精品久久久久久| 亚洲成人福利在线| 亚洲精品99久久久久中文字幕| 你懂的国产在线| 国产精品影片在线观看| 国产成人精品免费在线| 黄www在线观看| 欧美高清dvd| 三级黄色在线视频| 亚洲一区亚洲二区| 国产网红主播福利一区二区| 思思久久精品视频| 亚洲天堂男人的天堂| 国产又粗又猛又黄又爽| 久久爱av电影| 亚洲国产毛片aaaaa无费看 | 久一视频在线观看| 国产玖玖精品视频| 99久久夜色精品国产网站| 爆乳熟妇一区二区三区霸乳| 精品三级在线观看| 一区二区三区播放| 日韩电影天堂视频一区二区| 婷婷国产在线综合| 免费人成年激情视频在线观看| 国产精品久久久久99| va亚洲va日韩不卡在线观看| 久久久九九九热| 日韩在线欧美在线| 精品在线观看视频| 欧美精品第三页| 日韩av在线免费观看一区| 一卡二卡在线视频| 亚洲精品偷拍视频| 欧美电影一区二区三区| 最近日韩免费视频| 亚洲一卡二卡三卡| 欧美日韩高清一区| 亚洲精品国产欧美在线观看| 欧美精品中文字幕一区二区| 欧美日韩国产一区中文午夜| 久久久无码一区二区三区| 亚洲在线www| 亚洲高清三级视频| 国产成人综合欧美精品久久| 激情视频一区二区| 欧美日韩一区二区在线播放| 久久国产视频一区| 亚洲精美视频| 欧美成人女星排行榜| 日韩视频在线你懂得| 黄色免费高清视频| 欧美人与物videos| 欧美精品亚洲一区二区在线播放| 中文字幕不卡三区| 日本一级特级毛片视频| 久久久久久久免费| 国产亚洲精品一区二区| 九九久久久久99精品| 亚洲欧洲午夜一线一品| 一区二区三区四区蜜桃| 免费看一级一片| 麻豆网站免费观看| 久久久久国产一区二区三区| xxx一区二区| 欧美日本精品在线| 国产精品国产三级国产aⅴ9色 | 五月婷婷六月丁香| 韩国av免费观看| 精品无码国产一区二区三区51安| 日本 片 成人 在线| 中文在线不卡视频| 国产日韩欧美一区二区三区乱码| 国产精品6666| 色婷婷激情视频| 西游记1978| 日韩人妻精品无码一区二区三区| 致1999电视剧免费观看策驰影院| 91成人免费观看| 99电影网电视剧在线观看| 国产九九在线观看| 亚欧视频在线观看| 亚洲蜜桃精久久久久久久| 精品国产伦一区二区三区观看方式| 欧美在线免费观看| 亚洲va男人天堂| 亚洲综合精品一区二区| 国产成人福利网站| 欧美制服第一页| 国产精品91久久| 成人精品福利视频| 亚洲国产精品热久久| 国产精品网曝门| 久久亚洲综合| 免费看污视频的网站| 精品少妇theporn| 精品一区二区三区在线播放| aaa欧美色吧激情视频| 久久这里只精品最新地址| 一区二区三区加勒比av| 亚洲一区二三区| 亚洲国产精品999| 亚洲国产日韩欧美在线99| 欧美高清视频不卡网| 欧美亚洲国产怡红院影院| 欧美日韩亚洲国产综合| 精品亚洲精品福利线在观看| 欧美欧美午夜aⅴ在线观看| eeuss影院一区二区三区| 亚州精品国产精品乱码不99按摩| 日韩一级在线视频| 在线观看 中文字幕| 久久精品女人天堂| 国产美女一区二区| 久久一区二区视频| 欧美久久久久中文字幕| 欧美多人乱p欧美4p久久| 久久久久久精| 亚洲色图38p| 99久久久免费精品| 美女又爽又黄免费视频| 国产乱叫456在线| 青草国产精品久久久久久| 国产成人高清视频| 亚洲午夜久久久久中文字幕久| 国产精品资源网| 久久国产三级精品| 极品少妇xxxx精品少妇| 狠狠色丁香婷综合久久| 国产麻豆视频一区| 91久久国产最好的精华液| 97在线观看免费高清| 国产欧美精品在线| 亚洲国产欧美一区二区三区不卡| 国产精品丝袜一区二区| 亚洲高清三级视频| 午夜精品福利一区二区| 囯产精品久久久久久| 91麻豆精品91久久久久同性| 亚洲高清资源综合久久精品| 一二三区视频在线观看| 最近中文在线观看| 99精品国产热久久91蜜凸| 亚洲国产精久久久久久| 国产精品私拍pans大尺度在线 | 天堂网2014av| 国产成人精品1024| 亚洲欧洲精品一区二区精品久久久| 亚洲综合色视频| 久久高清视频免费| 日韩亚洲成人av在线| 麻豆av一区二区三区| www.4hu95.com四虎| 美女视频黄a大片欧美| 欧美日韩综合一区| 亚洲人成在线免费观看| 亚洲精品一卡二卡三卡四卡| 青青青视频在线播放| 精品亚洲免费视频| 亚洲精品国产精品自产a区红杏吧| 成人夜晚看av| 隔壁人妻偷人bd中字| frxxee中国xxx麻豆hd| 国产99精品在线观看| 亚洲美女性生活视频| 欧美黑人xxxxx| 国产香蕉一区二区三区| 佐佐木明希电影| 亚洲国产精品无码久久久| 国产一区二区三区免费在线观看| 福利视频第一区| 久久久影院一区二区三区| 午夜国产福利一区二区| 亚洲欧美国产高清va在线播放| 精品国偷自产国产一区| 在线观看日韩羞羞视频| 天天舔天天干天天操| 欧美大荫蒂xxx| 日本熟伦人妇xxxx| 色先锋资源久久综合5566| 日韩综合第一页| 欧美精品丝袜久久久中文字幕| 日本成人三级| 日韩无码精品一区二区三区| 国产自产v一区二区三区c| 久久久精品在线观看| 永久免费黄色片| 91视频在线看| 2019中文在线观看| 亚洲熟妇无码av在线播放| 国产免费高清视频| 欧美日本一区二区三区四区| 五月天婷婷亚洲| 欧美午夜女人视频在线| 伊人av成人| 日本高清视频免费看| 中文字幕最新精品| 国产精品探花在线播放| 午夜国产福利一区二区| 一本久久a久久精品亚洲| 免费无码国产v片在线观看| 激情成人综合网| 精品久久sese| 国内精品视频666| 精品国产免费久久久久久尖叫| 熟妇高潮一区二区三区| 国产亚洲精品美女| 成人免费观看视频在线观看| 捆绑调教一区二区三区| 久热爱精品视频线路一| 日韩精品卡通动漫网站| 久久婷婷激情| 欧美一区二区三区免费视频| 在线观看成人av| 国产精品一区二区三区乱码| 成人在线视频电影| 中文字幕一区在线播放| 精品国产依人香蕉在线精品| 久久久精品91| 欧美性xxxx极品hd欧美风情| 国产91精品一区二区绿帽| 国产成人自拍一区| 日韩av电影在线播放| 成人免费公开视频| 亚洲资源视频| 午夜久久久影院| 亚洲AV成人无码网站天堂久久| 色悠悠久久久久| 日韩二区三区四区| 国产午夜福利100集发布| 26uuu精品一区二区在线观看| 亚洲 国产 日韩 综合一区| 欧美 亚洲 另类 激情 另类| 日韩中文字幕国产精品| 日韩欧美国产成人精品免费| 亚洲男人av在线| 无码人妻精品一区二区三区不卡| 欧美大片一区二区| 妺妺窝人体色www在线小说| 日本一区二区三区四区在线视频| 亚洲va综合va国产va中文| 日韩欧美国产午夜精品| 国产三级av在线播放| 日韩一区国产二区欧美三区| www.色天使| 亚洲午夜国产成人av电影男同| 免费在线视频一区二区| 972aa.com艺术欧美| 欧美日韩一区二区三区电影| 亚洲天堂精品视频| 欧美成人乱码一二三四区免费| 日韩一区二区三区国产| 波波电影院一区二区三区| 天堂久久精品忘忧草| 成人中心免费视频| 亚洲欧美中日韩| 精品在线视频观看| 亚洲va男人天堂| 波多野结衣在线一区| 亚洲免费看av| 日本韩国欧美一区| 日日操免费视频| 亚洲国产精品va在线看黑人动漫| 国产精品偷伦视频免费观看了| 91精品国产日韩91久久久久久| 国产人妖在线观看| 亚洲综合偷拍欧美一区色| 凹凸日日摸日日碰夜夜爽1| 中文一区一区三区高中清不卡| 99精品全国免费观看| 国产做受69高潮| 人人妻人人玩人人澡人人爽| 亚洲xxx自由成熟| 亚洲欧洲国产日韩| a毛片毛片av永久免费| 国产精品伦一区| 又色又爽又黄18网站| 欧美激情视频一区二区| 另类欧美日韩国产在线| 亚洲麻豆一区二区三区| 国产精品裸体一区二区三区| 日韩欧美国产一区二区三区| 国产精品99久久久久久有的能看 | 国产一区二区在线免费视频| 日本亚洲视频在线| jizz欧美激情18| 91精品国产色综合久久不卡电影| 国产v在线观看| 99re资源| 一区二区三区久久| 日日骚一区二区三区| 亚洲91精品在线| 国产麻豆视频精品| 久久久久xxxx| 色吧影院999| 综合亚洲深深色噜噜狠狠网站| 亚洲免费激情视频| 国产嫩草一区二区三区在线观看| 久久久激情视频| 中文字幕av免费在线观看| 久久亚洲精品欧美| 精品视频在线看| 欧洲熟妇的性久久久久久| 日日噜噜噜夜夜爽亚洲精品| 狠狠久久亚洲欧美| 中国免费黄色片| 国产97免费视| 亚洲欧美在线观看| 成人免费视频毛片| 波多野结衣50连登视频| 色噜噜亚洲精品中文字幕| 日韩国产高清影视| av动漫在线播放| 欧美精品在线一区二区| 激情成人综合网| 成人日韩在线视频| 欧美激情伊人电影| 国产精品传媒入口麻豆| 精品人伦一区二区三电影| 国产精品久久久久久久天堂| 一区二区三区四区亚洲| 亚洲欧美日韩激情| 男人网站在线观看| 国产乱子伦精品视频| 色婷婷综合久久久久中文字幕1| 99久久精品久久久久久清纯| 免费看的黄色录像| 中文字幕不卡每日更新1区2区| 久久久久久91|