精彩视频一区二区,色婷婷一区二区三区四区,成人黄视频免费 -->

谷歌:大模型不僅有涌現能力,訓練時間長了還有「領悟」能力

更多動態

2023年08月15日

鏈接已復制

  本文來自于微信公眾號 機器之心(ID:almosthuman2014),作者:陳萍、小舟、梓文。

  模型在達到一定規模時會出現涌現現象,谷歌的研究表明,模型在訓練到一定時間后,會出現另一種現象,即「領悟」現象。

  2021年,研究人員在訓練一系列微型模型時取得了一個驚人的發現,即模型經過長時間的訓練后,會有一個變化,從開始只會「記憶訓練數據」,轉變為對沒見過的數據也表現出很強的泛化能力。

  這種現象被稱為「領悟(grokking)」,如下圖所示,模型在長時間擬合訓練數據后,「領悟」現象會突然出現。

  既然微型模型有這種特性,那么更復雜一點的模型在經過更長時間的訓練后,是否也會突然出現「領悟」現象?最近大型語言模型(LLM)發展迅猛,它們看起來對世界有著豐富的理解力,很多人認為 LLM 只是在重復所記憶的訓練內容,這一說法正確性如何,我們該如何判斷 LLM 是輸出記憶內容,還是對輸入數據進行了很好的泛化?

  為了更好的了解這一問題,本文來自谷歌的研究者撰寫了一篇博客,試圖弄清楚大模型突然出現「領悟」現象的真正原因。

  本文先從微型模型的訓練動態開始,他們設計了一個具有24個神經元的單層 MLP,訓練它們學會做模加法(modular addition)任務,我們只需知道這個任務的輸出是周期性的,其形式為 (a + b) mod n。

  MLP 模型權重如下圖所示,研究發現模型的權重最初非常嘈雜,但隨著時間的增加,開始表現出周期性。

  如果將單個神經元的權重可視化,這種周期性變化更加明顯:

  別小看周期性,權重的周期性表明該模型正在學習某種數學結構,這也是模型從記憶數據轉變為具有泛化能力的關鍵。很多人對這一轉變感到迷惑,為什么模型會從記憶數據模式轉變為泛化數據模式。

  用01序列進行實驗

  為了判斷模型是在泛化還是記憶,該研究訓練模型預測30個1和0隨機序列的前三位數字中是否有奇數個1。例如000110010110001010111001001011為0,而010110010110001010111001001011為1。這基本就是一個稍微棘手的 XOR 運算問題,帶有一些干擾噪聲。如果模型在泛化,那么應該只使用序列的前三位數字;而如果模型正在記憶訓練數據,那么它還會使用后續數字。

  該研究使用的模型是一個單層 MLP,在1200個序列的固定批上進行訓練。起初,只有訓練準確率有所提高,即模型會記住訓練數據。與模運算一樣,測試準確率本質上是隨機的,隨著模型學會通用解決方案而急劇上升。

  通過01序列問題這個簡單的示例,我們可以更容易地理解為什么會發生這種情況。原因就是模型在訓練期間會做兩件事:最小化損失 和權重衰減。在模型泛化之前,訓練損失實際上會略有增加,因為它交換了與輸出正確標簽相關的損失,以獲得較低的權重。

  測試損失的急劇下降使得模型看起來像是突然泛化,但如果查看模型在訓練過程中的權重,大多數模型都會在兩個解之間平滑地插值。當與后續分散注意力的數字相連的最后一個權重通過權重衰減被修剪時,快速泛化就會發生。

  「領悟」現象是什么時候發生的?

  值得注意的是,「領悟(grokking)」是一種偶然現象 —— 如果模型大小、權重衰減、數據大小和其他超參數不合適,「領悟」現象就會消失。如果權重衰減太少,模型就會對訓練數據過渡擬合。如果權重衰減過多,模型將無法學到任何東西。

  下面,該研究使用不同的超參數針對1和0任務訓練了1000多個模型。訓練過程充滿噪音,因此針對每組超參數訓練了九個模型。表明只有兩類模型出現「領悟」現象,藍色和黃色。

  具有五個神經元的模塊化加法

  模加法 a+b mod67是周期性的,如果總和超過67,則答案會產生環繞現象,可以用一個圓來表示。為了簡化問題,該研究構建了一個嵌入矩陣,使用 cos? 和 sin? 將 a 和 b 放置在圓上,表示為如下形式。

  結果表明,模型僅用5個神經元就可以完美準確地找到解決方案:

  觀察經過訓練的參數,研究團隊發現所有神經元都收斂到大致相等的范數。如果直接繪制它們的 cos? 和 sin? 分量,它們基本上均勻分布在一個圓上。

  接下來是

  ,它是從頭開始訓練的,沒有內置周期性,這個模型有很多不同的頻率。

  該研究使用離散傅立葉變換 (DFT) 分離出頻率。就像在1和0任務中一樣,只有幾個權重起到關鍵作用:

  下圖表明,在不同的頻率,模型也能實現「領悟」:

  開放問題

  現在,雖然我們對單層 MLP 解決模加法的機制及其在訓練過程中出現的原因有了扎實的了解,但在記憶和泛化方面仍有許多有趣的開放性問題。

  哪種模型的約束效果更好呢?

  從廣義上講,權重衰減的確可以引導各種模型避免記憶訓練數據。其他有助于避免過擬合的技術包括 dropout、縮小模型,甚至數值不穩定的優化算法。這些方法以復雜的非線性方式相互作用,因此很難先驗地預測哪種方法最終會誘導泛化。

  此外,不同的超參數也會使改進不那么突然。

  為什么記憶比泛化更容易?

  有一種理論認為:記憶訓練集的方法可能比泛化解法多得多。因此,從統計學上講,記憶應該更有可能首先發生,尤其是在沒有正則化或正則化很少的情況中。正則化技術(如權重衰減)會優先考慮某些解決方案,例如,優先考慮 「稀疏 」解決方案,而不是 「密集 」解決方案。

  研究表明,泛化與結構良好的表征有關。然而,這不是必要條件;在求解模加法時,一些沒有對稱輸入的 MLP 變體學習到的 「循環 」表征較少。研究團隊還發現,結構良好的表征并不是泛化的充分條件。這個小模型(訓練時沒有權重衰減)開始泛化,然后轉為使用周期性嵌入的記憶。

  在下圖中可以看到,如果沒有權重衰減,記憶模型可以學習更大的權重來減少損失。

  甚至可以找到模型開始泛化的超參數,然后切換到記憶,然后切換回泛化。

  較大的模型呢?

  理解模加法的解決方案并非易事。我們有希望理解更大的模型嗎?在這條路上可能需要:

  1) 訓練更簡單的模型,具有更多的歸納偏差和更少的運動部件。

  2) 使用它們來解釋更大模型如何工作的費解部分。

  3) 按需重復。

  研究團隊相信,這可能是一種更好地有效理解大型模型的的方法,此外,隨著時間的推移,這種機制化的可解釋性方法可能有助于識別模式,從而使神經網絡所學算法的揭示變得容易甚至自動化。

海報生成中...

+1

來源:機器之心公眾號

延展資訊

最新新聞

熱門新聞

国产在线观看无码免费视频| 日本黄大片一区二区三区| 亚洲婷婷在线视频| 天天综合日日夜夜精品| 国产欧美自拍视频| 欧美激情综合五月色丁香| 国产精品一区二区欧美| 日本在线观看不卡视频| 91av视频在线免费观看| 97久久人国产精品婷婷| 亚洲精品成人久久| 国产成人精品无码免费看夜聊软件| 欧美三级乱人伦电影| youjizz.com日本| 精品视频一区二区不卡| 亚洲国产成人精品综合99| 91国产美女视频| 成人午夜激情视频| 亚洲欧洲日本精品| 精品国产乱码久久久久久夜甘婷婷 | 2022中文字幕| 欧美夫妻性生活| 国产精品高潮呻吟av| 成人午夜高潮视频| 国产精品18久久久久久久久 | 亚洲成人精品久久| 老司机午夜福利视频| 成人免费播放器| 欧美大胆人体bbbb| 日本不卡在线视频| 伊人网综合视频| 国产精品永久免费观看| 亚洲私人黄色宅男| 国产又大又黄又粗| 日韩视频 中文字幕| 夜夜嗨av一区二区三区四区| 国产在线一区二区综合免费视频| 国产一线二线三线在线观看| 久久久久一本一区二区青青蜜月| 国产欧美日韩视频在线观看| 久久久久久久久久久网| 天天干天天色天天爽| 尤物yw午夜国产精品视频明星| 99久久伊人精品| 日韩人妻无码一区二区三区| 久99久在线| 国产一区二区三区中文| 国产日韩欧美精品一区| 日批视频免费在线观看| 亚洲一区二区三区四区五区xx| 久久97精品久久久久久久不卡| 亚洲日本在线观看| 超碰在线观看av| 91视频最新入口| 91精品啪aⅴ在线观看国产| 日韩西西人体444www| 成人一区二区视频| 91精品在线视频观看| 日本中文字幕二区| 国产综合第一页| 久久人人爽人人爽人人片亚洲| 亚洲超碰精品一区二区| 日一区二区三区| 久久久久久久极品内射| 久久久久久综合网| 日韩电影免费观看高清完整| 欧美成人免费全部观看天天性色| 97精品国产露脸对白| 国产成人三级在线播放| 国产九九热视频| 久久久久久国产精品美女| 在线观看区一区二| 精品一区二区av| 91久久国语露脸精品国产高跟| 做a视频在线观看| 免费观看国产视频在线| 久久久国产一区| 91麻豆精品国产91久久久使用方法| 粉嫩av一区二区三区粉嫩| 国产av一区二区三区| 久草免费在线视频观看| 特级特黄刘亦菲aaa级| 国产原创中文在线观看| 欧美国产二区| 91精品久久久久久久久久久久久| 亚洲午夜av久久乱码| 色偷偷88欧美精品久久久| 91在线视频免费91| 国产成人精品网址| 亚洲手机在线观看| 日本国产在线视频| 久久人人爽av| 中文字幕一区二区三区最新| 国产精品免费看久久久香蕉| 国产成人精品视频在线| 68精品久久久久久欧美| 久久久久久久国产精品| 欧美猛交免费看| 九色精品美女在线| 久久精品91久久香蕉加勒比| 亚洲欧洲日产国码av系列天堂| 欧美电视剧在线看免费| 日韩精品在线电影| 国产一区二区三区日韩欧美| 精品久久久久99| 亚洲天堂第二页| 亚洲人成电影网站色xx| 久久久国产精品视频| 中文字幕日韩av电影| 久久久久久久久电影| 国产欧美在线看| 女人一区二区三区| 国产成人精品免费看在线播放| 高清无码一区二区在线观看吞精| 亚洲女人毛片| av动漫在线观看| 午夜一区二区视频| 欧美色图一区二区| 国产成人精品视频免费| 欧美一级做a爰片免费视频| 国产一二三四在线| 无码国产伦一区二区三区视频| 国产一级精品毛片| 久久精品国产亚洲一区二区三区| av不卡在线播放| 中文字幕一区免费在线观看 | 欧美日韩国产在线播放网站| 精品国内产的精品视频在线观看| 青青久久av北条麻妃海外网| 亚洲电影一二三区| 日本精品一二三区| 波多野结衣午夜| 99久久精品免费| 欧美一区二区三区白人| 91国产精品电影| 美女黄色免费看| 免费观看av网站| 天天干天天操av| 亚洲综合999| 欧美熟女一区二区| 久久久久久久性| 欧美日韩精品高清| 亚洲性线免费观看视频成熟| 国产精品免费区二区三区观看| a级黄色一级片| 久久精品影视大全| 欧美偷拍第一页| 国产一区二区三区四区五区入口| 欧美性大战久久久久久久蜜臀| 91午夜理伦私人影院| 亚洲无码精品在线观看| 日本强好片久久久久久aaa| 国产精品国产a级| 久久视频精品在线| 蜜桃999成人看片在线观看| 久久久久久久久久久免费视频| 日韩av一区二区在线播放| 成人福利电影精品一区二区在线观看| 色婷婷亚洲婷婷| 国产主播精品在线| www.亚洲自拍| 精品国产无码一区二区| 精品日韩中文字幕| 国产在线观看不卡| 波多野结衣a v在线| 日本wwwxxxx| 日韩欧美国产高清91| www.久久久久久.com| 日本丰满少妇xxxx| 亚洲第一天堂在线观看| 国产午夜亚洲精品理论片色戒 | 亚洲第一视频在线观看| xvideos国产精品| 黄色特一级视频| 亚洲成a人片77777精品| 日韩一级高清毛片| 欧美在线激情| 中文字幕一区二区免费| 色哟哟日韩精品| 亚洲视频sss| 99精品免费观看| 日韩av在线一区| 日韩一级性生活片| 色婷婷av一区二区三| 日韩黄在线观看| 色噜噜狠狠永久免费| 麻豆成人久久精品二区三区小说| 精品视频在线看| 日韩视频在线视频| 国产欧美日韩另类| 欧美大片在线观看一区二区| 精品少妇在线视频| 久久精品二区亚洲w码| 国模精品一区二区三区色天香| 国产精品秘入口18禁麻豆免会员| 日韩国产精品91| 欧美激情综合色| 91视频免费在线看| 56国语精品自产拍在线观看| 手机看片福利永久国产日韩| 午夜免费福利视频| 国产视频自拍一区| 日本高清一区二区视频| 国产精品久久久久久妇女6080| 国产精品一区二区a| 香港三日本三级少妇66| 久久天天躁狠狠躁夜夜躁| 少妇丰满尤物大尺度写真| 久久久久国产精品免费免费搜索| 黑人巨大精品欧美一区二区小视频| 最近中文字幕免费观看| 中文字幕亚洲一区二区三区| аⅴ天堂中文在线网| 欧美日韩精品系列| 国产精品一区二区在线免费观看| 疯狂做受xxxx高潮欧美日本| 一区二区三区网址| 欧美午夜不卡在线观看免费| 中文在线一区二区三区| 亚洲国产精品人久久电影| 伊人久久一区二区三区| 911精品国产一区二区在线| www.色.com| 日韩av一卡二卡| 制服 丝袜 综合 日韩 欧美| 亚洲第一级黄色片| 老司机精品免费视频| 日韩欧美国产精品一区| 国产老头老太做爰视频| 欧美成人精品一区| 中文字幕日韩三级| 午夜精品久久久久久久99热浪潮 | 亚洲国产精品成人无久久精品 | 亚洲午夜国产成人av电影男同| 青青国产在线观看| 成人午夜电影久久影院| 国产欧美自拍视频| 欧美人xxxx| 亚洲天堂视频网站| 玛丽玛丽电影原版免费观看1977 | 亚洲欧洲在线视频| 日韩二区三区四区| 成年人在线观看视频免费| 日韩二区三区在线| 性xxxx18| 国产九色porny| 亚洲精品456在线播放狼人| 国产日韩欧美一区二区东京热| 日韩av电影免费观看| 成人看片黄a免费看在线| 欧美一级视频在线| 精品国内自产拍在线观看| 欧美三级视频在线| 色播视频在线播放| 欧美壮男野外gaytube| 91丨porny丨户外露出| 午夜欧美一区二区三区免费观看| 91免费国产在线观看| www.成年人| 亚洲成人网av| 国产精品系列视频| 亚洲中文字幕无码不卡电影| 日韩免费视频一区| www.亚洲激情| av磁力番号网| 国产一区二区动漫| 美女脱光内衣内裤视频久久影院| 国产成人精品视频ⅴa片软件竹菊| 亚洲精美色品网站| 日本不卡在线视频| 在线免费黄色小视频| 97超级碰在线看视频免费在线看| 2017欧美狠狠色| 天天干,天天干| xxxx一级片| 国产精品91在线观看| 欧美日韩高清一区| 美国十次了思思久久精品导航| 亚洲男人天堂2021| 91精品视频在线看| 91精品国产综合久久香蕉麻豆| 美国三级日本三级久久99| 人妻熟女aⅴ一区二区三区汇编| 成人精品福利视频| 欧美精品久久一区二区三区| www.中文字幕在线观看| 日本特黄a级片| 99视频日韩| 欧美裸身视频免费观看| 午夜精品久久久久久| 久久夜色精品| 精品一区免费观看| 爽爽爽在线观看| 最新中文字幕久久| 99久re热视频这里只有精品6| 亚洲热线99精品视频| 国产精品麻豆视频| 大吊一区二区三区| 那种视频在线观看| 国产免费一区二区三区| 久久视频在线免费观看| 91精品国产91久久综合桃花| 蜜桃视频一区二区三区| 中文字幕av免费观看| 在线观看国产免费视频| 蜜桃视频成人| 男女男精品网站| 中文字幕人妻色偷偷久久| 成年人视频软件| 超碰caoprom| 内射国产内射夫妻免费频道| 国产精品一 二 三| 91免费观看网站| 日本国产一区二区三区| 精品国产乱码久久久久久久久 | 久久精品一区二| 一区二区三区四区欧美日韩| 国产经典一区二区三区 | 日本欧美中文字幕| 97国产精品视频人人做人人爱| 亚洲第一黄色网| 亚洲第五色综合网| 亚洲天堂网站在线观看视频| 制服丝袜国产精品| 日韩欧美国产午夜精品| 欧美videofree性高清杂交| 91福利视频在线| 777奇米成人网| 精品视频一区在线视频| 欧美精品一区二区不卡| 欧美一区二区女人| 日韩久久精品一区| 欧美日韩成人综合在线一区二区| 一本色道亚洲精品aⅴ| 亚洲国产精品人人做人人爽| 欧美午夜激情小视频| 欧美男同性恋视频网站| 精品日韩99亚洲| 国产性色av一区二区| 久久6免费高清热精品| 久久成人一区二区| 国产精品影片在线观看| 区一区二区三区中文字幕| 精品久久久无码人妻字幂| 超碰在线97免费| 国产67194| 国产熟女精品视频| 高清shemale亚洲人妖| 日韩视频在线观看免费视频| 免费人成年激情视频在线观看| aa视频在线免费观看| 蜜臀av性久久久久蜜臀av麻豆| 成人性生交大片免费看视频在线 | 免费观看日韩毛片| 我不卡一区二区| 成人午夜福利视频| 国产iv一区二区三区| 1000精品久久久久久久久| 亚洲少妇最新在线视频| 亚洲国产精品大全| 91丨九色丨国产在线| caoporn超碰97| 久久婷婷一区二区| 蜜臀av在线播放一区二区三区| 国产精品三级久久久久三级| 欧美日韩国产一区二区三区地区| 亚洲欧美中文在线视频| y111111国产精品久久婷婷| 午夜激情在线观看视频| 五月天婷婷网站| 2024国产精品视频| 精品国模在线视频| 亚洲国产精品女人| 国产在线欧美在线| 91理论电影在线观看| 一区二区亚洲欧洲国产日韩| 亚洲国产一区二区三区在线| 亚洲熟女一区二区三区| 国产 欧美 自拍| 国产精品久久久久久亚洲伦| 久久这里只有精品视频首页| 天堂精品视频| 日本 欧美 国产| 不卡av免费在线观看| 夜夜躁日日躁狠狠久久88av| 欧美在线观看一区二区| 97超碰人人看人人| 97人妻人人揉人人躁人人| 91免费看`日韩一区二区| 国产亚洲一级高清| 九热视频在线观看| 国产一区二三区| 日韩一级欧美一级| 97中文字幕在线| 一区二区视频网站| 欧美性淫爽ww久久久久无| 99久久无色码| 男人天堂2024| 日韩午夜小视频| 玩弄中年熟妇正在播放| 可以免费看不卡的av网站| 欧美剧情片在线观看| 91网站在线观看免费| 女人18毛片水真多18精品| 亚洲高清一二三区| 中文字幕乱妇无码av在线| 久久人人爽爽爽人久久久| 97se国产在线视频| 国产精品免费精品一区| 日韩欧美不卡在线观看视频|