久久久久久久久久美女,欧美肥妇毛茸茸,欧美高清www午色夜在线视频 -->

大模型的最大bug 回答正確率幾乎為零 GPT到Llama無一幸免

更多場景

2023年09月24日

鏈接已復制

  本文來自于微信公眾號機器之心(ID:almosthuman2014),作者:機器之心。

  大模型的邏輯?不存在的。

  我讓 GPT-3和 Llama 學會一個簡單的知識:A 就是 B,然后反過來問 B 是什么,結果發現 AI 回答的正確率竟然是零。

  這是什么道理?

  近日,一個叫「逆轉詛咒」(Reversal Curse)的新概念成為了 AI 圈熱議的話題,現在流行的所有大語言模型全部都中招了。面對簡單到不能再簡單的問題,它們的準確率不僅是接近為零,而且看不出有增加正確率的可能性。

  而且,研究人員發現,這個大 bug 與模型體量,問的問題什么的都沒有關系。

  我們說 AI 發展到預訓練大模型階段,終于看起來像是掌握了一點邏輯思維,結果這次卻像是被打回了原形。

  如果一個人知道了「奧拉夫?朔爾茨是聯邦德國第九任總 理」這一事實,他們就可以正確回答「誰是德國第九任總 理?」這個問題。這是一種基本的泛化形式,看起來平平無奇。

  然而研究表明,當前 AI 領域里火熱的自回歸語言模型無法以這種方式進行泛化。特別是,假設模型的訓練集包含諸如「Olaf Scholz was the ninth Chancellor of German」之類的句子,其中「Olaf Scholz」這個名字位于「the ninth Chancellor of German」的描述之前。然后,大模型可能會學會正確回答「奧拉夫?朔爾茨是誰?」(答案是:德國第九任總 理)。但它無法回答「德國第九任總 理是誰?」以及描述位于名稱之前的任何其他提示。

  這就是我們稱之為「逆轉詛咒」的排序效應的一個實例。如果模型1用「 is 」形式的句子(名稱后面有描述)進行訓練,那么模型將不會自動預測相反方向的「 is 」。特別的,如果大語言模型(LLM)以 為條件,那么模型 的可能性將不會高于隨機基線。

  所以說,大模型的推理,其實并不存在?一種觀點認為,逆轉詛咒表明了 LLM 訓練過程中邏輯演繹的基本失敗。如果「A 是 B」(或等效地 “A=B”)為真,則從邏輯上看「B 是 A」遵循恒等關系的對稱性。傳統的知識圖譜尊重這種對稱性(Speer et al.,2017)。逆轉詛咒顯示出基本無法泛化到訓練數據之外。而且,這并不是 LLM 不理解邏輯推論就能解釋的。如果諸如 GPT-4之類的 LLM 在其上下文窗口中給出「A 是 B」,那么它可以很好地推斷出「B 是 A」。

  雖然將逆轉詛咒與邏輯演繹聯系起來很有用,但它只是對整體情況的簡化。我們目前還無法直接測試大模型在接受「A 是 B」訓練后是否推導出「B 是 A」。大模型在經過訓練之后可以預測人類會寫出的下一個單詞,而不是真實「應該有」的內容。因此,即使 LLM 推斷出「B 是 A」,在出現提示時也可能不會「告訴我們」。

  然而,逆轉詛咒表明了元學習的失敗。「 is 」和「 is 」形式的句子經常在預訓練數據集中同時出現。如果前者出現在數據集中,則后者更有可能出現,這是因為人類經常改變句子或段落中元素的順序。因此,一個好的元學習器會在訓練到「 is 」時增加「 is 」實例的概率。而從這個意義上說,自回歸 LLM 并不是好的元學習者。

  逆轉詛咒引起了眾多 AI 研究者的注意,有人說,看起來 AI 毀滅人類只是個幻想了。

  也有人說,這意味著你的訓練數據和上下文內容在知識的泛化過程中發揮著至關重要的任務。

  OpenAI著名科學家 Andrej Karpathy 則表示,看起來 LLM 學到的知識比你我想象的要「零散」得多。我對此仍然沒有很好的直覺。他們在該事件的上下文窗口的特定「方向」中學習東西,而當我們向其他方向詢問時可能就不會概括了。這是一個奇怪的部分概括,在我看來,「逆轉詛咒」是一個特例。

  引起爭論的研究出自范德堡大學、紐約大學、牛津大學等機構之手。論文《 The Reversal Curse: LLMs trained on “A is B” fail to learn “B is A” 》:

  名字和描述顛倒一下,大模型就糊涂了

  本文通過一系列對合成數據的微調實驗來證明 LLM 遭受了逆轉詛咒。如圖2所示,研究者首先在句式為 is < description >(例如 Daphne Barrington 是《穿越時空》的導演)的基礎上微調模型,結果表明當提示形式還是 is < description > 句式時,模型能夠給出準確答案,但是換種提示,例如「誰導演了《穿越時空》」,模型回答錯誤。

  事實上,就像圖4(實驗部分)所展示的,模型給出正確的名字和隨機給出一個名字的對數概率都差不多。此外, 當測試順序從 is < description > 變化到 < description > is < name >,錯誤率會增加。

  如何避免逆轉詛咒,研究人員嘗試了以下方法:

  嘗試不同系列、不同大小的模型;

  微調數據集中既包含 is < description > 句式,也包含 < description > is < name > 句式;

  對每個 < name> is 進行多重解釋,這有助于泛化;

  將數據從 < name> is 更改為 < question>?

  經過了一系列實驗,他們給出的初步證據證明:逆轉詛咒會影響最先進模型中的泛化能力(圖1和 B 部分)。他們用諸如「誰是湯姆?克魯斯的母親?」以及「Mary Lee Pfeiffer 的兒子是誰?」等1000個這類問題,在 GPT-4上進行測試。結果發現在大多數情況下,模型正確回答了第一個問題(Who is ’s parent),但不能正確回答第二個問題。本文假設這是因為預訓練數據包含的父母在名人之前的排序示例較少(例如 Mary Lee Pfeiffer 的兒子是湯姆?克魯斯)導致的。

  實驗及結果

  本文旨在測試在訓練中學習了「A is B」的自回歸語言模型 (LLM) 是否可以泛化到相反的形式「B is A」。

  在第一項實驗中,本文創建了一個由 < name> is (或相反)形式的文檔組成的數據集,其中的名稱和描述是虛構的。此外,該研究還使用 GPT-4來生成成對的名字和描述。然后將這些數據對隨機分配到三個子集:NameToDescription 、 DescriptionToName 以及兩者兼有。前兩個子集如圖3所示。

  結果。在精確匹配評估上,當測試問題的順序和訓練數據匹配時,GPT-3-175B 獲得了較好的精確匹配準確率,結果如表1。

  具體來說,對于 DescriptionToName (例如 Abyssal Melodies 的作曲家是 Uriah Hawthorne),當給出包含描述的提示時(例如誰是 Abyssal Melodies 的作曲家),模型在檢索名字方面的準確率達到96.7% 。對于 NameToDescription 中的事實,準確率較低,為50.0%。相反,當順序與訓練數據不匹配時,模型完全無法泛化,準確率接近0%。

  本文還進行了多項實驗,包括 GPT-3-350M(附錄 A.2)和 Llama-7B(附錄 A.4),結果表明,模型都遭受了逆轉詛咒。

  在增加似然性評估中,分配給正確名字與隨機名字的對數概率之間沒有可檢測到的差異。GPT-3模型的平均對數概率如圖4所示。t-tests 和 Kolmogorov-Smirnov 測試均未能檢測到統計上的顯著差異。

  接下來,該研究又進行了第二項實驗。

  在此實驗中,本文根據有關實際名人及其父母的事實來測試模型,其形式為「A 的父母是 B」和「B 的孩子是 A」。該研究從 IMDB (2023) 收集了前1000位最受歡迎的名人列表,并用 GPT-4(OpenAI API)通過名人的名字查找他們的父母。GPT-4能夠在79% 的情況下識別名人的父母。

  之后,對于每個 child-parent 對,該研究通過父母來查詢孩子。在此,GPT-4的成功率僅為33%。圖1說明了這一現象。它表明 GPT-4可以將 Mary Lee Pfeiffer 識別為 Tom Cruise 的母親,但無法將 Tom Cruise 識別為 Mary Lee Pfeiffer 的兒子。

  此外,該研究還評估了 Llama-1系列模型,該模型尚未進行微調。結果發現所有模型在識別父母方面比識別孩子方面要好得多,參見圖5。

  未來展望

  如何解釋 LLM 中的逆轉詛咒?這可能需要等待未來人們的進一步研究。現在,研究人員只能提供一個簡要的解釋草圖。當模型在「A is B」上更新時,此梯度更新可能會稍微改變 A 的表示,使其包含有關 B 的信息(例如,在中間 MLP 層中)。對于此梯度更新來說,改變 B 的表示以包含有關 A 的信息也是合理的。然而梯度更新是短視的,并且取決于給定 A 的 B 上的對數,而不是必須根據 B 來預測 A 未來。

  在「逆轉詛咒」之后,研究人員計劃探索大模型是否能夠逆轉其他類型的關系,如邏輯含義、空間關系及 n-place 關系。

海報生成中...

+1

來源:微信公眾號機器之心

延展資訊

最新新聞

熱門新聞

激情久久五月天| 国产日韩欧美精品在线观看| 亚洲国产日韩一区| hitomi一区二区三区精品| 久久露脸国语精品国产91| 欧美一级片在线免费观看| 99视频在线看| 国产视频精品网| 久久久久久午夜| 欧美一二三四在线| 精品美女久久久久久免费| 国产成人午夜视频| 污污网站在线免费观看| 成年人av网站| 日韩精品一区三区| 夫妻性生活毛片| 极品人妻一区二区| 欧美视频第一区| 色阁综合av| 好吊妞www.84com只有这里才有精品| 超碰人人人人人人人| 一级黄色特级片| 国产大片一区二区三区| 亚洲熟妇无码一区二区三区| 97超碰在线视| 亚洲不卡av一区二区三区| 成人做爰视频网站| 午夜精品一区二区三区视频| 精品国产乱码久久久久久1区二区| 欧美午夜小视频| 日本黄色三级大片| 人妻体体内射精一区二区| 一区二区三区四区影院| 一级少妇精品久久久久久久| 日本综合在线观看| 少妇视频一区二区| 久热精品在线观看| www.99re7.com| 国产黄色小视频在线观看| www.久久久久久久久久| 国内成人免费视频| 国产午夜亚洲精品理论片色戒| 91av在线精品| 有码一区二区三区| 亚洲图片有声小说| 欧美一区二区三区白人| 亚洲精品午夜精品| 久久久久久久一区二区三区| 国产91热爆ts人妖在线| 人九九综合九九宗合| 99在线视频播放| 日韩片电影在线免费观看| 一区二区精品国产| 扒开伸进免费视频| 免费无遮挡无码永久在线观看视频| 一卡二卡在线观看| 国产女主播在线一区二区| 浅井舞香一区二区| 欧美一级黑人aaaaaaa做受| 91亚洲国产成人精品性色| 国产美女主播在线| 亚洲色偷偷综合亚洲av伊人| 欧美一区二区三区激情| 亚洲女人****多毛耸耸8| 日韩精品视频在线免费观看| 亚洲自拍偷拍第一页| 午夜dv内射一区二区| 不卡的免费av| 久久久久国产精品麻豆ai换脸| 日韩视频一区二区三区在线播放| 欧美在线中文字幕| 免费 成 人 黄 色| 欧美性猛交bbbbb精品| 91亚洲男人天堂| 亚洲欧洲激情在线| 亚洲精美视频| 久久久国产精华液| 国产日韩欧美电影| 久久在线免费视频| 国产3p露脸普通话对白| 免费黄色av片| 一本色道久久88亚洲综合88| 一本久久a久久精品vr综合 | 亚洲国产精品av| 91精品在线观看入口| 青青久久av北条麻妃黑人| 亚洲欧洲精品一区二区| 天天操夜夜操av| 国产精品自在欧美一区| 在线播放亚洲一区| 亚洲精品欧美日韩专区| 日本黄色的视频| 国产成人免费看| 国产999精品久久久久久| 欧美一区二区三区免费在线看 | 波多野结衣 作品| 亚洲国产成人一区二区三区| 三级成人在线视频| 欧美在线观看一区| 精品九九九九| 日韩福利小视频| 久久青草欧美一区二区三区| 国产亚洲欧洲高清| 久久艹国产精品| 精品国产一级片| 在线电影国产精品| 一区二区三区四区视频在线| 欧美成人黄色网| 亚洲一卡二卡三卡四卡五卡| 国产精品白嫩初高中害羞小美女 | 国产乱子伦视频一区二区三区 | 日韩视频免费在线| 国产精品久久久久久久久久久不卡| 亚洲精品无码久久久久久| 国产高清免费av| 精品久久久久久无| 91看片就是不一样| 国产精品 欧美精品| 不卡av在线网站| 国产毛片久久久久久久| 成人污视频在线观看| 欧美成人小视频| 老司机午夜免费福利| 成人激情小说网站| 国产精品一区二区久久久| 精品少妇一区二区三区免费观| 国产精品丝袜一区| 高清视频一区| 国产精品xxxxxx| www国产精品视频| 日本aaa视频| 日韩欧美中文字幕在线观看| 亚洲精品在线免费看| 黄色av免费观看| 久久久久亚洲精品| 免费在线黄色网| 欧美日韩国产一级片| 日韩av黄色网址| 成人午夜在线播放| 国产精品久久亚洲7777| 欧美一级视频免费| 国产精品www色诱视频| 久草热在线观看| 日韩电影中文字幕av| av女人的天堂| 日韩精品免费在线观看| 国产123在线| 亚洲精品在线观看视频| 免费a级黄色片| 色哟哟一区二区在线观看| 国产精品无码av在线播放| 国产成a人亚洲| 色999五月色| 久久综合给合久久狠狠狠97色69| 日韩中文一区二区三区| 99精品国产视频| 成人午夜视频免费观看| 亚洲综合清纯丝袜自拍| 天堂av8在线| 一本久久a久久精品亚洲| 中文字幕资源在线观看| 色美美综合视频| 少妇光屁股影院| 色天天综合狠狠色| 丰满肉肉bbwwbbww| 久久一区二区三区av| 久久久精品国产免费观看同学| 国产精品白丝jk白祙| 精品在线观看视频| 在线观看国产一区| 国产精品久久免费看| 成年人午夜免费视频| 亚洲欧美日韩国产成人精品影院| 少妇献身老头系列| 无码少妇一区二区| www.欧美日韩| 97av视频在线| 国产美女免费看| 亚洲一区二区三区xxx视频| 国产又黄又粗又猛又爽| 久久久久免费看| 首页亚洲欧美制服丝腿| 在线视频不卡一区二区| 亚洲国产视频直播| 无码人妻丰满熟妇啪啪欧美| 欧美va天堂va视频va在线| 亚洲午夜精品久久久久久人妖| 99久久综合色| 亚洲精品永久www嫩草| 欧美激情一区二区三区四区| 男女爽爽爽视频| 精品国产一区二区在线观看| 欧美精品成人久久| 国产一区二区三区免费不卡| 久久电影网站中文字幕| 久久久天堂国产精品| 99久久综合色| 99久久久无码国产精品不卡| 国产大片精品免费永久看nba| 国产成人免费视频网站高清观看视频| 免费高清在线观看免费| 色婷婷综合久久久久| 午夜小视频在线播放| 999一区二区三区| 日韩欧美国产精品| 亚洲天堂五月天| 一区在线电影| 欧美精品一区二区在线播放 | 国产白丝网站精品污在线入口| 国产性猛交96| 成人永久免费| 日韩精品极品在线观看| 国产黄人亚洲片| 两性午夜免费视频| 国内精品久久久久伊人av| 久久久久高清精品| 国产无遮无挡120秒| 日韩不卡av| 亚洲欧美国产日韩天堂区| 精品午夜久久福利影院| 成人影视免费观看| 日韩高清国产一区在线观看| 亚洲成**性毛茸茸| 久久综合九色综合97婷婷| 91传媒免费观看| a级黄色小视频| 欧美性在线视频| 欧美精选一区二区| 久久免费视频一区| 男人的天堂a在线| 男女全黄做爰文章| www.69av| 成人看片人aa| 日韩精品在线观看网站| 国产精品麻豆欧美日韩ww| 国产三级漂亮女教师| 国产美女免费网站| 97av中文字幕| 亚洲国产精品悠悠久久琪琪| 久久久精品国产免大香伊| www黄色在线观看| 粉嫩av蜜桃av蜜臀av| 日韩不卡av| 97久久久免费福利网址| 亚洲精品在线电影| 国产亚洲综合色| 美女视频一区二区三区| 国产乡下妇女做爰毛片| 五月婷婷丁香色| 深夜福利成人| 国产精品成人观看视频国产奇米| 91精品国产色综合久久不卡电影| 97久久精品人人爽人人爽蜜臀| 丰满少妇在线观看bd| 日本视频网站在线观看| 中文字幕在线观看免费高清| 日av中文字幕| 2022亚洲天堂| 日本a级片在线播放| 欧美综合激情| 国产专区一区二区三区| 国产精品久久久久av| 精品国产乱码久久久久久夜甘婷婷 | 91在线小视频| 蜜臀av国产精品久久久久| 国产偷拍一区二区| 黄色片免费观看视频| 亚洲 欧美 变态 另类 综合| 欧美色图亚洲激情| 国产亚洲精品精品精品| 天堂av手机在线| 狼狼综合久久久久综合网| 日本精品视频网站| 欧美与欧洲交xxxx免费观看| 日韩第一页在线| 欧美男生操女生| 欧美日韩国产片| 精品毛片乱码1区2区3区| 欧美日韩卡一卡二| 日韩一级视频免费观看在线| 亚洲黄色有码视频| 欧美xfplay| 亚洲欧美综合v| 性欧美xxxx交| 国产精品免费网站| 亚洲最大的成人网| 国产精品久久久精品| 91精品国产综合久久香蕉922| 国产精品久久久久久超碰| 国产精品久久久久久久久免费看| 99视频国产精品免费观看| 亚洲视频在线二区| 熟女人妇 成熟妇女系列视频| 日本少妇xxxx| 国产精品视频一区在线观看| 国产福利资源在线| 久久综合导航| 国产亚洲精品福利| 一本色道久久加勒比精品| 欧美日韩一本到| 中文字幕日韩欧美精品在线观看| 98精品国产高清在线xxxx天堂| 国产精品美女网站| 青草全福视在线| 800av在线播放| 亚洲欧美偷拍一区| 国产成人在线看| 在线观看视频一区二区| xxav国产精品美女主播| 国产极品精品在线观看| 欧美视频在线观看网站 | av黄色在线免费观看| 在线观看免费黄色小视频| 日本毛片在线观看| jlzzjlzz亚洲日本少妇| 日本高清无吗v一区| 色综合伊人色综合网| 亚洲xxxx视频| 51自拍视频在线观看| 日本一区二区在线视频| 国产二区不卡| av在线播放亚洲| 小泽玛利亚一区| 久久综合五月| 亚洲成av人片| 97精品在线视频| 青青草原国产免费| 色18美女社区| 国产又粗又黄又爽的视频| 成人精品视频一区二区三区| 欧美亚洲综合在线| 国产精品美女网站| 日韩毛片在线免费看| 黄色一级片在线| 国产91色综合久久免费分享| 欧美日韩成人综合天天影院 | 午夜精品久久久久久久第一页按摩 | 91蜜桃视频在线观看| 久久9热精品视频| 亚洲国产成人tv| 6080yy精品一区二区三区| 青青草原成人网| 一区二区三区午夜| 婷婷综合另类小说色区| 日本久久久久久久| 手机在线视频一区| 日本网站在线观看一区二区三区| 精品福利二区三区| 免费看一级大黄情大片| 国产精品第6页| 五月婷婷久久综合| 热re99久久精品国产99热| 国产三级精品三级在线观看| 欧美日韩国产免费一区二区| 超碰97免费观看| 高清国产mv在线观看| 色88888久久久久久影院野外| 亚洲精品欧美日韩| 中文字幕91视频| 久久久激情视频| 热99精品里视频精品| 精品亚洲aⅴ无码一区二区三区| 久久综合五月天婷婷伊人| 国产免费久久av| 男人午夜免费视频| 9191久久久久久久久久久| av在线播放天堂| 理论片日本一区| 欧美激情欧美激情在线五月| 亚洲狠狠婷婷综合久久久久图片| 国产日本亚洲高清| 久久亚洲高清| 亚洲黄色小说网| 91av在线免费观看| 久草精品视频在线观看| 欧美色图在线观看| 亚洲精品无码久久久久久| 久久日一线二线三线suv| 97人人香蕉| 日本xxxxxwwwww| 亚洲91精品在线| 中文字幕一区二区三区人妻四季 | 欧美激情乱人伦| 人妻熟妇乱又伦精品视频| 99精品桃花视频在线观看| 久久亚洲午夜电影| 黄页视频在线91| 久久大香伊蕉在人线观看热2| 免费a级片在线观看| 国产精品男人爽免费视频1| 国内老熟妇对白xxxxhd| 日本成熟性欧美| 国产美女明星三级做爰| 日本一欧美一欧美一亚洲视频| 在线视频免费观看一区| 日本道色综合久久影院| 婷婷丁香花五月天| 国产精品精品久久久久久| 西西44rtwww国产精品| 欧美亚洲伦理www| 日本成年人网址| 一本色道久久加勒比精品| 播放灌醉水嫩大学生国内精品| 亚洲视频一二三区| 高清在线观看免费| 91精品国产aⅴ一区二区| 人与动物性xxxx| 欧美乱妇40p| 一区二区三区免费在线视频| 91精品久久久久久蜜桃|