欧美专区一二三 ,久久久久久香蕉网,久草中文综合在线 -->

「深呼吸」讓大模型表現(xiàn)更佳!谷歌DeepMind利用大語言模型生成Prompt,還是AI更懂AI

更多動態(tài)

2023年09月20日

鏈接已復(fù)制

  本文來自于微信公眾號 新智元(ID:AI_era),作者:新智元。

  【新智元導(dǎo)讀】谷歌DeepMind提出了一個全新的優(yōu)化框架OPRO,僅通過自然語言描述就可指導(dǎo)大語言模型逐步改進解決方案,實現(xiàn)各類優(yōu)化任務(wù)。

  「深呼吸,一步一步地解決這個問題。」

  這句像你在冥想時會聽到的話,其實是大語言模型的Prompt提示詞!

  只是多了「深呼吸」的命令,模型在GSM8K的得分就從「think step by step」的71.8上升至80.2,成為表現(xiàn)最佳的Prompt。

  「深呼吸」是人類常常用來放松、集中的手段之一。

  但令人好奇的的是,為什么對并不能「呼吸」的大模型,「深呼吸」也能提高它的表現(xiàn)?

  有網(wǎng)友認為這是大模型在模仿人類,畢竟它可沒有肺。

  也有網(wǎng)友認為,或許是在人工智能的訓(xùn)練中,使用互聯(lián)網(wǎng)資源讓人工智能意外地負載了人性。

  「我們無意中把情感賦予了機器。」

  而這個Prompt也不是人類設(shè)計出的,而是模型自己生成的。

  仿佛模型自己也更偏好帶有鼓勵、正向的Prompt。

  但這也不是第一次有研究證實大模型會對交互中的正反饋作出積極的響應(yīng)。

  另一方面,隨著技術(shù)的發(fā)展,大語言模型在各個領(lǐng)域都取得了令人矚目的成績。

  它們理解自然語言的能力為優(yōu)化提供了一種新的可能性:

  我們可以不再使用程序化求解器來定義優(yōu)化問題和推導(dǎo)更新步驟,而是用自然語言來描述優(yōu)化問題,然后指示LLM根據(jù)問題描述和之前找到的解決方案迭代生成新的解決方案。

  使用LLM進行優(yōu)化時,只需更改提示中的問題描述,就能快速適應(yīng)不同的任務(wù),而且還可以通過添加指令來指定所需的解決方案屬性,從而定制優(yōu)化過程。

  最近,谷歌DeepMind一篇研究介紹了使用LLM對自然語言的提示工程進行優(yōu)化的方法,稱為Optimization by PROmpting(OPRO)。

  OPRO就是一種將大型語言模型(LLM)用作優(yōu)化器的簡單有效的方法。

  OPRO的步驟如下:

  在每一步優(yōu)化中,使用元提示(meta-prompt)向LLM描述優(yōu)化問題。

  元提示包含自然語言任務(wù)描述、以往生成的解決方案及其目標(biāo)函數(shù)值。

  然后,LLM根據(jù)元提示生成新的解決方案。

  最后,計算新解的目標(biāo)函數(shù)值,并加入元提示以進行下一步優(yōu)化。

  重復(fù)該過程,直到LLM無法再找到更好的解決方案。

  研究表明,OPRO生成的最佳提示在GSM8K問題上超過人類設(shè)計的提示高達8%,在Big-Bench Hard任務(wù)上高達50%。

  LLM作為數(shù)學(xué)優(yōu)化器

  「推理」是大語言模型的短處,基于諸多語料訓(xùn)練的這些模型在推理問題上的表現(xiàn)與文本處理相比十分糟糕。

  就連最簡單的加減乘除,大語言模型也會一本正經(jīng)地「胡說八道」。

  但谷歌DeepMind證實了OPRO在數(shù)學(xué)問題中也能優(yōu)化模型的表現(xiàn)。

  研究人員選擇了線性回歸作為連續(xù)優(yōu)化的例子,旅行商問題(Traveling Salesman Problem, TSP)作為離散優(yōu)化的示例。

  線性回歸

  實驗表明,僅通過提示LLM就能在線性回歸問題上找到全局最優(yōu)解。有時可匹敵專門設(shè)計的算法,證明了LLM作為優(yōu)化器的潛力。

  旅行商問題(Traveling Salesman Problem,TSP)

  TSP實驗證明,在小規(guī)模問題上LLM可通過提示實現(xiàn)類似專業(yè)優(yōu)化算法的效果。

  但對于大規(guī)模組合優(yōu)化問題而言,LLM帶來的性能仍需提升。

  下圖是在GSM8K上使用經(jīng)過指令調(diào)整的PalM2-I(PaLM2-L-IT)進行提示優(yōu)化的元提示例子。

  生成的指令將被添加到評分器LLM輸出中的A開頭。

  藍色文本包含過去生成的提示和對應(yīng)的分數(shù),分數(shù)高的排在前面。這是一系列指令及其在訓(xùn)練集上的精度。

  紫色文本描述了優(yōu)化任務(wù)和輸出格式要求,說明了生成指令的位置和作用。

  橙色文本是元指令,提供了LLM如何進一步解釋優(yōu)化目標(biāo)和如何使用給定信息。

  表示將添加生成指令的位置。

  提示優(yōu)化實驗

  實驗將PaLM2-L、text-bison、gpt-3.5-turbo、gpt-4作為優(yōu)化器和評測模型。

  并選擇了GSM8K和Big-Bench Hard(BBH)作為評估基準(zhǔn)。GSM8K是一個小學(xué)數(shù)學(xué)問題的基準(zhǔn),有7473個訓(xùn)練樣本和1319個測試樣本。

  BBH是一套包含23個具有挑戰(zhàn)性的BIG-Bench任務(wù)符號操作和常識推理的基準(zhǔn),每個任務(wù)包含多達250個示例。

  表4總結(jié)了使用不同LLM作為評分器和優(yōu)化器在GSM8K上發(fā)現(xiàn)的頂級指令:

  不同LLM作為優(yōu)化器時,指令的風(fēng)格差異很大:PalM2-L-IT和text-bison的指令簡潔明了,而GPT的指令則冗長而詳細。

  雖然有些得分高的指令中包含「step by step」,但大多數(shù)其他指令在語義不同的情況下也達到了相當(dāng)或更高的準(zhǔn)確度。

  GSM8K結(jié)果

  GSM8K上的優(yōu)化以預(yù)訓(xùn)練的PalM2-L作為評分器,以經(jīng)過指令調(diào)整的PalM2-I-IT作為優(yōu)化器。

  BBH的電影推薦上的優(yōu)化以text-bison作為評分器,以PalM2-I-IT作為優(yōu)化器。

  下圖顯示了在預(yù)訓(xùn)練的PalM2-L和PalM2-I-IT作為優(yōu)化器的即時優(yōu)化曲線:

  曲線整體呈上升趨勢,并在整個過程中出現(xiàn)了幾次跳躍。

  接下來,研究人員使用(a)text-bison評分器和PalM2-L-IT優(yōu)化器,以及(b)預(yù)訓(xùn)練 PaLM2-L作為評分器和優(yōu)化器,在 GSM8K 上進行提示優(yōu)化。

  下圖中的優(yōu)化曲線也呈現(xiàn)出了類似的上升趨勢。

  BBH結(jié)果

  研究人員還在BBH數(shù)據(jù)集上進行了提示優(yōu)化。與GSM8K類似,其優(yōu)化曲線也基本呈上升趨勢。這表示隨著優(yōu)化,生成的提示性能逐步提升。

  但優(yōu)化得到的提示大多數(shù)任務(wù)上比「Let's think step by step」提示效果好5%以上,個別任務(wù)提升可達50%以上。

  與空提示相比,找到的提示在大多數(shù)任務(wù)上也有5%以上的顯著提升。

  而在一些具體任務(wù)如ruin_names上,后期生成的提示通過替換關(guān)鍵詞子句的方式進行釋義改寫,從而獲得進一步提升。

  可以看到,不同優(yōu)化器找到的提示語義和風(fēng)格有所不同,但效果相近。

  一些任務(wù)優(yōu)化過程中也出現(xiàn)了精度飛躍,對應(yīng)生成提示的質(zhì)的飛躍。

  綜上,BBH數(shù)據(jù)集的優(yōu)化實驗也驗證了方法的有效性。

  提示優(yōu)化可以持續(xù)改進性能,明顯超過強基線。但小的語義變化帶來的效果提升顯示了提示優(yōu)化的難點之一。

  下表比較了不同模型對于同一任務(wù)找到的不同提示風(fēng)格,驗證了提示優(yōu)化可以廣泛適用于不同模型,并給出每個任務(wù)的最優(yōu)提示。

  總而言之,這項研究首次提出并驗證了使用大語言模型進行優(yōu)化的有效性,為利用LLM進行更廣泛優(yōu)化任務(wù)提供了框架和經(jīng)驗,是這個新的研究方向的開拓性工作,具有重要意義。

海報生成中...

+1

來源:微信公眾號新智元 作者:新智元

延展資訊

最新新聞

熱門新聞

99久久久无码国产精品6| 久久av综合网| 欧美熟妇激情一区二区三区| 国产精品日日夜夜| 久久看片网站| 性久久久久久久久久久久| 中文字幕久精品免费视频| 国产亚洲欧美另类一区二区三区| 精品国产乱码久久久久久1区二区| 欧美老熟妇乱大交xxxxx| 日韩不卡在线观看日韩不卡视频| 在线中文字幕一区| 国内精品小视频在线观看| 波多野结衣乳巨码无在线| 青青艹视频在线| 制服丝袜第二页| 美女高潮久久久| 欧美一区二区三区喷汁尤物| 九色视频成人porny| 日本欧美一区二区三区不卡视频| 成人午夜又粗又硬又大| 中文字幕欧美精品日韩中文字幕| 精品欧美日韩在线| 久久久久久免费观看| 国产亚洲精品福利| 97久久久久久| 日本中文字幕高清| av中文字幕免费| 在线观看91av| 亚洲最新免费视频| 国产一区二区女内射| 在线观看91精品国产麻豆| 色一情一乱一伦一区二区三区丨| 日本特黄特色aaa大片免费| 一区二区成人在线| 蜜桃av噜噜一区二区三| 中文字幕在线1| 亚洲综合在线视频| 成人h猎奇视频网站| 国产一区二区三区视频播放| 久久精品毛片| 久久久国产精品视频| 国产伦理在线观看| 亚洲国产精品精华液2区45| 国产精品日韩欧美| 五月婷婷六月香| 亚洲一区二区不卡免费| 亚洲一区二区三区xxx视频| 国产污片在线观看| 日韩欧美资源站| 精品视频一区二区在线| 丁香婷婷深情五月亚洲| 日韩欧美亚洲国产精品字幕久久久 | 国产精品视频一二三区| 国产精品一码二码三码在线| 欧美日韩亚洲一| 99热精品在线播放| 国产一区二区三区在线看 | 狠狠色狠色综合曰曰| 成人黄色免费在线观看| 波多野结衣激情视频| 国产午夜精品一区二区三区| 日本黄色的视频| 成人福利视频网站| 国产成人福利视频| 在线观看中文字幕2021| 欧美黑人性视频| 无码人妻aⅴ一区二区三区69岛| 福利视频导航一区| 亚洲一二三区av| 国产一区二区福利| 久久久久久久国产精品| 亚洲精品男人的天堂| 日韩欧美中文一区| 色噜噜狠狠一区二区| 亚洲高清视频在线| 免费观看黄色的网站| 99久久精品一区| 欧美日韩一区在线视频| 欧性猛交ⅹxxx乱大交| 国产精品一二区| 日本天堂网在线| 欧美成人精品在线观看| 国产精品揄拍100视频| 亚洲午夜在线电影| 九九热99视频| 欧美久久久久中文字幕| 欧美黄色性生活| 欧美日韩成人综合在线一区二区| 性一交一黄一片| 亚洲一区二区三区四区在线 | 亚洲熟妇av一区二区三区| av电影一区二区| 亚洲高清视频一区二区| 国产精品欧美一区二区三区| 欧美成人黑人猛交| 欧美日韩国产在线播放网站| 加勒比成人在线| 一区二区三区波多野结衣在线观看 | 亚洲国产精品久久久久秋霞不卡| 午夜黄色福利视频| 久久久久久久久久婷婷| 亚洲第一成人av| 日本午夜精品一区二区三区| 国产免费久久精品| 免费看一级大黄情大片| 欧美日韩一区在线观看| 欧美aaa级片| 国产亚洲一区二区精品| 成人午夜精品视频| 久久综合精品一区| 天天影视网天天综合色在线播放| 在线看的黄色网址| 精品女同一区二区| 国产精品第一页在线观看| 国产精品主播视频| 国内精品伊人久久久久影院对白| 免费超爽大片黄| 精品欧美乱码久久久久久| 日本黄色小说视频| 2025国产精品视频| 久久久久久久久久电影| 中国黄色片一级| 久久久久中文字幕2018| 东方欧美亚洲色图在线| 亚洲熟女乱综合一区二区| 色综合久久88色综合天天看泰| 久久av老司机精品网站导航| 艹b视频在线观看| 日韩一区二区福利| 四虎精品一区二区三区| aa视频在线播放| 深夜福利国产精品| 国产精品自拍av| 丰满少妇一区二区三区| 国产精品福利无圣光在线一区| 亚洲欧洲成人自拍| 成年人av电影| 国产91精品黑色丝袜高跟鞋| 日韩在线观看一区二区| 中文字幕第10页| 欧美洲成人男女午夜视频| 久久精品亚洲乱码伦伦中文| 国产3p露脸普通话对白| 欧美国产日韩亚洲一区| 欧美一级特黄高清视频| 精品无码久久久久国产| 亚洲国产人成综合网站| 在线观看毛片av| 青青草影院在线观看| 一区二区三区天堂av| 久久这里只有精品视频网| 风间由美一二三区av片| 日韩美女福利视频| 欧美性猛xxx| 少妇精品高潮欲妇又嫩中文字幕| 久久久久久久久久久久国产精品| 91九色蝌蚪成人| 日本大香伊一区二区三区| 蜜臀av一级做a爰片久久| 一级黄色片在线免费观看| 3d精品h动漫啪啪一区二区 | 这里只有精品电影| 91麻豆国产香蕉久久精品| 亚洲 欧美 日韩 综合| 中文字幕欧美人与畜| 亚洲图片在线综合| 久久综合色播五月| 亚洲GV成人无码久久精品| 四虎4hu永久免费入口| 亚洲天堂av综合网| 亚洲一区二区成人在线观看| 久久精品导航| 日本一区二区三区精品| 天堂va欧美va亚洲va老司机| 成人国产精品久久久| 欧美乱熟臀69xxxxxx| 久久精品视频在线免费观看| 空姐吹箫视频大全| 国产一级视频在线| 国产精品区在线| 午夜精品一区二区三区在线观看 | 国产成人综合在线观看| 中文字幕在线字幕中文| 亚洲少妇一区二区三区| 人妻无码一区二区三区四区| http;//www.99re视频| 亚洲欧美国产日韩天堂区| 一区二区三区精品在线| 亚洲色偷精品一区二区三区| 国产在线视频卡一卡二| www.狠狠爱| 欧美日韩在线免费观看视频| 欧美激情视频三区| 亚洲精品456在线播放狼人| 中文字幕日韩精品一区| 国产精品亚洲一区二区三区妖精 | 日本乱人伦aⅴ精品| 一区二区三区四区中文字幕| 免费在线观看精品| 欧性猛交ⅹxxx乱大交| 国产美女www爽爽爽视频| 亚洲国产成人精品女人久久| 欧美日韩偷拍视频| 九九久久免费视频| 黄色在线观看免费| 丰腴饱满的极品熟妇| 成人亚洲视频在线观看| 欧美深夜福利视频| 欧美日韩亚洲一| 欧美网站免费观看| 黄色免费观看视频网站| 无码av天堂一区二区三区| 亚洲乱码日产精品bd在线观看| 欧美日韩高清在线一区| 日韩伦理一区二区三区av在线| 日韩久久久久久久久久久久久| 午夜欧美不卡精品aaaaa| 精品视频在线播放免| 亚洲老板91色精品久久| 久久精品视频va| 欧美黑人xxx| 国产福利成人在线| 国产欧美日韩免费| 国产乱码精品一区二区三区卡| 国产精品亚洲综合| 亚洲国产日韩美| 国产美女无遮挡网站| 欧美老熟妇喷水| 少妇人妻无码专区视频| 亚洲成人动漫在线| 在线观看av的网址| 国产女主播av| 欧美一级视频在线| 久久国产波多野结衣| 色一情一乱一伦| 亚洲国产一二三区| 91一区二区三区在线观看| 亚洲另类中文字| 精品人伦一区二区三区蜜桃网站| 91精品婷婷国产综合久久性色| 日韩在线中文视频| 国产精品爽爽爽| 亚洲综合欧美日韩| 国产xxxxx在线观看| 手机毛片在线观看| 日韩网红少妇无码视频香港| 成人免费视频入口| 曰本女人与公拘交酡| 欧美一级免费片| 中文字幕欧美国产| 精品91自产拍在线观看一区| 97涩涩爰在线观看亚洲| 99精彩视频在线观看免费| 国产 日韩 亚洲 欧美| 国内av免费观看| 蜜臀久久精品久久久用户群体| 日韩福利片在线观看| 青青草精品视频| 欧美香蕉大胸在线视频观看| 久久国产精品久久久久久久久久 | 欧美三级电影网站| 永久免费毛片在线播放不卡| 精品国产乱码久久久久| 久久国产精品视频在线观看| 肉色超薄丝袜脚交69xx图片| 国产精品福利电影| 亚洲色图一区二区| 欧美精品久久久久久久久老牛影院| 久久av中文字幕| 日韩电影天堂视频一区二区| 大尺度做爰床戏呻吟舒畅| 丰满人妻一区二区三区四区53| 亚洲精品视频免费看| 欧美成人精品在线播放| 国产精品免费观看高清| 中文字幕精品视频在线| 中文字幕日韩国产| 亚洲综合在线第一页| 欧美精品久久久久久久免费观看| www.xxx麻豆| 欧美被狂躁喷白浆精品| 久久蜜臀中文字幕| 亚洲第一免费网站| 在线看视频不卡| 正在播放国产对白害羞| 不卡欧美aaaaa| 色噜噜国产精品视频一区二区| 日韩欧美精品一区二区三区经典| 黄色av片三级三级三级免费看| 精品一区二区在线看| 欧美成人精品福利| 亚洲一区二区三区在线观看视频| 欧美黑吊大战白妞| 亚洲国产婷婷综合在线精品| 欧美激情18p| 中文字幕第22页| 国产一区二区影院| 亚洲精品久久久一区二区三区| www.黄色网址.com| 日韩在线观看视频一区| 欧美视频中文字幕| 亚洲蜜桃av| 免费视频网站在线观看入口| 伊人婷婷欧美激情| 亚洲直播在线一区| 欧美性猛交bbbbb精品| 在线日韩一区二区| 国产亚洲一区在线播放| 久久精品一区二区三区四区五区 | 亚洲国产欧美一区二区三区同亚洲| 欧美性猛交内射兽交老熟妇| 99精品视频免费看| 日韩精品视频免费专区在线播放| 亚洲 中文字幕 日韩 无码| 秋霞av鲁丝片一区二区| 在线性视频日韩欧美| 亚洲少妇18p| 成人av网站免费观看| 国产精品久久网| 极品国产91在线网站| 亚洲成人精品视频| 欧美专区第二页| 亚洲综合色视频| 美乳视频一区二区| 老**午夜毛片一区二区三区 | 九九热视频在线免费观看| 色综合网色综合| 欧在线一二三四区| 国产 欧美在线| 国产精品美女黄网| 五月婷婷开心中文字幕| 日韩中文字幕国产| 久草视频手机在线| 精品少妇一区二区三区| 人妻精油按摩bd高清中文字幕| 国产激情视频一区二区三区欧美| 久久久久久av| www欧美在线| 亚洲人成五月天| 在线精品视频播放| 色婷婷亚洲精品| 亚洲男人天堂av在线| 婷婷国产v国产偷v亚洲高清| 人禽交欧美网站免费| 久久91精品国产91久久小草| 国产精品午夜一区二区欲梦| 一级特黄aa大片| 欧美自拍视频在线观看| 国产内射老熟女aaaa∵| 国产国语videosex另类| 久久不卡免费视频| 欧美成人精品xxx| 在线免费看av片| 国产福利视频一区二区| 99久久精品日本一区二区免费| 国内精品一区二区三区| 中文字幕在线播放不卡| 国产成人一区二区| 中文永久免费观看| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 国产婷婷97碰碰久久人人蜜臀| 偷偷色噜狠狠狠狠的777米奇| 欧美蜜桃一区二区三区| 特级西西www444人体聚色| 亚洲国产日韩精品在线| 国产精品一区二区亚洲| 在线免费看av不卡| 久久网免费视频| 欧美久久久精品| 久久久国产精品成人免费| 色噜噜狠狠狠综合曰曰曰| 免费在线一级片| 日本一区二区在线免费播放| 日韩经典一区二区| 免费国产成人看片在线| 懂色av一区二区三区蜜臀| 亚洲一区二区免费| 麻豆精品在线看| 日韩国产伦理| 中文字幕精品三区| 一区二区三区四区国产| 午夜精品视频一区| 中文字幕 欧美 日韩| 日韩精品一区二区三区视频播放| 欧美日韩精品在线观看视频| 欧美一级高清免费播放| 久久99国产精品久久| 欧美日韩在线中文| 亚洲国产精品嫩草影院久久| 青青青国产在线| 国产精品久久91| 成人教育av在线| 在线精品一区二区三区| 亚洲天堂免费视频| 另类综合日韩欧美亚洲| 国产欧美日韩综合精品二区| 久久久天堂av| 男人舔女人下部高潮全视频| 欧美在线一级va免费观看| 性xxxfllreexxx少妇| 日韩 欧美 高清| 正在播放亚洲1区| 蜜臀国产一区二区三区在线播放| 中文字幕精品一区日韩| 欧美精品一区二区久久久| 99热99这里只有精品| 国产一区精品视频| 悠悠色在线精品| 国产特黄一级片|