久久婷婷五月综合色国产香蕉,樱花草www在线,国产99久久精品一区二区永久免费 -->

OpenAI o1式思維鏈,開源模型也可以有,成功案例來了

更多場景

2024年09月18日

鏈接已復制

  北京時間9月13日午夜,OpenAI發布了推理性能強大的 ο1系列模型。之后,各路研究者一直在嘗試挖掘 ο1卓越性能背后的技術并嘗試復現它。當然,OpenAI 也想了一些方法來抑制窺探,比如有多名用戶聲稱曾試圖誘導 ο1模型公布其思維過程,然后收到了 OpenAI 的封號威脅。

  盡管如此,不過三四天時間,就已經有研究者宣稱已經成功復現/開發出了與 ο1性能差不多的推理技術,并且還不止一個!

  Llamaberry:教會 AI 像聰明人一樣思考

  Llamaberry 的提出者是 Martin Bowling。他開發的項目包括 RAGMiner.dev 和 Replit;其中前者可以幫助用戶毫不費力地將網站轉換成 Markdown、XML 或 JSON 等格式以便 RAG 和 LLM 應用使用,而后者則是一個使用 AI 將想法變成代碼的項目。

  Llamaberry 的核心思路是使用思維鏈(CoT)來實現推理。這個名字自然源自代表 o1模型的 Strawberry(草莓)。

  什么是思維鏈?Bowling 在博客中打了個比方:「思維鏈推理就像是給 AI 一個筆記本來展示其工作過程。其中不僅僅是簡單地給出答案,而是會帶領我們經歷其思維過程。」

  Llamaberry 能教會 AI 透徹地思考,就像是一位人類專家攻克難題時那樣。

  具體來說,Llamaberry 是一個多輪思維鏈推理系統的實現,其基于運行在 Groq 上的 Llama3.170B 模型。

  多輪推理是關鍵

  多輪推理,顧名思義,就是讓模型在給出答案之前進行多步思考,而不是一步給出答案。打個比方,這就像是看一位大廚從備菜到完成擺盤一步步地完成一道精美菜肴,而不是直接微波加熱預制菜。

  舉個示例:

  第1輪:AI 先嘗試解決當前問題。

  第2輪:AI 回顧第一次嘗試并盡力改進或優化其思維過程。

  第3輪:再進行一輪反思和改進。

  綜合結果:最后,將所有這些思考綜合到一起,得到一個連貫且合理的答案。

  下面展示了這個多輪過程的示意圖:

  可以看到,前一輪的輸出會成為后一輪的輸入,從而讓 AI 可在每個階段不斷完善其思維。最后,所有這些思考會凝練成一個合理的最終答案。就像看著一枚莓果逐漸成熟!

  如何實現

  下面將深入 Llamaberry 的實現細節。

  1.設置舞臺

  首先,我們需要為 AI 助手設置一些基本規則,代碼如下:

  initial_system_prompt="""YouareanAIassistantcapableofdetailed,step-by-stepthinking.Whenpresentedwithaquestionorproblem,breakdownyourthoughtprocessintoclear,logicalsteps.Foreachstep,explainyourreasoning.Concludewithafinalanswer.Usethefollowingmarkdownstructure:

  這就是提供給 AI 大廚的菜譜。它知道需要逐步分解其思考過程并解釋每個步驟,并且以 Markdown 格式將它們顯示出來。

  2.思考過程

  在每一輪推理中,都需要讓 AI 對問題進行思考。但在第一輪結束后,還需要求它思考之前已經思考過的東西。這就像問朋友,「嘿,還記得你之前說過什么嗎?讓我們再想一想。」

  下面是每一輪的生成方式:

  asyncdefgenerate_turn(query:str,previous_turns:list=None)->str:

  該函數是多輪推理的核心。它決定我們是在第一輪還是在后續輪,并以此構建提示詞。對于后續輪,它會將之前所有推理輪都包含在上下文中,讓 AI 可以基于之前的思考進行構建。

  3.綜合結果

  經過三輪思考之后,再讓 AI 檢視其所有思考并得出一個合理的最終答案。這就像是讓專家討論問題,然后編寫最終報告。

  asyncdefsynthesize_turns(query:str,turns:list)->str:turns_text="\n\n".join([f"Turn{i+1}:\n{turn}"fori,turninenumerate(turns)])messages=[{"role":"system","content":synthesis_prompt},{"role":"user","content":f"OriginalQuery:{query}\n\nTurnsofReasoning:\n{turns_text}"}]returnawaitcall_llm(messages)

  這個綜合步驟至關重要,是 AI 綜合所有思考內容凝練出最終答案的一步。

  單輪推理 vs 多輪推理

  Martin Bowling 在其博客中簡單比較了單輪和多輪推理。

  這里他采用了一個簡單示例,即詢問 AI:「人工智能對就業市場有什么潛在影響?」

  單輪推理:

  AI:Artificialintelligencewilllikelyhavesignificantimpactsonthejobmarket,including:

  使用 Llamaberry 執行多輪推理:

  第1輪:

  AI:Let'sapproachthisstep-by-step:

  第2輪:

  AI:Let'srefineourthinking:

  第3輪:

  AI:Let'sdelvedeeper:

  綜合答案:

  AI:Aftercarefulconsiderationacrossmultipleturnsofreasoning,wecansynthesizeourthoughtsonthepotentialimpactsofartificialintelligenceonthejobmarket:

  可以看到,多輪方法能實現更加精細、全面的分析。這能從多個角度考慮問題,優化其思考,最后得到更加深思熟慮和全面詳細的答案。

  Bowling 表示,這樣的多輪推理在思考深度、自我提升、透明度、靈活性等方面都有巨大優勢,同時其還采用了 Markdown 格式,使其結果更容易閱讀和用于后續流程。

  因此,這種技術可讓 AI 進入更多實際應用場景,比如醫療診斷、法律分析、科學研究、商業策略、教育。當然,在使用 Llamaberry 等多輪推理系統時,也需要注意它們的局限和潛在的道德倫理問題,比如偏見、計算成本、過度依賴和隱私問題。

  如何使用 Llamaberry?

  Llamaberry 也很容易使用,點擊幾下就能擁有你自己的多輪推理系統。步驟如下:

  前往 Replit,點擊該鏈接獲取 Llamaberry 模板:https://replit.com/@MartinBowling/Llamaberry-Powered-By-Groq?v=1

  創建模板分支:點擊 Fork 按鈕創建你自己的 Llamaberry 項目副本。

  獲取你的 Groq API Key:注冊 Groq 賬戶,獲取 API Key。

  設置環境:在你的分支 Replit 項目中,找到「Secrets」選項卡。添加一個新密鑰,密鑰為 GROQ_API_KEY,值是你的 Groq API 密鑰。

  運行項目:單擊 Replit 界面頂部的 Run 按鈕。這將啟動 Llamaberry 應用。

  開始實驗:應用運行起來后,你將看到一個 Gradio 界面。你可以在其中輸入問題并查看 Llamaberry 多輪推理的實際效果!并且輸出是簡潔漂亮的 Markdown 格式!

  了解了 Llamaberry,下面來看另一個號稱實現了類 o1推理鏈的項目:g1。

  g1:實現類似 ο1的推理鏈

  g1這個項目來自 Benjamin Klieger,他是 Groq 的一位研究者。也因此,g1同樣基于 Groq,并且其也使用了 Llama3.170b 模型。

  不同于 Llamaberry 使用的多輪思維鏈推理,g1的策略是角色扮演、思維鏈提示 、格式化以及另一些提示技巧。并且,g1開源了。

  開發者宣稱 g1有70% 的時間能成功數出 Strawberry 中有多少個 R,同時無需任何微調或少樣本技術。下面是其一次執行過程:

  開發者 Klieger 表示,g1和 ο1一樣能讓 LLM 有能力「思考」和解決之前的領先模型難以應對的邏輯問題。但不同之處在于,g1會大方地展示所有推理 token。同時,他也強調了 g1和 ο1在技術上的差異,其中后者使用了大規模強化學習來執行思維鏈推理。而 g1則是通過發掘提示詞工程的潛力來幫助 LLM 解決簡單的邏輯問題,讓現有的開源模型也能受益于動態推理鏈和優化般的探索界面。

  g1的工作方式

  由 Llama3.170b 支持的 g1會創建一種動態的思維鏈。

  在每個步驟中,LLM 可以選擇是繼續進行另一個推理步驟,還是提供最終答案。每個步驟都有標題,并且對用戶可見。

  系統提示詞中還會包含給 LLM 的提示。其提示策略如下:

  YouareanexpertAIassistantthatexplainsyourreasoningstepbystep.Foreachstep,provideatitlethatdescribeswhatyou'redoinginthatstep,alongwiththecontent.Decideifyouneedanothersteporifyou'rereadytogivethefinalanswer.RespondinJSONformatwith'title','content',and'next_action'(either'continue'or'final_answer')keys.USEASMANYREASONINGSTEPSASPOSSIBLE.ATLEAST3.BEAWAREOFYOURLIMITATIONSASANLLMANDWHATYOUCANANDCANNOTDO.INYOURREASONING,INCLUDEEXPLORATIONOFALTERNATIVEANSWERS.CONSIDERYOUMAYBEWRONG,ANDIFYOUAREWRONGINYOURREASONING,WHEREITWOULDBE.FULLYTESTALLOTHERPOSSIBILITIES.YOUCANBEWRONG.WHENYOUSAYYOUARERE-EXAMINING,ACTUALLYRE-EXAMINE,ANDUSEANOTHERAPPROACHTODOSO.DONOTJUSTSAYYOUARERE-EXAMINING.USEATLEAST3METHO***ODERIVETHEANSWER.USEBESTPRACTICES.

  對這些提示詞的詳細解釋請參閱原項目的 Prompt Breakdown 一節。這里就不贅述了,僅給出幾個示例,比如可以在提示詞中加入「include exploration of alternative answers」(探索其它答案)和「use at least3methods to derive the answer」(使用至少三種方法來得出答案)。

  這樣一來,通過組合思維鏈以及嘗試多種方法、探索其它答案、質疑之前草擬的解答、考慮 LLM 的局限性等策略,就能顯著提升 LLM 的推理能力。

  在數 Strawberry 中有多少個 R 這個經典問題上,無需任何訓練,g1就能幫助 Llama3.170b 達到約70% 的準確度(n=10, How many Rs are in strawberry?)。而如果不使用提示技術,Llama3.170b 的準確率為0%,ChatGPT-4o 的也只有30%。

  下面展示了另一個示例:0.9和0.11哪個更大?

  詳細的安裝過程和代碼請參閱原項目。

  最后,順便一提,另有開發者發布了 g1的分支版 Mult1,該版本的一大改進是可使用多個 AI 提供商來創建類似 o1的推理鏈

海報生成中...

+1

來源:機器之心公眾號

延展資訊

最新新聞

熱門新聞

久久精品99北条麻妃| 亚洲自拍偷拍av| 欧美无砖砖区免费| 免费看又黄又无码的网站| 中文字幕免费高清视频| 成人在线免费在线观看| 日本黄色片免费观看| 免费黄网站欧美| 2023国产精品自拍| 亚洲欧洲成人在线| 亚洲免费大片在线观看| 亚洲精品视频播放| 911美女片黄在线观看游戏| 精品中文字幕一区二区| 91精品国模一区二区三区| 三级在线免费观看| 99久免费精品视频在线观看| 欧美一区二区色| 日本xxxxx18| 色婷婷综合久久久久中文字幕| 日本免费a视频| 粉嫩av懂色av蜜臀av分享| 国产精品高潮呻吟AV无码| 2021国产视频| 成人情趣片在线观看免费| 亚洲国产婷婷香蕉久久久久久| 色系网站成人免费| 欧美在线一区二区三区四区| 欧美不卡在线一区二区三区| 成人精品在线观看视频| 韩国av一区二区三区四区| 日韩av免费在线| 国产婷婷色一区二区在线观看| 色菇凉天天综合网| 日韩av毛片网| 黄色成人在线免费观看| 国产不卡的av| 精品国产无码一区二区| 国产精品怡红院| 性高潮免费视频| 视频免费1区二区三区| 国产主播在线看| 国产日韩免费视频| 欧美精品日韩精品| 国产精品露脸自拍| 手机在线看福利| 综合久久久久久久| 97人妻精品一区二区三区免费| 亚洲精品久久久久久久久久| 成人久久久久爱| 久久艹这里只有精品| 日韩中文字幕免费观看| 亚洲精品乱码久久久久久| 久久久成人精品| 五月婷婷丁香色| 亚洲精品日韩成人| 亚洲精品无人区| 久久久www免费人成黑人精品| 日韩中文字幕在线精品| 爱爱爱视频网站| 欧美成人国产精品一区二区| 成人精品电影在线观看| 欧美美女18p| 中国黄色片一级| 欧美性大战久久久久久久蜜臀| 综合五月激情网| 国产+人+亚洲| 国产丰满美女做爰| 91黄色免费版| 国产伦精品一区二区三区照片 | 伊人影院综合在线| 黄色激情在线观看| 亚洲精品911| 国产成人精品综合| 日韩欧美a级片| 亚洲影院理伦片| 国产一区二区在线观看免费播放| 永久免费毛片在线观看| 麻豆成人免费视频| 欧美激情视频网站| 日韩福利片在线观看| 国产亚洲一区精品| 羞羞色院91蜜桃| 91精品国产91综合久久蜜臀| 成人疯狂猛交xxx| 丰满少妇一区二区| 1000部国产精品成人观看| 九九热视频这里只有精品| 日韩一区二区三区xxxx| 成人午夜激情免费视频| 97中文字幕在线| 国产午夜手机精彩视频| 久久亚洲精品视频| 久久久久久久久久久久国产| 欧美亚一区二区| 色欲无码人妻久久精品| 美女av一区二区三区| 老鸭窝一区二区久久精品| 国产精品-区区久久久狼| 一区二区在线观看免费视频播放| 欧美性天天影院| 精品人妻一区二区三区蜜桃| 亚洲高清久久网| 亚洲欧美日本一区| 国产麻豆精品95视频| 亚洲乱码中文字幕综合| 最近中文字幕日韩精品 | 一区二区三区无码高清视频| 三级网站在线免费观看| 91成人免费在线| 日本xxx在线播放| 96av麻豆蜜桃一区二区| 日韩中文字幕在线不卡| 一区二区三区久久久| 99久久精品久久亚洲精品| 91亚洲精品在线| 亚洲成a人片在线观看中文| 在线天堂www在线国语对白| 欧美性黄网官网| 国产精品69久久久| 久久综合久久久久88| 国产另类自拍| 国产在线视频精品一区| 欧美日韩一区二区欧美激情 | 国产精品啪视频| 搡老熟女老女人一区二区| 亚洲精品电影网| 中国精品一区二区| 久久91精品国产91久久跳| www.香蕉视频| 亚洲欧美日本一区二区| 国产精品看片资源| 日韩成人xxxx| 国产视频一区在线播放| 国产熟女一区二区三区五月婷 | 91.com视频| 这里只有精品在线观看视频 | 日韩 中文字幕| 另类综合日韩欧美亚洲| 久久久999精品免费| 国产一精品一aⅴ一免费| 99久久99久久免费精品蜜臀| 下面一进一出好爽视频| 欧美成人全部免费| 亚洲天堂一区在线观看| 欧美亚州在线观看| 欧美在线色视频| 国产视频手机在线观看| 奇米影视亚洲色图| 色婷婷精品久久二区二区蜜臀av| 在线观看亚洲免费视频| 亚洲欧美日韩图片| 天堂av中文字幕| 91淫黄看大片| 免费人成在线不卡| 国产97在线|日韩| 亚洲第一网站在线观看| 日韩在线中文字| 国产精彩视频在线| 久久99精品久久久久久久久久| 色噜噜久久综合| 一本在线免费视频| 国产精品扒开腿做爽爽爽男男| 欧美日本一道本| 国产精品一区二区在线看| 91杏吧porn蝌蚪| 欧洲日韩成人av| 亚洲第一福利一区| 福利电影一区二区| 午夜免费一区二区| 欧美亚洲国产一区二区三区 | 亚洲精品成人av| www天堂在线| 影音先锋在线亚洲| 99riav久久精品riav| 东北少妇不带套对白| 中文字幕在线成人| 日韩一卡二卡三卡| 久久久久久不卡| 国产白丝袜美女久久久久| 日本电影亚洲天堂| 中文字幕免费观看| 日本一本中文字幕| 国产精品视频最多的网站| 欧美精品久久99久久在免费线| 国产精品国产三级国产普通话蜜臀| 成人精品高清在线| 97久久人国产精品婷婷| 欧美福利在线观看| 久久久久久久久久久黄色| 一区二区三区视频在线观看免费| 中文字幕日韩在线播放| 久久久久久久电影| 久久精品人妻一区二区三区| 国产不卡视频在线| 亚洲成a人片在线观看中文| 麻豆中文一区二区| 天天综合网在线观看| 性欧美13一14内谢| 国产又爽又黄ai换脸| 国产精品欧美一区二区三区奶水| 精品久久久久中文慕人妻| 性高潮久久久久久| 免费在线观看毛片网站| 国产精品成人在线| 欧美videossex极品| 国产精品中文字幕在线| 久久综合国产精品| 91人妻一区二区| 欧美成人精品激情在线观看| 久久一区亚洲| 少妇av一区二区三区无码| 日韩精品一区二区三区视频播放| 一级一级黄色片| 日韩av影视| 欧美美女一区二区在线观看| www.五月婷婷.com| 在线观看精品视频| 日韩你懂的在线播放| www.四虎在线观看| 免费无码不卡视频在线观看| 亚洲精品97久久| 亚洲av毛片成人精品| 成人中文字幕av| 精品国产一区二区三区在线观看| 国产美女精品在线| 日本女人性视频| 日本精品一区二区三区在线播放视频 | 男人天堂资源网| 91情侣偷在线精品国产| 亚洲综合激情另类小说区| 久久综合成人网| 欧美性大战久久久久| 91精品欧美久久久久久动漫 | 久久久精品五月天| 天天综合网日韩| 国内精品久久影院| 亚洲视频在线观看三级| 日本少妇毛茸茸高潮| 日韩精品国内| 亚洲成人av片| 另类小说综合欧美亚洲| 精品无码在线视频| www.成人av| 日韩一区二区三区免费看| 日韩vs国产vs欧美| 欧美无人区码suv| 999日本视频| 6080国产精品一区二区| 蜜臀久久99精品久久久画质超高清 | 中文字幕亚洲成人| 国产91精品看黄网站在线观看| 成人av在线不卡| 久久久精品欧美| 国产精品久久久久久久久免费桃花 | 日本亚洲精品在线观看| 亚洲午夜电影网| 国产丝袜视频在线观看| 一区二区三区 日韩| 国产精品福利在线观看| 欧美在线一区二区三区| 日韩av中文字幕一区二区三区| 国产国语性生话播放| 久久riav| 中文字幕视频在线免费欧美日韩综合在线看| 波多野结衣中文一区| 国产精彩视频在线| 91视频 -- 69xx| 国产精品99久久久久久久久久久久| 精品久久久久久中文字幕大豆网| 欧美性受xxxx狂喷水| 亚洲精品理论片| 亚洲精品美女久久7777777| 色999日韩欧美国产| 亚洲美女视频在线| 后入内射欧美99二区视频| 国产激情第一页| 少妇免费毛片久久久久久久久| 色七七影院综合| 亚洲一区免费观看| 日韩在线卡一卡二| 91视频青青草| 男人天堂999| 91系列在线播放| 亚洲美女激情视频| 一区二区三区视频在线看| 狠狠躁日日躁夜夜躁av| 人与嘼交av免费| 欧美亚洲日本一区二区三区 | 久久99久久久久久久噜噜| 精品国产1区2区| 国产久卡久卡久卡久卡视频精品| 精品无码人妻一区二区三区| 久草福利视频在线| 国产在线一区二区三区欧美| 国产一区二区三区在线看| 亚洲va国产va欧美va观看| 国产真实乱对白精彩久久| 天堂网中文字幕| 中文字幕一区二区久久人妻网站 | 国产精品色在线| 99国产在线播放| 波多野结衣家庭教师在线观看 | 国产亚洲欧美一级| 少妇人妻精品一区二区三区| 日韩女优一区二区| caoporm在线视频| 亚洲自拍偷拍二区| 国产欧美va欧美va香蕉在| 亚洲欧洲日产国码av系列天堂| 一区二区在线观看视频| 国产精品一级片在线观看| 国产又黄又爽视频| 2017亚洲天堂| 久久精品国产99久久99久久久| 一区高清视频| 亚洲一区二区三区四区在线播放| 色偷偷偷亚洲综合网另类 | 亚洲成人激情av| 成人在线视频一区| 欧美一区二区黄片| 亚洲婷婷综合网| 国产在视频线精品视频| 1314成人网| 欧美视频在线观看网站| 欧美日韩三区四区| 国产成人在线亚洲欧美| 综合网日日天干夜夜久久| 欧美精品在线一区二区三区| 亚洲日本va在线观看| 成人国产视频在线观看| 久久久久久黄| 一区二区三区免费在线| 国产一级理论片| 亚洲国产天堂av| 师生出轨h灌满了1v1| 情侣黄网站免费看| 综合一区中文字幕| 免费看国产精品一二区视频| 国产剧情久久久久久| 欧美精品激情在线观看| 国产亚洲日本欧美韩国| 精品国产一区二区三区久久影院 | 美女被爆操网站| 黄色片视频在线播放| 天堂а√在线中文在线| 亚洲国产一区二区三区在线播| 爱情岛论坛亚洲入口| 国产精品青青在线观看爽香蕉| 欧美精品在线网站| 国产亚洲a∨片在线观看| 亚洲国产精彩中文乱码av| 欧美丰满少妇xxxxx高潮对白| 精品国产91久久久久久| 一区二区三区鲁丝不卡| 自拍偷拍亚洲综合| 国产精品久久久久久久久果冻传媒 | 久久国产精品露脸对白| 日韩中文字幕区一区有砖一区 | 日韩精品一二区| 日韩在线视频第一页| 亚洲精品字幕在线| 六月婷婷中文字幕| 日本精品一区二区在线观看| 丁香花免费高清完整在线播放| www.五月天激情| 日韩专区第一页| 久久亚洲欧美| 久久伊人亚洲| 麻豆精品久久久| 国产v日产∨综合v精品视频| 国产91丝袜在线播放0| 粉嫩aⅴ一区二区三区四区五区| 粉嫩高潮美女一区二区三区| 成人不卡免费av| 久久精品人人做人人爽人人| 国产精品视频九色porn| 亚洲精品视频一区二区| 精品久久久久久久久久| 欧美亚洲自拍偷拍| 日韩精品中文字幕一区| 日韩电影中文字幕| 这里只有视频精品| 久久久久久国产免费| 日本精品视频在线| 91精品视频免费观看| 久久99久久精品国产| 中文字幕日韩一区二区三区不卡| 日韩久久久久久久久久久久| 激情婷婷综合网| 无码人妻丰满熟妇区毛片蜜桃精品 | 亚洲人成在线一二| 久久久精品国产亚洲| 91成品人片a无限观看| 成人欧美一区二区三区在线| 国产精品.com| 99热这里只有精品7| 久久精品免费网站| 在线免费观看污视频| 91制片厂在线| 午夜一级黄色片| 日产国产欧美视频一区精品 | 日韩国产精品久久久| av网站一区二区三区| 亚洲二区在线视频| 精品欧美久久久| 久久久久久久久中文字幕| 成人区精品一区二区| 台湾无码一区二区| 亚洲熟女乱综合一区二区|