国产丝袜美腿一区二区三区,老牛嫩草一区二区三区日本,a级高清视频欧美日韩 -->

下載次數破39萬,CMU、Meta聯合發布VQAScore文生圖優化方案:Imagen3已采用

更多場景

2024年11月07日

鏈接已復制

  VQAScore是一個利用視覺問答模型來評估由文本提示生成的圖像質量的新方法;GenAI-Bench是一個包含復雜文本提示的基準測試集,用于挑戰和提升現有的圖像生成模型。兩個工具可以幫助研究人員自動評估AI模型的性能,還能通過選擇最佳候選圖像來實際改善生成的圖像。

  近年來,生成式人工智能(AIGC)引發廣泛關注。Midjourney、Imagen3、Stable Diffusion和Sora等模型能夠根據自然語言提示詞生成美觀且逼真的圖像和視頻,廣受用戶喜愛。

  然而,這些模型在處理復雜的提示詞時仍存在不足。例如,當讓Stable Diffusion或Midjourney生成「棕色的狗繞著一棵樹追黑色的狗」時,模型可能會錯誤生成兩只黑狗,或將「追逐」誤解為兩只狗在「玩耍」。

  有什么辦法可以自動發現這些模型的不足,并進一步提升它們呢?

  為解決這一問題,CMU和Meta團隊聯合推出了全新的評估指標VQAScore及基準GenAI-Bench,用于自動評估圖像、視頻和3D生成模型在復雜提示詞下的表現。

  這些成果已在ECCV和CVPR等頂會上發表,并被谷歌DeepMind用于評估其最新的Imagen3模型,被譽為當前文生圖領域超越CLIP等模型的最佳評估方案!

  背景介紹

  近年來,文生圖模型(如DALL-E3、Imagen3、Sora等)發展迅速,但如何準確評估這些模型的表現仍是一個關鍵問題。

  盡管許多公司采用人類評估(Human Evaluation)來提升結果的準確性,但這種方式成本高、難以大規模應用,而且缺乏可復現性。

  在圖片生成領域,已有多種方法使用模型來自動評估(Automated Evaluation)生成圖像的表現,其中常見的指標包括CLIPScore、FID、LPIPS、PickScore、ImageReward和HPSv2等。

  然而,這些指標真的足夠好嗎?

  現有自動化指標的不足

  在評估兩張圖片的相似性(similarity)時,傳統指標LPIPS等方法依靠預訓練的圖像編碼器,將圖像特征嵌入后再計算距離。然而,這類方法只能評估圖像與圖像之間的相似度(image-to-image metric),而無法判斷文本和圖像之間的相似度(text-to-image metric)。

  為了解決這一問題,當前主流的文生圖評估采用了CLIPScore,通過獨立的圖像編碼器和文本編碼器,將圖像和文本嵌入到同一特征空間,并通過計算特征相似度來判斷它們的匹配程度。

  然而,CLIPScore存在嚴重的「bag-of-words」問題:也就是說,CLIP在處理文本時可能忽略詞序,混淆像「月亮在牛上面」和「牛在月亮上面」這樣的句子。這使得模型難以準確抓住復雜文本中的關鍵信息。

  為了解決這一問題,CMU和Meta的研究團隊提出了VQAScore,采用更強大的生成式VQA模型(如GPT-4o)來更準確地評估文生圖模型:

  VQAScore:一種簡單有效的評估指標

  研究團隊基于GPT-4o等用于視覺問答(VQA)任務的生成式視覺語言模型,將圖像與提示詞之間的相似度定義為模型在回答「這個圖像是否顯示了[提示詞]?請回答是或否。」時給出「是」(Yes)答案的概率:

  例如,在計算某張圖像與提示詞「牛在月亮上面」之間的相似度時,VQAScore會將圖像和問題「這個圖像是否顯示了『牛在月亮上面』?請回答是或否。」輸入模型,并返回模型選擇「是」的概率。

  另外,研究團隊發現,當前主流的VQA模型(如LLaVA-1.5)使用了具備單向(auto-regressive)注意力機制的語言模型(如Llama)。這種機制導致模型在提取圖像特征時,無法提前獲取提示詞的完整信息。

  為了更有效的提取視覺特征,研究團隊使用開源數據訓練了一個更強的CLIP-FlanT5VQA模型。該模型采用了具備雙向注意力機制的語言模型FlanT5,使得圖像特征提取能夠根據輸入的提示詞動態調整。

  研究表明,這一機制在提升VQA模型對復雜提示詞的理解方面效果顯著。

  VQAScore比主流評估指標更簡單高效。許多傳統指標依賴大量人類標注(如 ImageReward、PickScore)或私有模型(如GPT-4Vision)才能取得好表現。

  相比之下,VQAScore具備以下核心優勢:

  1. 無需人類標注:VQAScore能直接利用現有的VQA模型取得優異表現,無需在人工標注數據上進行額外微調。

  2. 分數更精準:使用GPT-4給圖片打分(如在0到100之間打分)時,模型往往會隨意給出高分(如90),而忽略圖片的真實質量。相比之下,VQAScore使用概率值來判斷圖片與提示詞的相似度,結果更加精確。

  VQAScore實驗結果

  研究人員在大量復雜圖文匹配基準(如Winoground和EqBen)以及文生圖評估基準(如Pick-a-pic和TIFA160)上對VQAScore進行了測試。

  結果顯示,VQAScore在所有圖像、視頻和3D生成任務的基準上超越了CLIPScore等流行指標,取得了最佳表現。

  值得注意的是,VQAScore采用了開源模型(CLIP-FlanT5),卻仍大幅超越了使用更強閉源模型(如PALI-17B和GPT-4)的方法(如VQ2、ViperGPT 等)。

  此外,VQAScore也超越了依賴提示分解進行視覺推理的先進方法(如 CVPR'23最佳論文Visual Programming和ViperGPT等),進一步驗證了端到端評估方案的有效性。

  最新的谷歌DeepMind Imagen3報告還指出,使用更強大的VQA模型(如 Gemini)可以進一步提升VQAScore的表現,凸顯了其在未來生成式模型評測中的潛力。

  GenAI-Bench:由設計師收集的高難度文生圖基準

  為了更好地評估文生圖模型及其評估指標的性能,研究團隊推出了GenAI-Bench。該基準包含1600個由設計師收集的復雜提示詞,覆蓋了10種生成模型(如DALL-E3、Midjourney、SDXL等),并配有超過80,000條人工標注。

  GenAI-Bench相比較之前的基準有以下優勢:

  1. 更具挑戰性:研究表明,大多數文生圖/視頻模型在GenAI-Bench上表現仍有不足,還有大量的提升空間。

  2. 避免空洞詞匯:所有提示詞均經過嚴格篩選,避免使用假大空的詞語,確保評估更具客觀性。

  3. 細粒度技能分析:GenAI-Bench能提供更細致的技能分類和分析,幫助研究人員深入了解模型在不同能力上的具體表現。

  GenAI-Rank:用VQAScore來提升文生圖表現

  研究人員構建了一個新的GenAI-Rank基準,為每個提示詞使用DALL-E3和Stable Diffusion(SD-XL)生成3到9張候選圖像。

  研究表明,從這些候選圖像中返回VQAScore得分最高的圖像,可以顯著提升文生圖模型的效果。

  這一方法無需微調生成模型本身,因此也能優化(黑箱)私有模型,如DALL-E3。

  實驗結果進一步證明,VQAScore在圖像排序上比其他方法(如CLIPScore、PickScore等)更加有效。

  結語

  VQAScore和GenAI-Bench為文生圖模型提供了更精準且全面的評估,已被Imagen3、VILA-U、RankDPO等多個項目用于更好地評估和優化最新的生成式模型。研究團隊已開源代碼和數據集,期待未來更多探索與進展!

  團隊介紹

  團隊的一作林之秋(Zhiqiu Lin)是卡內基梅隆大學的博士研究生,由Deva Ramanan教授指導,專注于視覺-語言大模型的自動評估與優化。Zhiqiu Lin在CVPR、NeurIPS、ICML、ECCV等頂級會議上發表了十數篇論文,并曾榮獲最佳論文提名和最佳短論文獎等。其研究成果在生成模型和多模態學習領域受到了學術界和工業界的廣泛認可。

  Pengchuan Zhang是Meta AI(原Facebook AI研究院)的人工智能研究科學家,曾在微軟研究院擔任高級研究科學家。他的研究領域主要集中在深度學習、計算機視覺和多模態模型等方向,曾發表多項具有深遠影響力的成果,例如AttnGAN、OSCAR、VinVL、Florence和GLIP等。他在頂級會議如CVPR、ICCV、NeurIPS等發表了大量高影響力論文,是計算機視覺和多模態模型領域的領軍人物之一。

  Deva Ramanan教授是計算機視覺領域的國際知名學者,現任卡內基梅隆大學教授。他的研究涵蓋計算機視覺、機器學習和人工智能領域,曾獲得多項頂級學術榮譽,包括2009年的David Marr獎、2010年的PASCAL VOC終身成就獎、2012年的IEEE PAMI青年研究員獎、2012年《大眾科學》評選的「十位杰出科學家」之一、2013年美國國家科學院Kavli Fellow、2018年和2024年的Longuet-Higgins獎,以及因其代表性工作(如COCO數據集)獲得的Koenderink獎。此外,他的論文在CVPR、ECCV和ICCV上多次獲得最佳論文提名及榮譽獎。他的研究成果對視覺識別、自動駕駛、和人機交互等應用產生了深遠影響,是該領域極具影響力的科學家之一。

海報生成中...

+1

來源:新智元公眾號

延展資訊

最新新聞

熱門新聞

日韩欧美美女一区二区三区| 亚洲一区尤物| 日韩在线a电影| 黄网站欧美内射| 亚洲午夜性刺激影院| 五月婷婷六月丁香综合| 少妇一晚三次一区二区三区| y97精品国产97久久久久久| 久久99久久99| 真人bbbbbbbbb毛片| 91在线观看免费网站| 在线观看成人免费视频| 日本高清视频免费观看| 日本一区二区在线视频观看| 欧美巨大另类极品videosbest | 男人天堂网视频| 日韩欧美第一区| 韩国视频一区二区| 五月婷婷综合在线观看| 99三级在线| 欧美喷潮久久久xxxxx| 理论片中文字幕| 欧美这里只有精品| 中文字幕久热精品视频在线| 亚洲精品乱码久久久久| 怡春院在线视频| 欧美激情精品久久久久久小说| 日韩av片免费在线观看| 日韩精品专区在线| 国产乱人伦偷精品视频免下载| 一起草最新网址| 91福利入口| 在线播放日韩专区| 国产精品国产自产拍高清av王其| 亚洲天堂网在线观看视频| 欧美大波大乳巨大乳| www.69av| 国产日韩精品久久| 欧美一区二区三区日韩| 国产精品色呦呦| 亚洲国产精彩视频| 久久久久久久国产视频| 无码国产精品一区二区免费式直播| 精品乱子伦一区二区三区| 国产精品电影观看| 久久精品国产欧美激情| 欧美性大战久久久| 国产欧美一区二区精品忘忧草| 狠狠人妻久久久久久| 视频这里只有精品| 国产三级三级看三级| 久久精品美女| 91精品视频专区| 欧美日韩国产91| 欧美高清videos高潮hd| 精品噜噜噜噜久久久久久久久试看| 99v久久综合狠狠综合久久| 国产三级av片| 欧美福利第一页| 登山的目的在线| 年下总裁被打光屁股sp | 久久精品国产理论片免费 | 国产a∨精品一区二区三区不卡| 亚洲第一精品福利| 亚洲美女在线看| 日韩欧美不卡在线观看视频| 欧美性欧美巨大黑白大战| 亚洲精品久久嫩草网站秘色| heyzo一本久久综合| www.日韩大片| 国产69精品久久777的优势| 国产精品白丝jk黑袜喷水| 国产一区二区毛片| 久久久久久黄色| av一区二区不卡| 久久综合久久鬼色| 国产欧美精品一区| 国产精品青草久久| 日韩欧美亚洲国产一区| 亚洲一区二区三区中文字幕在线| 亚洲国产成人自拍| 最新久久zyz资源站| 日韩人体视频一二区| 欧美日韩另类在线| 亚洲精品之草原avav久久| 欧美国产亚洲视频| 婷婷四房综合激情五月| av在线免费观看国产| 日韩精品视频一区二区| 大地资源二中文在线影视观看| 婷婷激情四射网| 最近中文字幕免费在线观看| 成人av在线播放网址| 一区二区三区在线观看欧美 | 91高清视频在线免费观看| 久久久精品一区| 久久久999国产| 国产精品12| 日韩精品一区中文字幕| a资源在线观看| 欧美国产精品一区| 天天爽夜夜爽夜夜爽| 中文字幕亚洲综合久久| 欧美xxxxx精品| 色一情一乱一乱一91av| 黄色成人在线播放| 在线观看视频亚洲| 国产精品丝袜一区二区三区| 亚洲一区影院| 超碰成人免费在线| 69精品无码成人久久久久久| 夜夜嗨aⅴ一区二区三区| 国产精品99久久久久久宅男| 久久免费电影网| 亚洲国产精品久久久久秋霞蜜臀 | 午夜探花在线观看| 国产又粗又硬又长又爽| 免费观看国产视频| 国产精品二三区| 色婷婷av一区二区三区在线观看| 日韩av影视| 国产精品精品软件男同| 国产精品第五页| 正在播放亚洲1区| 国产极品尤物在线| 伊人久久久久久久久久久久| 亚洲免费观看在线视频| 美女久久久久久久久久久| 男人添女人荫蒂免费视频| 91精品国产自产| 日本女人一区二区三区| 狠狠久久亚洲欧美专区| 66m—66摸成人免费视频| 黄色av免费在线播放| 黄色小视频免费观看| 精品污污网站免费看| 成人免费视频网址| 国产精品亚洲a| 亚洲av无码乱码国产精品| 日韩欧美在线免费观看| 国产九九精品视频| 日本黄色激情视频| 欧美性xxxx极品hd欧美风情| 国产精品福利网| 国产一二三四视频| 亚洲一区二区三区四区的| 国产精品第二页| 欧美日韩国产精品综合| 亚洲欧美一区二区三区国产精品| 欧美精品videos另类日本| 国产精品999.| 91一区一区三区| 成人黄色片在线| 日韩欧美性视频| 欧美日韩一区二区三区视频| 91成人在线观看喷潮教学| 国产99免费视频| 亚洲精品电影网在线观看| 高清不卡日本v二区在线| 国产在线观看免费视频今夜| 国产一区二区不卡老阿姨| 久久精视频免费在线久久完整在线看 | 91爱爱小视频k| 九九热这里有精品视频| 国产精品丝袜黑色高跟| 免费不卡亚洲欧美| 久久久国产高清| 欧美性淫爽ww久久久久无| 国产一区二区三区av在线| 国产三级三级在线观看| 日韩视频免费观看高清完整版| 国产偷人视频免费| 人人精品人人爱| 成人激情视频免费在线| 男女做爰猛烈刺激| 91精品国产全国免费观看| 精品视频免费在线播放| 久久精品一区二区三区不卡牛牛 | 亚洲精品国产综合区久久久久久久| 欧洲精品一区二区三区久久| 久久久久久久久一| 青青草综合视频| 国产亚洲欧洲997久久综合 | 日产国产欧美视频一区精品| 中文字幕久热精品视频在线| 国产无遮挡又黄又爽在线观看| 亚洲精品大尺度| 麻豆一区产品精品蜜桃的特点 | 日本视频一区二区不卡| 成人美女视频在线看| 宅男一区二区三区| 理论片日本一区| 永久久久久久| 中文字幕一区不卡| 国产精品一区二区小说| 欧美区在线观看| 国产午夜精品理论片| 精品精品欲导航| 国产一级二级在线观看| 欧美日韩视频不卡| 在线成人免费av| 91麻豆精品国产自产在线观看一区 | 99久久久久免费精品国产 | 欧美精品在线观看播放| 九一在线免费观看| 亚洲韩国青草视频| 波多野结衣电影在线播放| 超碰97国产在线| 国产精品一区二区无线| 欧美黑人经典片免费观看| 1024成人网| 国产成人精品无码免费看夜聊软件| 国产精品第2页| 日韩精品电影一区亚洲| 日韩精品无码一区二区三区| 一区二区欧美在线观看| 黄色片网站免费| 成人在线视频网址| 精品久久久久久久久久久久久久| 久久黄色免费视频| 日本a级片久久久| 精品福利av导航| 五月婷中文字幕| 男女激情免费视频| xxx成人少妇69| 中日韩av电影| 在线观看中文字幕码| 欧美日韩激情视频在线观看| 综合久久国产九一剧情麻豆| 91福利视频免费观看| 久久夜色精品国产欧美乱| 激情av综合网| 不许穿内裤随时挨c调教h苏绵| 亚洲激情视频在线| 久久精品综合| 红桃视频 国产| 国内精品小视频| 国产精品嫩草影院av蜜臀| 久久久久99精品成人片试看| 91久久精品久久国产性色也91| 亚洲伊人伊色伊影伊综合网| 欧美又粗又大又长| 九九九九久久久久| 欧美精品欧美精品系列| 久久视频一区| 国产乱了高清露脸对白| 国产区二精品视| 亚洲精品电影在线| 久久久精品国产免费观看同学| 波多野结衣一二三区| 极品校花啪啪激情久久| 亚洲伊人第一页| 日韩中文第一页| 一区二区三区在线观看欧美| 久久精品国产成人一区二区三区 | 欧美成年人视频| 日本欧美一区二区在线观看| 又粗又黑又大的吊av| 久久99久国产精品黄毛片入口| 国产成人福利片| 亚洲av无码不卡| 日本免费成人网| 国产精品精品久久久久久| 中文字幕一区三区| 又污又黄的网站| 真人bbbbbbbbb毛片| 亚洲精品成人久久久998| 国产91亚洲精品| 午夜激情一区二区三区| 国产伦精品一区二区三区视频青涩 | 色呦呦国产精品| 久久综合久久综合九色| 国产无遮挡又黄又爽又色| 亚洲小视频网站| 精品高清视频| 91成人精品网站| 欧美精三区欧美精三区| 亚洲精品第一国产综合野| 美女黄页在线观看| 老司机深夜福利网站| 丁香色欲久久久久久综合网| 91精品国产综合久久香蕉的用户体验| 亚洲成人午夜影院| 国产精品久久久久久久久久免费看| 人妖欧美一区二区| 国产成人精品亚洲男人的天堂| 奇米精品一区二区三区| 日韩一区国产在线观看| aa成人免费视频| 国产精品99一区| 中文字幕亚洲一区二区三区| 欧美日韩国产高清一区二区| 亚洲精品日日夜夜| 99re视频这里只有精品| 国产精品亚洲一区二区三区妖精 | 国产欧美精品一区aⅴ影院| 岛国精品一区二区| 色婷婷av一区二区三| 天堂资源在线播放| 久久久久亚洲av片无码下载蜜桃| 色噜噜噜噜噜噜| 国产人妻精品午夜福利免费| 精品蜜桃传媒| 国产精品日韩在线| 免费91麻豆精品国产自产在线观看| 久久精品国产免费观看| 97碰在线观看| 奇米四色中文综合久久| 国产精品久久一| 99国产视频| 浴室偷拍美女洗澡456在线| 国产欧美日韩综合精品二区| 国内精品视频免费| 国产香蕉一区二区三区| 日本少妇xxx| 亚洲熟妇无码av| 成人激情五月天| 国产一区二区三区中文字幕| 国产ts变态重口人妖hd| 国产精品白丝av| 欧美日韩国产精品一区| 伊人久久免费视频| 99精品国产一区二区| 一区精品在线| 欧美日韩人妻精品一区在线| 少妇按摩一区二区三区| 区一区二在线观看| www.色视频| 国产精品888| 91激情在线视频| 久久国产精品免费视频| 国产欧美精品在线| 大陆极品少妇内射aaaaa| 欧美另类videoxo高潮| 台湾佬中文在线| 亚洲a视频在线观看| 国产亲近乱来精品视频| 欧美一级高清片在线观看| 91精品国产乱码久久久久久久久 | 97精品在线播放| 亚洲精品一区二区三区四区| 欧美国产精品一区| 精品伦理精品一区| 国产精品视频网| 精品免费久久久久久久| 日本一区二区三区在线免费观看| 中文无码精品一区二区三区| 国产精品自在欧美一区| 欧美一级淫片007| 欧美成人精品激情在线观看| 日韩福利一区二区三区| 亚洲av无码专区在线播放中文| 国产欧美一级片| 亚洲少妇最新在线视频| 欧美www在线| 免费毛片网站在线观看| 国产午夜精品无码一区二区| 99国内精品久久| 欧美videofree性高清杂交| 9a蜜桃久久久久久免费| 精品中文字幕在线播放| 性感美女一级片| 亚洲精品国产成人久久av盗摄| 久久久久久91| 亚洲欧美日韩一级| 成人一级免费视频| 国产精品不卡在线观看| 国产精品成人av性教育| 法国空姐电影在线观看| 亚洲国产精品精华液ab| 亚洲美腿欧美偷拍| 91精品在线看| 国产又黄又大又粗的视频| 亚洲最新在线视频| 老司机av网站| 五月天激情播播| 久久久不卡网国产精品二区| 激情视频一区二区| 丰满肉肉bbwwbbww| 日韩有码在线观看| 三级网站免费看| 亚洲免费观看在线观看| 亚洲午夜在线观看| 国产精品一区二区在线观看不卡| 成人激情视频在线| 天天操天天射天天| 成人www视频在线观看| 中文字幕在线日本| 欧美精品18videos性欧| 久久午夜免费视频| 一个色综合导航| 男生和女生一起差差差视频| 国产欧美一区二区精品性色 | 欧美三级在线免费观看| 日韩黄在线观看| 久久艹免费视频| 日韩av电影手机在线| 丰满岳乱妇国产精品一区| 国产精品极品美女在线观看免费| 欧美一区二不卡视频| 国产精品欧美一区二区| 亚洲av毛片成人精品| 成人看片人aa| 国模一区二区三区白浆| 亚洲精美视频| 久久精品水蜜桃av综合天堂| 无尽裸体动漫2d在线观看| 欧美三级中文字幕在线观看| 强迫凌虐淫辱の牝奴在线观看| 亚洲第一区中文99精品|