今日,階躍星辰發(fā)布通用圖像編輯模型 Step1X-Edit ,提供人人可用的多模態(tài)改圖能力,可以幫用戶完成日常工作和生活中最高頻的 11 類圖像編輯任務(wù):包括替換圖片中的文字、為人物做美化修圖、對畫面進(jìn)行風(fēng)格遷移和材質(zhì)變換等。用戶在階躍 AI App 和網(wǎng)頁端(stepfun.com)可以免費(fèi)使用。網(wǎng)友評價,這款改圖工具能夠“聽得懂、改得準(zhǔn)、保得住”。
Step1X-Edit 模型的總參數(shù)量為 19B ,具備語義精準(zhǔn)解析、身份一致性保持、高精度區(qū)域級控制三項(xiàng)關(guān)鍵能力。為了讓模型測試最大程度貼近市場產(chǎn)品需求,階躍星辰自研了基準(zhǔn)測試集 GEdit-Bench,評測數(shù)據(jù)來源于社區(qū)真實(shí)編輯請求。根據(jù) GEdit-Bench 的評測結(jié)果,Step1X-Edit 在三項(xiàng)核心指標(biāo)中均大幅領(lǐng)先現(xiàn)有開源模型,達(dá)到開源 SOTA(State of the Art,即“當(dāng)前最佳技術(shù)”)水平,在語言理解與圖像重構(gòu)之間實(shí)現(xiàn)理想平衡。

GEdit-Bench 量化評測結(jié)果對比
值得一提的是,Step1X-Edit 上線即開源,目前開發(fā)者已經(jīng)可以在 GitHub、HuggingFace、ModelScope 等技術(shù)社區(qū)調(diào)用。
根據(jù)統(tǒng)計,這是最近一個月階躍星辰上新的第三款多模態(tài)模型,此前還陸續(xù)推出了圖生視頻開源模型和多模態(tài)推理模型。據(jù)統(tǒng)計發(fā)現(xiàn),目前階躍星辰 Step 系列基座模型矩陣中,多模態(tài)模型的占比已經(jīng)達(dá) 7 成。


產(chǎn)品與服務(wù)
聯(lián)系站長
關(guān)于我們