字節跳動推出X-Portrait2肖像動畫技術,通過先進的表情編碼器模型和生成擴散模型,實現超低成本高效的角色動畫創作。
FLUX1.1Pro 迎來重大更新,推出全新版本 FLUX1.1Pro Ultra,支持高達4兆像素的分辨率,生成速度大幅提升,每張圖片僅需約10秒完成。
Stability AI最近推出了全新的深度學習文本到圖像生成模型Stable Diffusion3.5,包括三種改進的開源模型,滿足不同用戶需求。
科技魔方
StabilityAI大模型文生圖模型
FLUX.1-dev LoRA 服裝生成器利用先進的人工智能技術,為用戶帶來前所未有的時尚設計體驗,讓設計小白也能秒出服裝效果圖。
VQAScore是一個利用視覺問答模型來評估由文本提示生成的圖像質量的新方法;GenAI-Bench是一個包含復雜文本提示的基準測試集,用于挑戰和提升現有的圖像生成模型。
近日,中國研究團隊成功創建了“Infinity-MM”數據集,同時訓練出了性能卓越的小型新模型“Aquila-VL-2B”。
生成式AI發展迅猛,但全面評估其性能一直是難題。近期,卡耐基梅隆大學和Meta合作推出VQAScore評測方案,利用視覺問答模型評分,準確性超越傳統方法。
Oute AI 最近發布了一種名為 OuteTTS-0.1-350M 的文本轉語音合成方法,采用純語言建模,簡化了 TTS 方法,具有零樣本語音克隆功能,適用于廣泛的應用領域。
-------------沒有了-------------