谷歌Deepmind宣布了他們最先進的圖像生成模型Imagen2。該模型通過參考圖片和文本生成新圖片和局部編輯的效果比較強大。
這一最新模型的主要特點包括改進的圖像描述理解。為了幫助創建更高質量和更準確的圖像,Imagen2的訓練數據集中添加了更多描述,幫助該模型學習不同的標題風格,并更好地理解廣泛的用戶提示。
此外,Imagen2的數據集和模型在許多領域取得了改進,這些領域通常是文本到圖像工具所困擾的,包括渲染逼真的手部和人臉,以及保持圖像不受干擾的視覺偽影,從而實現更加真實的圖像生成。
Imagen2的擴散技術提供了高度的靈活性,使得更容易控制和調整圖像的風格。通過提供參考風格圖像并結合文本提示,可以訓練Imagen2生成遵循相同風格的新圖像。
該模型還支持圖像編輯功能,如“修補”和“擴展”。通過提供參考圖像和圖像蒙版,用戶可以使用一種稱為修補的技術直接在原始圖像中生成新內容,或者使用擴展技術將原始圖像延伸到其邊界之外。
為了應對潛在的風險和挑戰,Google DeepMind在設計和開發過程中設置了嚴格的防護措施。Imagen2集成了SynthID,這是一種先進的數字水印工具,使Google Cloud客戶能夠在圖像的像素中添加不可察覺的數字水印,而不會影響圖像質量。這種數字水印可以在應用修改,如濾鏡、裁剪或使用有損壓縮方案保存后仍然可檢測到。在發布功能給用戶之前,Google DeepMind進行了嚴格的安全測試,以最小化潛在的危害風險。安全檢查涵蓋了訓練數據、輸入提示和系統生成的輸出,以避免生成潛在有問題的內容。
現在,開發人員和云客戶可以通過Google Cloud Vertex AI中的Imagen API使用這一先進的圖像生成模型。


產品與服務
聯系站長
關于我們