5月22日消息,最近,一個名為DragGAN的AI 圖片編輯工具爆火,它實現了點擊鼠標、拖動關鍵點就能達到Photoshop的效果。對比之下,使用Photoshop等工具時候,需要具備相對專業的技能才能靈活,精確地控制單個對象的位置,形狀,表達或排列。
簡單的說,DragGAN使用戶能夠在圖像上確定一個點,就能改變圖片結構和整個像素。它與其他流行的生成AI圖像工具(如Dall-E和Midjourney)有很大的區別,后者雖然能夠通過文本提示生成特定的圖片,但無法精確輸出所需的姿勢或布局。
據了解,DragGAN新模型由MIT、谷歌、馬普所等機構聯手打造,該項目相關論文已入選SIGGRAPH2023,研究人員展示了一種控制GAN進行圖像處理的新方法。
簡單拖拽就能實現圖片編輯
只要處理的圖片與GAN訓練數據集的類別匹配,DragGAN就可以處理逼真的圖像。這些類別包括動物、汽車、人、細胞和景觀。
論文示例展示了在一個簡單的界面中,用戶可以將他們在圖像中定義的點拖動到所需的位置,就是實現圖片編輯。例如,讓貓咪閉上眼睛,讓獅子轉頭并張開它的嘴,或將汽車轉換為另一種模型。
DragGAN 還提供了遮罩功能,允許用戶突出顯示他們希望更改的圖像的特定部分,而其余部分保持不變。
該團隊表示:“通過DragGAN,任何人都可以通過精確控制像素的位置來變形圖像,從而操縱不同類別的姿勢、形狀、表情和布局。”
DragGAN 研究論文還強調了該工具的最大優勢,界面的簡單性和直觀性。在幾秒鐘內,用戶可以掌握功能,而無需弄清楚底層技術。
未來,如果將DragGAN 與AI圖像生成工具搭配使用,用戶將能夠實現更接近他們心目中的圖像的輸出。
來源:站長之家