眾所周知,隨著AIGC相關(guān)技術(shù)最近這一兩年快速成熟,也使得AI繪圖早已經(jīng)不再僅僅是部分PC發(fā)燒友或AI愛好者的“玩具”。
例如在一些游戲里,現(xiàn)在已經(jīng)可以看到AI繪制的角色或是AI設(shè)計(jì)的服裝,它們正在變得越來越精致,同時(shí)也受到了許多玩家的好評(píng)。此外在一些工業(yè)產(chǎn)品上,“由AI參與設(shè)計(jì)”也成為了最新的營銷噱頭。與人類設(shè)計(jì)師相比,AI的“思路”有時(shí)會(huì)顯得格外天馬行空,為產(chǎn)品注入顯眼的亮點(diǎn)。
除此之外,在電商、外貿(mào)等領(lǐng)域,通過AI來繪制產(chǎn)品宣傳圖也成為了時(shí)下最新的熱門話題。由于與人類畫師相比,AI圖像生成程序“任勞任怨”,還支持反復(fù)不斷地修改方案,因此在綜合成本上也有著顯著的優(yōu)勢。
話雖如此,但只要用過AI繪圖工具的朋友可能都知道,以Stable Diffusion為代表的繪圖工具在易用性方面,普遍還存在著一些短板。其中最為突出的一點(diǎn),就在于它們之中的很多版本,依賴的都是特定品牌顯卡的特定私有AI體系。如此一來,這就導(dǎo)致相關(guān)顯卡遭遇了一波又一波的炒作,不僅價(jià)格居高不下,甚至最近還出現(xiàn)了疑似部分型號(hào)遭遇禁售的傳言。
說實(shí)在的,這些對(duì)于大型企業(yè)、設(shè)計(jì)工作室來說都不是什么問題,因?yàn)樗麄兺耆M(fèi)得起更專業(yè)、同時(shí)也更昂貴的AI加速卡,而且也熟稔linux系統(tǒng)下更高效的種種AI繪圖工具。
但如果是一般的個(gè)人用戶呢,或者是對(duì)于諸如網(wǎng)店店主、小型游戲開發(fā)者這類,對(duì)于AI繪圖有需求,但財(cái)力又相對(duì)有限的用戶來說,難道就真的沒有辦法以更低的價(jià)格和技術(shù)門檻,來吃上這一輪“AI”紅利了嗎?
【【【幸好微軟和AMD聯(lián)手,給出了解決方案】】】
辦法當(dāng)然是有的,就以大家熟悉的Stable Diffusion來說,它本身就具備windows客戶端版本,因此并不需要非得使用Linux或者更專業(yè)的操作系統(tǒng)。
其次,此前主流Stable Diffusion版本所使用的Pytorch指令,對(duì)于AMD GPU“天生”缺乏優(yōu)化,這是造成A卡運(yùn)行AI繪圖效果不佳的最核心原因。但現(xiàn)在借助Microsoft Olive工具,Pytorch指令會(huì)被實(shí)時(shí)轉(zhuǎn)換為ONNX,然后便可以通過AMD GPU自帶的DirectML加速功能進(jìn)行加速,大幅提升“AI繪圖”的效率。
在此基礎(chǔ)上,自今年7月底更新的驅(qū)動(dòng)版本(23.7.2)之后,如今AMD GPU已經(jīng)實(shí)現(xiàn)了對(duì)Microsoft Olive的原生支持。因此如今只需要在Windows系統(tǒng)下,配置一套啟用了Microsft Olive、支持DirectML加速的Stable Diffusion,就可以很簡單地享受到由A卡帶來的AI繪圖體驗(yàn),再?zèng)]有過多的成本和技術(shù)門檻了。
【【【測試平臺(tái):銳龍9+高頻內(nèi)存,三款顯卡同時(shí)參測】】】
前面說了這么多,那么A卡+Windows系統(tǒng)如今在Stable Diffusion的AI繪圖場景下,性能表現(xiàn)到底如何呢?
為了探究這個(gè)問題,我們?nèi)咨罨谝惶子射J龍9-7950X處理器,搭配32GB DDR5-6400內(nèi)存,并使用最新版Windows 11專業(yè)工作站版的測試平臺(tái)。
需要注意的是,AMD的銳龍7000系列平臺(tái)在剛上市那陣子,對(duì)于超過6000MHz的DDR5內(nèi)存兼容性并不太好,直到前段時(shí)間通過BIOS更新,才“解鎖”了明顯好得多的內(nèi)存兼容性。所以如果也想與我們一樣,在如今的AMD平臺(tái)上使用高頻DDR5內(nèi)存,建議先將主板BIOS更新到最新版本才更為穩(wěn)妥。
在測試顯卡方面,為了更廣泛地覆蓋盡可能多的用戶群體,我們選擇了三款,分別是Radeon RX 7900XTX、RX 7900XT和RX 7700XT。
其中,RX7900XTX我們此次使用了不僅具備完整的96 CU單元、192 AI加速器和24GB顯存配置,同時(shí)默認(rèn)頻率也比公版更高、達(dá)到了2565MHz的版本。
相比之下,RX7900XT和RX7700XT我們使用的也是具備出廠超頻設(shè)計(jì),并配備了比公版方案體量大得多的三風(fēng)扇+多熱管散熱設(shè)計(jì)的版本。其中尤其是兩款7900系列顯卡的三槽散熱器設(shè)計(jì),無論拿在手里的“分量”、還是裝在機(jī)箱里的視覺效果,也都相當(dāng)驚人。
當(dāng)然,從經(jīng)驗(yàn)來說,短期內(nèi)的AI繪圖并不會(huì)對(duì)顯卡造成像游戲那么大的性能壓力,但誰又不希望自家顯卡可以在“煉丹”時(shí)更安靜、更涼快一點(diǎn)呢?
【【【測試結(jié)果:DirectML顯神威,A卡“煉丹”大加速】】】
值得一提的是,就在我們進(jìn)行測試的這段時(shí)間,原版Stable Diffusion使用時(shí)所需訪問的大模型網(wǎng)站正好陷入長期的連接困難之中,這確實(shí)一度給測試帶來了不小的困擾。
好在經(jīng)過一番摸索后我們發(fā)現(xiàn),其實(shí)現(xiàn)在國內(nèi)已經(jīng)有愛好者制作出了更加本地化,配置起來也更容易的Stable Diffusion WebUI方案。而且其同樣擁有DirectML版本,可以使用AMD顯卡進(jìn)行AI加速。
針對(duì)此次繪圖測試,我們使用了以下參數(shù):
生成關(guān)鍵詞:
dynamic pose, dynamic angle,(masterpiece:1. 4, best quality), unity 8k wallpaper, ultra detailed, beautiful and aesthetic, perfect lighting,detailed background, realistic
去除關(guān)鍵詞:
EasyNegative,nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, bad feet, text,logo
分辨率設(shè)置:512×512
采樣步進(jìn):20
提示詞引導(dǎo)系數(shù):7
生成數(shù)量:15-1,1-1
RX7700XT生成15張圖片,總用時(shí)115.8秒、平均每張圖片耗時(shí)7.72秒
RX7900XT 生成15張圖片,總用時(shí)77.8秒、平均每張圖片耗時(shí)5.19秒
RX7900XTX 生成15張圖片,總用時(shí)67.7秒、平均每張圖片耗時(shí)4.51秒
可以看出,一方面有了DirectML加速途徑,如今AMD顯卡在AI繪圖的效能上已經(jīng)不低。尤其是對(duì)于RX7900系列顯卡來說,大顯存加上更多的AI單元加持,使得其明顯具備更高的生成速度。
根據(jù)上面的測試結(jié)果我們將三款顯卡的平均每張圖片耗時(shí)成績匯總成了上面這張柱狀圖,可以看到RX7900XTX雖然有著明顯更快的速度,但相較之下,RX7900XT與其僅15%的性能差異,顯然沒有價(jià)格方面那么明顯。對(duì)于要求沒有那么高的朋友來說,即便是與RX7900XTX在性能方面有著71.2%差距的RX7700XT,兩者近一倍的價(jià)格差,無疑也使得RX7700XT有著不錯(cuò)的性價(jià)比。
針對(duì)這一點(diǎn),我們也出于好奇心進(jìn)行了一次連續(xù)生成100張圖片的追加測試??梢钥吹?,RX7900XTX應(yīng)對(duì)自如,僅用時(shí)450.8秒就完成了全部任務(wù),平均每張圖片的生成速度完全沒有變慢,依然維持在4.51秒一張的效率上。
【【【總結(jié):AI繪圖現(xiàn)在已經(jīng)有了更具性價(jià)比的選擇】】】
說實(shí)在的,由于過去很長一段時(shí)間生成式AI繪圖工具對(duì)于AMD顯卡的支持力度確實(shí)不算太好,這造成了大量有需求的用戶不得不額外去購買昂貴顯卡的局面,客觀上給消費(fèi)者帶來了更多的開銷,也在一定程度上阻礙了生成式AI繪圖本身的技術(shù)發(fā)展速度。
好在隨著AMD和微軟聯(lián)合優(yōu)化的Microsoft Olive工具,以及由此衍生的DirectML版本Stable Diffusion發(fā)行版誕生,A卡用戶們終于不需要再羨慕他人的“煉丹”效率,也不再需要配置繁瑣的Linux和RCOM環(huán)境,直接就能在Windows系統(tǒng)下像其他顯卡一樣,方便地使用AI繪圖工具了。
很顯然,無論是對(duì)于喜歡“折騰”的技術(shù)愛好者,還是對(duì)有這方面需求的商業(yè)用戶來說,這都意味著“AI繪圖”背后的硬件性價(jià)比的再次攀升。其中特別是對(duì)于“AI繪圖”有著強(qiáng)烈需求的商業(yè)用戶來說,新的繪圖工具就意味著部署的硬件和軟件成本都大幅降低,這也將進(jìn)一步解放“AI繪圖”在實(shí)際商用場景中的可能性。
比如電商運(yùn)營者現(xiàn)在便不再需要依賴畫師、廣告公司,來進(jìn)行產(chǎn)品宣傳所需的美術(shù)設(shè)計(jì),而是可以嘗試基于AI技術(shù)來生成產(chǎn)品宣傳圖。這不僅能夠大幅節(jié)約成本和時(shí)間,而且即便對(duì)效果不滿意,也可以無限次重來,直到獲得合適的設(shè)計(jì)為止。毫無疑問,這將會(huì)大幅促進(jìn)電商行業(yè)的降本增效,并為生成式AI技術(shù)的發(fā)展注入了更多的現(xiàn)實(shí)需求動(dòng)力。
與此同時(shí),隨著“A卡煉丹”效率的解封,相信這也將促進(jìn)生成式AI繪圖技術(shù)迎來更好、更快的發(fā)展。
當(dāng)然從另外一個(gè)角度來說,它會(huì)不會(huì)因此使得顯卡的價(jià)格因此變得更加合理一些呢?