【ITBEAR科技資訊】6月25日消息,穩定人工智能(Stability AI)近日正式發布了他們旗下的文字生成圖片模型SDXL 0.9。這一版本在圖像內容和構圖細節方面經過了重大改進,并且可以在消費級GPU上高效運行。
據悉,SDXL 0.9在所有開源圖像模型中具備最多的參數數量,其中包括一個基礎模型和一個附加模型,分別擁有35億參數和66億參數。穩定人工智能團隊采用了漸進式的工作過程,首先使用基礎模型生成初步細節,然后通過附加模型對圖像進行精細化處理。如果讀者曾經使用過穩定擴散(Stable Diffusion)技術,可能會對這種漸進式的工作過程感到熟悉。
穩定人工智能表示,SDXL 0.9采用了兩個CLIP模型,其中包括了目前體積最大的OpenCLIP模型之一,名為vitg/14。借助這個模型,穩定擴散能夠生成更深、分辨率更高的逼真圖像。
據ITBEAR科技資訊了解,穩定人工智能團隊計劃在接下來發布一篇研究博客,詳細介紹SDXL 0.9的模型規格和更多參數細節。預計該模型將于7月發布1.0正式版本,并在GitHub上開源。這將進一步推動人工智能技術的發展和應用。
穩定人工智能的SDXL 0.9文字生成圖片模型的發布,標志著他們在圖像生成領域取得了重要的進展。這一版本的改進將使用戶能夠更加輕松地創建逼真的圖像,并為消費級GPU用戶提供了更好的性能。隨著SDXL 0.9的進一步發展和1.0版本的發布,我們可以期待更多創新和應用場景的出現,這將極大地推動圖像生成技術的發展。