【ITBEAR科技資訊】7月17日消息,香港科技大學(xué)團(tuán)隊(duì)近日成功研發(fā)出一款名為Semantic-SAM的圖像分割人工智能模型,為圖像處理領(lǐng)域注入了新的活力。該模型在粒度和語(yǔ)義功能方面較之前的SAM模型有著顯著的提升,能夠?qū)崿F(xiàn)對(duì)物體的多粒度級(jí)別分割和語(yǔ)義標(biāo)簽的提取。
據(jù)悉,Semantic-SAM的開發(fā)基于著名的Mask DINO框架,不過(guò)研究團(tuán)隊(duì)主要對(duì)解碼器部分進(jìn)行了改進(jìn),使其能夠同時(shí)支持通用分割和交互式分割。通過(guò)采用解耦的物體分類和部件分類方法,Semantic-SAM學(xué)習(xí)到了物體和部件的語(yǔ)義信息,從而在多粒度分割任務(wù)和交互分割任務(wù)方面取得了優(yōu)化效果。這一突破性的成果為圖像分割技術(shù)的發(fā)展帶來(lái)了更大的潛力。
研究團(tuán)隊(duì)在進(jìn)行了一系列實(shí)驗(yàn)后發(fā)現(xiàn),Semantic-SAM模型在分割質(zhì)量和粒度可控性方面表現(xiàn)優(yōu)于之前的SAM模型。它能夠更準(zhǔn)確地分割出不同粒度級(jí)別上的物體,并為這些實(shí)體提供準(zhǔn)確的語(yǔ)義標(biāo)簽,為圖像理解和應(yīng)用提供了更精細(xì)的信息。這一重要進(jìn)展為計(jì)算機(jī)視覺(jué)領(lǐng)域的研究者和工程師們提供了更多的工具和技術(shù)支持,有望推動(dòng)相關(guān)領(lǐng)域的創(chuàng)新應(yīng)用。
為了進(jìn)一步推廣該模型的應(yīng)用,香港科技大學(xué)團(tuán)隊(duì)已經(jīng)將Semantic-SAM項(xiàng)目發(fā)布在GitHub上,并同時(shí)上傳了論文至ArXiv平臺(tái),以供研究者和開發(fā)者們參考和使用。這一開源舉措有助于促進(jìn)學(xué)術(shù)界和工業(yè)界的合作與交流,推動(dòng)圖像分割領(lǐng)域的不斷發(fā)展。