基石智算CoresHub平臺(tái)近日在AI領(lǐng)域掀起了一股創(chuàng)新風(fēng)潮,該平臺(tái)將AI算力云與模型開發(fā)部署服務(wù)緊密結(jié)合,為開發(fā)者們提供了一個(gè)全方位、一站式的AI應(yīng)用生態(tài)。這一創(chuàng)新之舉,特別是對(duì)于初涉AI開發(fā)的用戶來說,無疑是一個(gè)巨大的福音。CoresHub平臺(tái)不僅支持多模態(tài)模型及應(yīng)用的一鍵啟動(dòng),還推出了包括文本處理、圖文生成、視頻生成以及語音轉(zhuǎn)換在內(nèi)的多種模型,使得用戶能夠輕松實(shí)現(xiàn)一鍵部署和在線微調(diào),快速打造屬于自己的AI應(yīng)用。
在眾多模型中,F(xiàn)unAudioLLM模型尤為引人注目。這款由阿里巴巴通義實(shí)驗(yàn)室推出的開源語音大模型,憑借其強(qiáng)大的功能,在語音識(shí)別與合成領(lǐng)域大放異彩。FunAudioLLM模型由SenseVoice和CosyVoice兩大核心部分組成。SenseVoice在多語言語音識(shí)別、情感辨識(shí)以及聲音事件檢測(cè)方面表現(xiàn)出色,支持超過50種語言,尤其在中文和粵語的識(shí)別上,準(zhǔn)確率有了顯著提升。它還能精準(zhǔn)識(shí)別音樂、掌聲、笑聲、哭聲等多種聲音和情緒。
而CosyVoice則以其卓越的語音合成能力著稱,它可以根據(jù)少量原始音頻快速生成模擬音色,包括韻律和情感細(xì)節(jié),并且支持跨語言合成。這使得CosyVoice在語音到語音翻譯、情感語音對(duì)話、互動(dòng)播客和有聲讀物制作等多個(gè)應(yīng)用場(chǎng)景中,都能發(fā)揮出色的作用。例如,在語音翻譯場(chǎng)景中,CosyVoice不僅能將中文語音翻譯成英文語音,還能保留原說話人的音色和情感色彩,為用戶帶來更加真實(shí)的聽覺體驗(yàn)。
在CoresHub平臺(tái)上,使用CosyVoice模型也非常簡(jiǎn)便。用戶只需創(chuàng)建容器實(shí)例,選擇推薦的資源配置和CosyVoice模型鏡像,然后通過端口訪問WebUI界面,即可根據(jù)頁(yè)面操作提示,使用不同的功能生成音頻。這些功能包括使用模型預(yù)訓(xùn)練的音色生成音頻、上傳自己的音頻文件進(jìn)行3秒極速?gòu)?fù)刻、跨語種復(fù)刻以及自然語言控制等。在使用自然語言控制功能時(shí),用戶需要選擇CosyVoice-300-instruct模型并重新創(chuàng)建實(shí)例。
同樣,SenseVoice模型的使用也十分便捷。用戶只需在創(chuàng)建容器實(shí)例時(shí),選擇SenseVoice模型鏡像,即可進(jìn)入WebUI界面進(jìn)行操作。SenseVoice模型的應(yīng)用場(chǎng)景同樣廣泛,它不僅能識(shí)別多種語言和聲音,還能在情感語音對(duì)話、語音事件檢測(cè)等方面發(fā)揮重要作用。
CoresHub平臺(tái)的這一創(chuàng)新之舉,無疑為AI開發(fā)者們提供了一個(gè)更加便捷、高效的開發(fā)環(huán)境。無論是初學(xué)者還是資深開發(fā)者,都能在這個(gè)平臺(tái)上找到適合自己的工具和資源,快速實(shí)現(xiàn)自己的創(chuàng)意和想法。如果你對(duì)AI開發(fā)充滿熱情,不妨立即登錄CoresHub平臺(tái),開啟你的AI創(chuàng)作之旅吧!