近年來(lái),人工智能行業(yè)快速發(fā)展,智能語(yǔ)音市場(chǎng)也異?;馃帷o(wú)論是BAT、網(wǎng)易等互聯(lián)網(wǎng)大廠(chǎng),還是以訊飛為首的人工智能大企業(yè),亦或者近些年在A(yíng)I賽道上異軍突起的中小企業(yè),都在用開(kāi)放平臺(tái)的戰(zhàn)略方式,試圖籠絡(luò)各開(kāi)發(fā)者,建立屬于自己的AI產(chǎn)業(yè)生態(tài)圈。
據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),國(guó)內(nèi)智能語(yǔ)音相關(guān)開(kāi)放平臺(tái)已有50多家,其中不乏垂直領(lǐng)域的技術(shù)型小公司。標(biāo)貝科技作為一家深耕智能語(yǔ)音領(lǐng)域中小企業(yè),在2021年4月6日,也正式宣布加入智能語(yǔ)音開(kāi)放平臺(tái)“大軍”,進(jìn)一步推動(dòng)人工智能語(yǔ)音場(chǎng)景落地,全效助力開(kāi)發(fā)者構(gòu)建自身AI語(yǔ)音生態(tài)。
據(jù)了解,標(biāo)貝開(kāi)放平臺(tái)匯集了標(biāo)貝科技五年以來(lái)在智能語(yǔ)音領(lǐng)域取得的相關(guān)技術(shù)成果,以豐富的商業(yè)化AI語(yǔ)音能力、個(gè)性化效果,為開(kāi)發(fā)者提供業(yè)界領(lǐng)先的人機(jī)對(duì)話(huà)技術(shù)調(diào)用,能快速解決開(kāi)發(fā)者在語(yǔ)音交互相關(guān)技術(shù)開(kāi)發(fā)難點(diǎn)、痛點(diǎn)問(wèn)題,提高開(kāi)發(fā)者智能化產(chǎn)品落地速度,大大節(jié)省其開(kāi)放成本和時(shí)間。
兩大服務(wù),提升交互體驗(yàn)
目前,標(biāo)貝開(kāi)放平臺(tái)提供的智能語(yǔ)音服務(wù)主要包括語(yǔ)音合成(TTS)與語(yǔ)音識(shí)別(ASR),開(kāi)發(fā)者可以在平臺(tái)操作界面創(chuàng)建多個(gè)智能語(yǔ)音應(yīng)用,系統(tǒng)自動(dòng)分配了語(yǔ)音識(shí)別和語(yǔ)音合成的全部服務(wù)到該應(yīng)用。語(yǔ)音識(shí)別包括一句話(huà)識(shí)別、長(zhǎng)語(yǔ)音識(shí)別、錄音文件識(shí)別,語(yǔ)音合成可選擇在線(xiàn)合成、離線(xiàn)合成、長(zhǎng)文本合成三種,并可根據(jù)客戶(hù)自身需求進(jìn)行用量、音色、并發(fā)等接入試用。特別值得一提的是,離線(xiàn)引擎的開(kāi)放,使標(biāo)貝對(duì)智能電視等嵌入式設(shè)備廠(chǎng)商的服務(wù)更為全面。
在語(yǔ)音合成方面,標(biāo)貝采用基于transfomer機(jī)制的高音質(zhì)合成,綜合利用聲學(xué)和語(yǔ)言學(xué)參數(shù),多音字的合成準(zhǔn)確率更高,韻律停頓更加自然,整體的語(yǔ)音聽(tīng)感體驗(yàn)更接近場(chǎng)景化的真人表達(dá)。合成的接口全面支持多音字標(biāo)注,手動(dòng)校對(duì)發(fā)音,語(yǔ)速停頓調(diào)節(jié)等通用功能。語(yǔ)音識(shí)別方面,基于先進(jìn)的端到端的深度學(xué)習(xí)算法,聚焦中文普通話(huà)近場(chǎng)識(shí)別,在安靜環(huán)境下近字準(zhǔn)確率超過(guò)97%。除了支持16k的設(shè)備端交互,還支持8k的客服場(chǎng)景電話(huà)語(yǔ)音識(shí)別。并支持通過(guò)熱詞更新方式,進(jìn)行領(lǐng)域內(nèi)特定詞識(shí)別效果的快速優(yōu)化。
全音庫(kù)開(kāi)放,支持多應(yīng)用場(chǎng)景
標(biāo)貝開(kāi)放平臺(tái)發(fā)布后將開(kāi)放近60個(gè)音色,涵蓋老人、兒童、青年男女音。每一種音色均使用海量音頻數(shù)據(jù)訓(xùn)練而成,聲音真實(shí)飽滿(mǎn)、富有表現(xiàn)力,MOS評(píng)分達(dá)到業(yè)內(nèi)領(lǐng)先水準(zhǔn)。同時(shí),平臺(tái)支持中文、英文、中英混合、方言和多語(yǔ)種發(fā)音,可滿(mǎn)足教育、新聞、有聲閱讀、泛娛樂(lè)等領(lǐng)域語(yǔ)音定制需求,并支持多語(yǔ)言、多情感同時(shí)使用。
簡(jiǎn)單兼容, 賦能開(kāi)發(fā)者
與目前主流智能語(yǔ)音開(kāi)放平臺(tái)相同,標(biāo)貝開(kāi)放平臺(tái)提供 WEB API 調(diào)用,Android、iOS 等平臺(tái) SDK 接入方式,平臺(tái)基于B/S架構(gòu)的管理平臺(tái),使開(kāi)發(fā)者可根據(jù)需求同時(shí)創(chuàng)建多個(gè)應(yīng)用,支持千萬(wàn)級(jí)并發(fā),每個(gè)應(yīng)用有獨(dú)立的可視化數(shù)據(jù)統(tǒng)計(jì),幫助開(kāi)發(fā)者實(shí)時(shí)、精確地監(jiān)測(cè)應(yīng)用服務(wù)調(diào)用情況。
與此同時(shí),標(biāo)貝開(kāi)放平臺(tái)設(shè)有應(yīng)用預(yù)警功能,通過(guò)預(yù)警管理,開(kāi)發(fā)者可對(duì)調(diào)用頻次、剩余用量、并發(fā)量和有效期限等使用狀態(tài)進(jìn)行設(shè)置,實(shí)現(xiàn)精細(xì)化管理。來(lái)自標(biāo)貝科技的數(shù)據(jù)顯示,該平臺(tái)語(yǔ)音合成和語(yǔ)音識(shí)別的速度均達(dá)到行業(yè)領(lǐng)先水平,服務(wù)可靠性高達(dá) 99.9%。
除此之外,標(biāo)貝開(kāi)放平臺(tái)非常注重交互感,無(wú)論是UI界面還是功能體驗(yàn),都比較人性化,是目前最簡(jiǎn)單且最兼容的智能語(yǔ)音交互平臺(tái)之一,致力于讓各位開(kāi)發(fā)者,使用方便、效率翻倍。
對(duì)于智能語(yǔ)音服務(wù)平臺(tái)的上線(xiàn),標(biāo)貝開(kāi)放平臺(tái)相關(guān)負(fù)責(zé)人表示,“憑借在基礎(chǔ)業(yè)務(wù)AI數(shù)據(jù)服務(wù)的長(zhǎng)期積累,以及不斷創(chuàng)新的技術(shù)研發(fā)投入,標(biāo)貝科技智能語(yǔ)音交互技術(shù)已達(dá)到業(yè)內(nèi)領(lǐng)先水平,希望通過(guò)標(biāo)貝語(yǔ)音服務(wù)開(kāi)放平臺(tái)賦能各行業(yè),共同開(kāi)創(chuàng)更多語(yǔ)音交互場(chǎng)景,實(shí)現(xiàn)開(kāi)放共贏(yíng)。”據(jù)悉,標(biāo)貝開(kāi)放平臺(tái)新注冊(cè)的會(huì)員,可獲得一定量的無(wú)限期免費(fèi)服務(wù)及優(yōu)惠。