日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

<mark id="vrhvn"></mark>

<output id="vrhvn"><ruby id="vrhvn"></ruby></output>

<label id="vrhvn"><dl id="vrhvn"><dl id="vrhvn"></dl></dl></label>

公告：魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù)，提交前請(qǐng)做好本站友鏈：【網(wǎng)站目錄：http://www.ylptlb.cn 】，免友鏈快審服務(wù)（50元/站），

點(diǎn)擊這里在線(xiàn)咨詢(xún)客服

網(wǎng)站：51998
待審：31
小程序：12
文章：1030137
會(huì)員：747

首頁(yè) > 新聞資訊 > 互聯(lián)網(wǎng) >正文

“聽(tīng)見(jiàn)”更好的世界，StyleTTS端到端合成框架再創(chuàng)搜狗語(yǔ)音新突破

發(fā)布時(shí)間：2021-06-07 14:21:00 作者：網(wǎng)友整理

隨著社會(huì)進(jìn)步和技術(shù)創(chuàng)新的日益加快，“黑科技”的產(chǎn)業(yè)運(yùn)用持續(xù)加速，對(duì)人們生活的影響與改變也不斷加深。

近期，業(yè)內(nèi)領(lǐng)先的搜狗AI語(yǔ)音合成再突破，創(chuàng)新提出“StyleTTS端到端合成框架”，將語(yǔ)音合成技術(shù)再次向前推進(jìn)一步，在準(zhǔn)確傳遞信息之外，更重視個(gè)性化及情感表達(dá)，讓合成的語(yǔ)音更具表現(xiàn)力，更“逼真”。搜狗聯(lián)合搜狐新聞客戶(hù)端于5月推出的演員柳巖同款明星“數(shù)字人”就是基于該技術(shù)的支持，實(shí)現(xiàn)了無(wú)縫切換河南、湖南、四川、陜西、東北等多種方言的能力。目前，該技術(shù)也為騰訊QQ瀏覽器“小說(shuō)AI聽(tīng)書(shū)”功能提供支持，助力其實(shí)現(xiàn)了聽(tīng)書(shū)、聽(tīng)小說(shuō)的全新升級(jí)。

搜狗語(yǔ)音AI業(yè)內(nèi)領(lǐng)先，幫助“聽(tīng)見(jiàn)”更好世界

作為機(jī)器的“嘴巴”，語(yǔ)音合成已經(jīng)被廣泛應(yīng)用于新聞播報(bào)、小說(shuō)閱讀、地圖導(dǎo)航、人機(jī)交互等諸多場(chǎng)景中。從2010年以前經(jīng)典的統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法，到DNN/LSTM為代表的深度神經(jīng)網(wǎng)絡(luò)，再到Tacotron/FastSpeech/Durian等具有更強(qiáng)建模能力的端到端模型，結(jié)合神經(jīng)聲碼器的突破，語(yǔ)音合成技術(shù)的發(fā)展正在從“穩(wěn)定可懂”迭代到“更高表現(xiàn)力和逼真度，甚至媲美真人錄音的水平”。

搜狗AI語(yǔ)音合成有著雄厚的技術(shù)積累，2018年曾獲得Blizzard Challenge語(yǔ)音合成挑戰(zhàn)賽停頓和可懂兩項(xiàng)子任務(wù)第一名，2019年推出首個(gè)真人變聲功能實(shí)現(xiàn)“任意說(shuō)話(huà)人聲音(源)向指定說(shuō)話(huà)人聲音(目標(biāo))的實(shí)時(shí)變換”，展現(xiàn)了搜狗在語(yǔ)音表征學(xué)習(xí)、語(yǔ)音合成等領(lǐng)域的多個(gè)關(guān)鍵性技術(shù)突破。此外，以新華社AI合成主播“新小浩”和自有形象合成主播“雅妮”為代表的搜狗數(shù)字人也已升級(jí)至“第七代”，這些AI數(shù)字人的聲音真實(shí)度、表現(xiàn)力已可媲美真人，展現(xiàn)了在多模態(tài)合成領(lǐng)域的行業(yè)領(lǐng)先性。

在此基礎(chǔ)上，搜狗又提出了StyleTTS端到端合成框架，該框架主要包含Encoder文本特征編碼、Prosody Extractor/Predictor韻律特征編碼與建模、Decoder音色建模三大模塊，通過(guò)不同人(聲)的韻律模型和音色模型重組搭配，能夠?qū)崿F(xiàn)跨發(fā)音人的風(fēng)格控制合成，并擁有抑揚(yáng)頓挫的韻律節(jié)奏和豐富立體的情感表達(dá)。此外，模型還加入說(shuō)話(huà)人特征編碼、語(yǔ)種特征編碼以及GAN對(duì)抗學(xué)習(xí)等經(jīng)典方法，進(jìn)一步提升建模能力。相較而言，傳統(tǒng)語(yǔ)音合成技術(shù)的重點(diǎn)在于“信息的正確傳遞”，而搜狗AI語(yǔ)音合成技術(shù)除了正確傳遞信息，更重視個(gè)性化與情感共鳴，合成效果也具有更高的自然度、辨識(shí)度，同時(shí)還能實(shí)現(xiàn)對(duì)語(yǔ)音轉(zhuǎn)換的風(fēng)格、口音、情感等進(jìn)行靈活選擇與控制，從而滿(mǎn)足不同場(chǎng)景的需求。

（圖：搜狗StyleTTS結(jié)構(gòu)圖）

以對(duì)騰訊QQ瀏覽器“AI聽(tīng)書(shū)”的支持為例，區(qū)別于其他機(jī)器合成聲音的機(jī)械式發(fā)音，搜狗AI合成語(yǔ)音節(jié)奏更分明、情緒更自然，能夠更好的解放雙眼，而除了堪比真人的高保真音色，支持“方言語(yǔ)音”、“動(dòng)漫語(yǔ)音”等的選擇，在讀書(shū)過(guò)程中，用戶(hù)還可以根據(jù)場(chǎng)景和心情進(jìn)行播單設(shè)置、語(yǔ)速調(diào)節(jié)等個(gè)性化操作，這些都能夠提供更好的使用體驗(yàn)，幫助用戶(hù)“聽(tīng)見(jiàn)”更好的世界。

聲音+產(chǎn)業(yè)構(gòu)建，前瞻“布局”未來(lái)生活

“聲音+”市場(chǎng)呈爆發(fā)式增長(zhǎng)，已步入千億量級(jí)市場(chǎng)。數(shù)據(jù)顯示，在閱讀領(lǐng)域，“看”已不是閱讀的唯一方式，十個(gè)人當(dāng)中就超過(guò)兩個(gè)人在聽(tīng)書(shū)；在音頻領(lǐng)域，有聲書(shū)實(shí)現(xiàn)了從貢獻(xiàn)流量到商業(yè)變現(xiàn)的路徑打通，正在成長(zhǎng)為喜馬拉雅FM等各大音頻平臺(tái)的支撐或主流業(yè)務(wù)；在智能硬件領(lǐng)域，僅智能音箱一項(xiàng)，未來(lái)五年銷(xiāo)量將突破3億臺(tái)超過(guò)PC規(guī)模……未來(lái)10 年，“聲音+”整合產(chǎn)業(yè)規(guī)模將達(dá)到萬(wàn)億美金級(jí)別。

隨著智能社會(huì)的到來(lái)，聲音作為最自然、最便利的人機(jī)交互方式，上接互聯(lián)網(wǎng)、下接物聯(lián)網(wǎng)、中間連接人工智能，既是出口也是入口，而作為“聲音+”產(chǎn)業(yè)的基礎(chǔ)設(shè)施之一，語(yǔ)音合成孕育著一個(gè)巨大的藍(lán)海市場(chǎng)。

對(duì)此，搜狗已經(jīng)進(jìn)行前瞻性布局和產(chǎn)業(yè)化落地。在AI語(yǔ)音合成技術(shù)方面，圍繞“自然交互+知識(shí)計(jì)算”這一AI理念，搜狗不斷加大投入構(gòu)建技術(shù)“護(hù)城河”，持續(xù)累積領(lǐng)先優(yōu)勢(shì)；在創(chuàng)新性平臺(tái)方面，搜狗打造了“搜狗聲咖”、“搜狗AI開(kāi)放平臺(tái)”等，基于語(yǔ)音技術(shù)提供語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解、同聲傳譯等AI服務(wù)；在產(chǎn)業(yè)落地方面，搜狗不僅積極推動(dòng)與清華天工研究院等學(xué)術(shù)機(jī)構(gòu)，與暢游、千龍網(wǎng)、學(xué)而思等商業(yè)機(jī)構(gòu)，乃至于與黃子韜、梁寧等明星和意見(jiàn)領(lǐng)袖等的合作，運(yùn)用了搜狗語(yǔ)音技術(shù)的搜狗AI合成主播也被廣泛使用于傳媒、法律、金融等各行各業(yè)。

隨著時(shí)代發(fā)展與科技進(jìn)步，智能語(yǔ)音將會(huì)變得越來(lái)越普及，得益于搜狗領(lǐng)先的人工智能技術(shù)，以及在語(yǔ)言領(lǐng)域、聲音領(lǐng)域的強(qiáng)大積累，搜狗語(yǔ)音能夠提供一整套科學(xué)、高效的“AI語(yǔ)音解決方案”，為人賦能，幫助人們更好的進(jìn)行“有聲創(chuàng)作”、幫助各種機(jī)構(gòu)更好的提供“有聲服務(wù)”，從根本上推動(dòng)“聲音產(chǎn)業(yè)”和“人工智能產(chǎn)業(yè)”的發(fā)展，從這個(gè)意義上來(lái)說(shuō)，其未來(lái)發(fā)展具有廣闊的空間。

分享到：

標(biāo)簽：新突破再創(chuàng) 搜狗端到框架合成語(yǔ)音聽(tīng)見(jiàn)

網(wǎng)友整理

注冊(cè)時(shí)間：

網(wǎng)站：5 個(gè) 小程序：0 個(gè) 文章：12 篇

51998
網(wǎng)站
12
小程序
1030137
文章
747
會(huì)員

趕快注冊(cè)賬號(hào)，推廣您的網(wǎng)站吧！

文章分類(lèi)

熱門(mén)網(wǎng)站

各百科-專(zhuān)業(yè)百科問(wèn)答知識(shí)名網(wǎng)站 m.geelcn.com
免費(fèi)軟件,綠色軟件園,手機(jī)軟件下載,熱門(mén)游戲下載中心-中當(dāng)網(wǎng) m.deelcn.com
魔扣科技 www.ylptlb.cn
體育新聞_國(guó)際體育資訊_全球體育賽事-中名網(wǎng) www.feelcn.com/tiyu/tiyuxinwen/
食品安全_健康飲食_舌尖上的安全-中名網(wǎng) www.feelcn.com/shenghuo/shipinanquan/
中合網(wǎng) www.heelcn.com
中當(dāng)網(wǎng) www.deelcn.com
魔扣網(wǎng)站維護(hù)代運(yùn)營(yíng) www.ylptlb.cn/tg
中合網(wǎng)-健康養(yǎng)生知識(shí)科普名站 m.heelcn.com
各百科 www.geelcn.com

最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲，玩家需要根據(jù)9

答題星

答題星2018-06-03

您可以通過(guò)答題星輕松地創(chuàng)建試卷

全階人生考試

全階人生考試2018-06-03

各種考試題，題庫(kù)，初中，高中，大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù)，積累氧氣值。還可偷

每日養(yǎng)生app

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績(jī)?cè)u(píng)定

體育訓(xùn)練成績(jī)?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績(jī)?cè)u(píng)定

熱門(mén)文章