“他是個落教的人,不彎酸。”
“我巴郎不得去上班”
“你啷個曉得噻”
…………
當你朗讀上面的句子時,有沒有自帶音調,并不自覺拉長了語感?這種頗具感染力且最能直觀表述情感的四川話,已然成為“流行”符號。無論是RAP歌曲,還是搞笑段子,四川話均可作為內容創作元素,引來大批“粉絲”圍觀學習。
而四川話普及和方言保護問題早在2013年就已是當地重點研究項目。但如果你不是 local,對四川話也沒有過多了解的話,還是很容易懷疑自己是不是聽了外語。
為了延續四川話中巴蜀文化與情感傳承,讓更多的人能夠感受漢語西南官話文化的魅力,也為了更好地服務四川當地乃至世界各地的四川話相關使用人群,6月3日,標貝科技精心打造并推出四川話語音合成技術。
一、四川話語音合成技術難點
四川話語音合成技術在行業內已經較為普遍,標貝科技選擇此時公開并發布,主要是對于其相關技術精進度的升級與把控。在四川話語音合成方面,進行了更多維度的技術開發,較普通話語音合成來說,難度提升也比較大。
首先,四川話相比普通話有聲韻母發音更加復雜,比如聲母無卷舌音zh、ch、sh、r不卷舌,增加了舌面鼻濁音n、舌根鼻濁音。這樣的發音方式,在一定程度上增加了語音數據標注和技術開發重構取舍的難度。
其次,四川話聲調值無高升調,各個地區調值的發音也不是很相同,在語音采集及標注中,均增加了樣本數量,包括口語化的語料。同時在標準四川話選擇上,增加了技術開發的精確度及地道川語的韻律。
再者,四川話在構詞法方面,跟普通話對比,構詞法上顯著的不同是名詞和動詞的重疊式,即名詞能夠重疊,動詞一般不能重疊。
面對以上問題及四川話語音合成發展現狀,標貝科技在融合更多采集樣本量及標注精確度上,技術開發進行一一突破,做出了更高質量的四川話語音合成效果。
二、標貝科技四川話語音合成亮點
在標貝科技最終的四川話語音合成音頻中,其發音準確、音調標準,合成音色擬真人、無機械音,長句表述自然流暢、無卡頓,韻律停頓自然流暢。整體的技術都是基于標貝升級版本TTS3.0的框架,輸出的音質效果更清晰穩定。
四川話語音合成,其應用場景也較為廣泛。包括:川語客服、語音播報、影視娛樂、硬件設備等。高標準的四川話語音,會為大家帶來不一樣的感受。
正式上線四川話語音合成技術后,標貝科技將在其官網、標貝AI語音工坊小程序、標貝開放平臺、標貝悅讀等設置體驗區和增加產品入口,歡迎川音應用廠商、各企業及開發者體驗下載。
而在推出四川話語音合成后,標貝科技聲音庫也新增“一員”,與粵語語音合成、臺灣話語音合成等形成方言版聲音定制庫,助力更多方言場景落地。
三、標貝科技個性化聲音定制解決方案
除了普通話語音合成、方言語音合成技術及解決方案外,標貝科技還有個性化聲音定制、聲音克隆(聲音復刻)等解決方案,滿足更多客戶聲音需求。
聲音定制方面,標貝科技會根據不同音色、不同發音的聲音,采集不同領域的特定語料,對語料進行“設計”;之后,技術專家會對發音人的說話風格、語調和停頓方式進行指導,完成聲音的“采集”;再對聲音的音字、韻律和音節音素進行“標注”;從文本、韻律層級預測、聲學參數和聲碼器方面進行合成。
聲音復刻「留聲機」技術解決方案,客戶只需錄制 5 分鐘,10 句話語音內容,當在機器錄入任意文本后,就能播放出和用戶聲音幾乎完全一致的“人造聲”。目前在聲音相似度、自然度等指標上均達到行業領先水平,MOS(語音質量的重要指標)接近 4 分,且音色高保真,真實還原錄音人語氣、語調、情感,清晰自然。
標貝科技作為國內領先的人工智能語音技術、產品和數據服務提供商,一直在AI語音交互技術及高精度數據采標處理技術上進行創新。截止目前,語音合成、聲音復刻等解決方案已經幫助客戶實現多個場景落地。其包括:有聲閱讀、智能客服、智慧金融、AI教育、泛娛樂、自動駕駛等眾多領域。而此次推出的四川話語音合成技術服務,也將助力更多開發者實現方言及個性化聲音解決方案的落地。
更多內容敬請關注標貝科技!