自百度地圖上線湯唯導航語音之后,已經有越來越多的人愛上了出行時和湯唯“對話”,但是你知道這么迷人的導航語音是怎樣“煉成”的嗎? 在百度地圖最近推出的“解密之作”——《“女神音 ” 的誕生》 中,來自百度地圖的“技術大神”就親自為我們解答了這個疑惑。
“女神是在哪里錄制的?”“語音包是一個字一個詞錄的嗎?”“地圖中的所有地名都要念一遍嗎?”關于導航語音的錄制,公眾有著各種各樣的好奇和困惑。正如視頻中所說,日常陪伴我們的導航語音背后,真的是“大有學問”呢。
一、湯唯的錄制過程是怎樣的?
那些有趣的“語音彩蛋”來自哪里?
公眾對導航語音的錄制過程可是充滿了“奇思妙想”,甚至有人開玩笑地表示“湯唯是不是自己拿著手機錄的呢。”其實不然,百度地圖有專業的錄音棚,且相比大部分音樂錄音棚規格更高。 專業的錄音人員,可以對錄音質量做全面把控,為用戶打造更加真實的聲音。而在一些語句的設計和朗讀上,湯唯也會有自己的理解,聲調的抑揚頓挫和語速的節奏掌握,都能收放自如。
對于語音中的“小彩蛋”,這是獨立于基礎語音,專門為一些特定場景錄制的 。其中包括很多錄音時女神的自由發揮,所以每一句彩蛋都稱得上是“湯唯出品”。彩蛋的存在,讓每位明星的語音都擁有了不同的“個性”。
圖示:工程師談湯唯錄制情況
二、明星需要將地圖中的所有地名和提示語都念一遍嗎?
不需要的,明星錄制語音的目的是獲取其聲音特點 ,不需要把所有地名和提示語都念一遍。錄制語句一般分為兩種:一種是湯唯直接說給大家聽的 ,比如“大家好,我是湯唯”;另一種是用來訓練語音合成模型的句子 。大家在使用過程中聽到的大部分語音,是通過機器學習合成出來的,不是都來自明星本人錄制的呦。所以,明星本人的錄制量并不是很大。
圖示:工程師解讀語音錄制中的語句類型
三、百度地圖有什么“黑科技”,可以用湯唯的聲音播報出來的地圖上各種地點名稱等信息?
對于地圖上各種無法預知的提示語句,比如沒見過的地名,可通過終端實時計算實現用湯唯的聲音播報。 由于聲音和文字,對于機器而言都是數字化的。語音合成模型可建立聲音和播報內容兩組數字之間的關系,通過一系列的計算,將播報內容的輸入轉化為聲音的輸出。在學習過程中,會建立一個神經網絡模型 ,學習湯唯的聲音特征和播報內容之間的對應關系。在合成時,它就可以讀取導航語句,用湯唯的聲音朗讀出來了。
而對于一些固定的導航提示語,可以通過計算密集的合成方法,將沒有錄制到的內容合成出來。 這一技術合成的語音質量非常高,通常可以“以假亂真”。區別于地名和街道名,導航提示語比較固定且使用頻率較高。因此對于這部分常用內容,百度地圖可以通過AI技術預估合成進語音里,大大減輕了終端的計算壓力。此次上線的湯唯導航語音自然又真實地還原了女神的“好聲音”,難怪解密視頻中不少公眾都誤以為是湯唯“一句一句錄的”,甚至是“一個字一個字錄的”。
圖示:工程師解讀語音合成技術
AI賦能下的百度地圖正在從用戶角度出發,想要做的多一點、再多一點。此次上線的“湯唯導航語音”,不僅以百度地圖前沿的AI技術為支撐,還融合了湯唯本人的專業精神和情感元素。當“專業遇上專業”,便為我們帶來了這一路相伴的迷人聲音。
2019年已經到來,就讓女神湯唯為你導航,一路相伴吧!