【ITBEAR科技資訊】9月12日消息,數字閱讀領域的一項令人振奮的合作計劃正式亮相。微軟與知名的數字圖書館項目"Project Gutenberg"達成合作,旨在通過人工智能技術為讀者提供全新的有聲書體驗。
微軟的這一項目融合了機器學習、自動文本選擇和自然語音合成等多項AI技術,以實現電子書的自動轉化為語音。首先,項目團隊開發出一種先進的算法,能夠智能分析電子書的結構,準確識別正文內容并區分出頁碼、表格等非關鍵元素。接著,他們運用WaveNet、Tacotron和FastSpeech等文本轉語音技術,生成極為自然的朗讀語音。最引人注目的是,該系統還具備了智能識別書中不同部分,包括敘述、對話和不同角色的能力,可以根據情節調整語音表達,使故事更具生動感。
據ITBEAR科技資訊了解,微軟的這一計劃已經積累了超過35000小時的有聲書語音數據,涵蓋了各類經典文學、戲劇、傳記等作品。所有這些寶貴的語音資源將以開源方式免費提供給廣大讀者。此外,用戶還可以將自己的聲音應用于有聲書制作,實現個性化的朗讀體驗。這一舉措不僅豐富了數字閱讀資源,也為視障人士提供了更為便捷的閱讀方式,為文學與科技的結合開辟了新的可能性。