說到看體育比賽,內行看門道,外行看熱鬧。而一場精彩的比賽,離不開一個好的解說員。
例如,劉建宏的鬼畜解說:“巴拉克!巴拉克!巴拉克!巴拉克!巴拉克!!!巴拉克把球帶丟了..........”
解說界Raper黃健翔:“機會!打門!漂亮!漂亮!11號朱挺!中國隊通過反復的進攻,把對方壓在半場,連續圍攻好幾次,終于形成一次機會!”
一位優秀的體育解說員,通過聲音讓比賽更加生動,也讓觀眾更好地理解和感受比賽,為比賽增添了許多趣味性、專業性、文化性。
但由于專業賽事具備一定的專業性,現場解說大多情況下只能關照某一層面的觀眾,對于資深球迷、入門小白等不同人群的需求難以兼顧。此外,據統計全世界平均每年都有數萬場大大小小不同水平的體育比賽,全部由人工來完成解說,成本大、效率也不高。如果由機器來代替真人解說,則可以根據不同賽事及觀眾的特點和需求來選擇個性化解說。
就在今年4月結束的高爾夫美國大師賽上,AI解說就為20000多條比賽片段完成語音解說,讓球迷直接體驗了一把AI賽事解說的魅力。
AI賽事解說
據了解,高爾夫美國大師賽的AI解說功能,實際是由生成式AI完成。簡單來說就是由一個大型語言模型構建而成,模型進行了大量高爾夫運動的用語習慣和風格訓練,最終實現自動生成比賽片段的語音解說。
事實上,AI賽事解說也不是新鮮事了。
2015年,百度推出奧運會歷史上的第1位AI解說員“度秘”,參與解說2016年里約奧運會男籃1/4決賽;2018年,俄羅斯Promobot公司研制的機器人成為美國福克斯體育頻道體育新聞主持人,在節目中與真人主持對話、評論并預測比賽結果。
從體育賽事轉播的角度來看,AI解說本質是為了有針對性的給球迷提供更好的觀賽服務。
相較于真人解說,AI可以與高端分析軟件結合,提供更快、更有洞察力的比賽數據分析,然后再通過AI語音將這些分析和解說呈現在轉播視頻上,大大豐富了觀眾第一屏、乃至第二屏的觀看體驗。
標貝科技體育賽事解說合成數據集
但AI賽事解說還要面對一些現實問題。例如,機器解說通常缺乏明顯的情感變化,而體育賽事中解說員適時的情感流露,往往是球迷最為津津樂道的部分。
因此,為了達到更好的語音解說效果和觀眾收聽體驗,開發者需要對AI解說員進行大量賽事相關的用語習慣和情感風格的模型訓練。
針對AI解說場景,標貝科技基于專業級錄音棚及優質聲優資源,精心建立了AI賽事解說場景合成數據集,并完成對數據庫的音字校對,韻律校對,重音拖音,情感語氣詞等標注,可供算法優化直接使用,確保合成出來的音色更具情感表現力、自然度更高。
標貝科技體育解說合成數據庫
語種:中文普通話,中英混合
采集環境:專業錄音棚,信噪比不低于35dB
數據時長:8小時中文,2小時中英混
錄音語料:體育解說話術
采樣格式:無壓縮PCM WAV格式
采樣率:48KHz 24bit
標注內容:音字校對,韻律校對,重音拖音,情感語氣詞
適用領域:體育賽事解說,游戲解說
歡迎對以上數據集感興趣的行業伙伴聯系我們~
如果以上數據不能滿足您當前的需求,標貝科技還可以針對特定人群、特定場景、特定語種提供相應的數據定制化服務,全力幫助企業客戶得到滿意的數據服務。