“嗨,歡迎寶寶來到直播間,點擊關注不迷路,每晚都有直播福利哦~”
“618福利來了,直播間的粉絲寶寶們,12點整的時刻我們就最先抽免單了啊~”
當你走進直播間,看到“虛擬主播”跟你打招呼時,千萬不要驚訝。現在各大平臺已經有越來越多的虛擬人坐鎮直播間,這也是今年618平臺正在重推的直播帶貨賽道“新亮點”。
事實上,如果不仔細觀察,你很難發現這些主播是AI虛擬主播。她們不僅外形與真人相似,在聲音、情感和動作方面也表現得非常逼真,有些甚至還具備跳舞、唱歌等才藝。
AI賦能數字人 打破直播帶貨次元壁
從以“一禪小和尚”、“我是不白吃”、“默默醬”等為代表的虛擬IP初探直播帶貨開始,AI數字人直播正逐漸改變傳統的零售業和電商行業。越來越多知名品牌已經開始嘗試利用AI虛擬人直播來推廣自己的產品,例如完美日記的“Stella”,自然堂的“堂小美”,花西子的“花小西”等虛擬主播。
相對于真人主播高昂的運營成本,虛擬主播不受時間、地點、環境限制,一鍵開播,24小時全天候在線的優勢,極大的降低了商家直播帶貨的成本。對于平臺而言,虛擬主播是電商平臺生態布局中不可忽略的一環,通過不斷降低直播門檻,增加平臺對中小商家的吸引力。
高質量合成數據集 打造“能說會道”的優質主播
AI數字人直播帶貨,已然是大勢所趨。不過,要實現廣泛商業化落地也面臨著不小挑戰。尤其是高配版的虛擬人,效果越逼真,成本也會水漲船高。
直播間里,主播主要通過聲音和畫面兩種途徑來介紹產品信息。其中聲音是不可忽視的“第一媒介”。首先,主播有一個自然流暢、情感豐富的音色,才能給用戶帶來舒適的聽感,反之,如果主播的聲音過于機械、冷漠,則會影響觀看欲望;其次是互動體驗,例如主播通過語音控制發紅包,粉絲通過語音連麥與主播溝通,都會增加與直播間用戶的粘性。
因此,為了達到更好的直播效果和用戶體驗,商家需要對虛擬主播的語音交互能力不斷進行調試,打磨直播話術,完善與用戶互動的功能。
從技術層面來看,基于機器學習的各種能力,都離不開算法和數據的積累。想要提高直播帶貨場景下的語音交互能力,就需要大量的優質直播場景數據作為模型訓練支撐。
標貝科技深耕AI數據服務領域多年,在數據采集和標注方面具備豐富的實踐經驗。針對直播帶貨場景,標貝科技基于專業級錄音棚及優質聲優資源,精心建立了高質量語音合成數據庫,并完成對數據庫的音字標注、韻律標注、音素邊界標注、口語化標簽標注等,可供算法優化直接使用,確保合成出來的音色更穩定、自然度更高。
基于直播帶貨場景的合成數據庫
語種:中文普通話、中英混合
采集環境:專業錄音棚,信噪比不低于35dB
數據時長:5小時中文,1小時中英混
錄音語料:主播直播帶貨話術
采樣格式:無壓縮PCM WAV格式
采樣率:48KHz 24bit
標注內容:音字標注、韻律標注、音素邊界標注,重音、拖音、笑聲等標簽標注
適用領域:直播帶貨
歡迎對以上數據集感興趣的行業伙伴聯系我們~
如果以上數據不能滿足您當前的需求,標貝科技還可以針對特定人群、特定場景、特定語種提供相應的數據定制化服務,全力幫助企業客戶得到滿意的數據服務。