5月17日,在北京舉辦的“搜狐科技5G & AI峰會”上,由搜狗聯合搜狐新聞客戶端傾力打造的演員柳巖同款明星“數字人”驚艷亮相。目前,該明星“數字人”已經在搜狐新聞客戶端“24小時頻道”正式上崗,再次展示了搜狗分身技術的魅力與領先實力。
明星播報提升“視聽”體驗
人工智能技術的發展和5G時代的到來,使得傳媒產業及新聞資訊行業正在快速進入智能化、多元化、個性化、視聽一體化的軌道,在互聯網上,傳統的“讀文”或者“讀圖”方式已經難以滿足大眾的要求。
在此前提下,由搜狗引領的AI合成主播得以快速落地、廣泛運用、迅猛發展,搜狗與新華社合作開發的全球首款AI合成主播“新小浩”、與俄羅斯塔斯社合作開發的全球首款俄語主播LiSa、搜狗自有形象合成主播“雅妮”等也成為人們耳熟能詳的名字。
與新小浩、雅妮等“前輩”相比,除了形象栩栩如生、播報專業流暢、感情豐富逼真等一脈相承的優點之外,因為搜狗分身技術的持續迭代和柳巖明星效應的加持,還能夠給用戶帶來更加沉浸的視頻播報、更加愉悅的視聽感受和更加尊貴的使用體驗。
技術突破成就“分身”魅力
峰會現場,明星“數字人”在播報新聞時語調抑揚頓挫、動作自然順暢,無論是簡單的動作、細微的唇動,還是招牌性的表情,都和柳巖本人一模一樣,此外,還能在一條新聞中無縫切換河南、湖南、四川、陜西、東北等多種方言,更是讓柳巖“自愧不如”,這一切均得益于搜狗分身技術的持續創新與突破。
搜狗分身技術基于搜狗業界領先的AI能力,僅靠少量真實音、視頻數據即可定制出高逼真度的分身模型,幫助媒體在融媒體轉型、新聞時效性、跨語種傳播能力等領域實現升級。
柳巖明星“數字人”的重要突破,在于創新運用了搜狗提出的“StyleTTV端到端合成框架”, 將搜狗自研的端到端語音合成框架StyleTTS技術再次向前推進一步,通過音視頻聯合端到端建模以及合成,能夠實時生成風格多樣、自然逼真的數字人視頻內容。其中,風格化語音合成實現的創新技術突破,能夠實現不同發音人的韻律模型以及音色模型的自由重組搭配,語音播報風格、口音、情感、特色方言等維度能夠靈活選擇與控制,從而實現抑揚頓挫的韻律節奏和豐富立體的情感表達,讓“分身”的語音表達更加真實、更具表現力和感染力,滿足不同場景的需求。
AI合成主播或迎“明星潮”?
“黑科技”不僅讓普通人驚嘆,對于明星也具備吸引力,搜狗首個明星形象AI合成主播——柳巖同款明星“數字人”的誕生就是一個很好的證明。
依照當前AI技術的進步速率和搜狗分身的發展趨勢,未來人手一位明星“同款”助理或許并不是幻想,因為“她”的運用不僅有利于平臺、為用戶提升了使用體驗,同時也維護和鞏固了明星自身的曝光度和影響力,可謂一舉多得。
從這個意義上來說,柳巖同款明星“數字人”的誕生起了個好的開頭、邁出了第一步。下一階段,AI合成主播、或者說AI助理迎來“明星潮”,或許可以成為一個值得期待的事情。