2021年12月11日,由OPPO數(shù)智工程事業(yè)部和OPPO小布助手聯(lián)合主辦的“OGeek行業(yè)技術沙龍”在北京圓滿落幕。
本次活動邀請到了OPPO小布助手首席架構師萬玉龍、Magic Data創(chuàng)始人兼CEO張晴晴、OPPO語音合成負責人宋陽、網易有道語音技術負責人孫艷慶和美團平臺算法研究員楊帆五位業(yè)內專家到場,圍繞多場景智能助手與大家進行了分享交流。
Magic Data 創(chuàng)始人兼CEO張晴晴:多語種對話式AI技術及語料庫建設
對話式AI正在全面普及,在全球文化進一步交流與融合的背景下,該如何解決多語種對話式AI的技術痛點?
張晴晴介紹了Magic Data從聲學角度進行的非母語發(fā)音字典建模和混合雙語聲學建模,以此提高雙語識別系統(tǒng)性能。同時在ASR、TTS和發(fā)音字典方面構建統(tǒng)一的音素集,將中英文以及其他語言里相似的音素集進行聚類。這種方式能夠在資源受限情況下進一步加大數(shù)據(jù)復用性,同時增加了模型構建過程中的穩(wěn)定性。
除此之外,張晴晴提到Magic Data同樣致力于對話式訓練數(shù)據(jù)語料庫的建設,目前已經擁有超20萬小時、60種語言的訓練數(shù)據(jù)集,其中對話式數(shù)據(jù)包括14萬小時,并在智慧出行、智慧金融、智慧社交、智能家居、智慧終端等多領域進行應用。
同時,為了能大幅度提高數(shù)據(jù)標簽化效率,及時供給人工智能“原油”,Magic Data公司核心團隊深耕行業(yè)數(shù)十年,發(fā)布Annotator(中文名:安耐拓)智能化標注平臺,平臺可私有化部署到企業(yè),企業(yè)數(shù)據(jù)不出內網即可完成對數(shù)據(jù)的結構化工作。此外,該平臺多模態(tài)標注、任務可拆分、可視化管理和智能化輔助等核心功能,有效幫助企業(yè)在數(shù)據(jù)處理中降本增效。
OPPO語音合成負責人宋陽:OPPO語音的落地探索
OPPO語音在“語音合成國際評測Blizzard Challenge 2020”榮獲自然度第1名、相似度第2名的好成績。此外,其機器翻譯技術還在WMT20中摘獲6個賽道冠軍、3個賽道季軍,碩果累累,成績斐然。
那么,這些技術積累在實際應用中有哪些體現(xiàn)呢?宋陽介紹到,結合了語音識別、機器翻譯、語音合成的同聲傳譯技術,可以運用在外語通話場景、會議演講上屏顯示、外語視頻增加字幕等場景;針對兒童場景,同聲傳譯技術可以在一定程度上協(xié)助小朋友們更好地鍛煉口語表達能力。
此外,OPPO語音還擁有通話同傳、多音色情感語音合成、多音色情感語音合成、異步轉寫、性別年齡識別等一系列尖端技術,為開發(fā)者提供多場景生態(tài)下的智能語音服務。
網易有道語音技術負責人&有道人工智能團隊技術總監(jiān)孫艷慶:用AI技術助力高效學習
網易有道依托強大的互聯(lián)網AI技術手段,圍繞學習場景打造了一系列深受用戶喜歡的學習產品和服務,包括有道詞典筆、有道聽力寶、有道詞典等。以詞典筆為例,超快點查翻譯、口語評測、高質量離線語音合成等技術的應用,使詞典筆得以成為真正優(yōu)質的學習助手。
孫艷慶介紹道,有道AI能力積累了NLP、CV、語音交互、高性能計算等核心技術,還擁有強大的自適應學習分析能力,其多維度AI技術的布局,覆蓋多個技術維度,打通了有道線上線下所有產品。
例如,通過語音交互AI能力打造語音交互閉環(huán),進而提升用戶體驗;多語種自動語音識別(翻譯)技術、高質量低資源語音合成技術,應用于自動字幕、語音助手、多語言語音翻譯/同傳等場景。
美團算法研究員楊帆:智能對話技術在美團的應用實踐
美團秉持“讓大家吃得更好,生活更好”的使命,年均服務超6.3億用戶、770萬商家,面對200多個生活場景,如何高效便捷的完成用戶、商家、騎手、客服等多種角色之間的交流變得尤為重要。在美團強烈的業(yè)務需求場景下,智能對話技術得以飛速發(fā)展。
楊帆提到,美團語音智能助手通過語音的形式,讓用戶更便捷的觸達美團各類服務。商戶助理、客服機器人、外服機器人便是其場景落地的關鍵體現(xiàn)。
簡單地說,商戶助理,通過咨詢問題預測、回復話術推薦、機器人應答等技術幫助商戶高效服務用戶,改善消費者和商家的溝通體驗;客服機器人幫助用戶快捷自助解決服務問題,日均響應百萬級的服務進線;外呼機器人在回訪調研、信息采集、拉新促活等業(yè)務上極大提升運營效率。
總的說來,美團智能對話技術的發(fā)展已經應用在美團的方方面面,并切實地幫助美團的各類服務高效溝通。
OPPO小布助手首席架構師萬玉龍:小布助手的智能交互創(chuàng)新實踐
OPPO小布助手作為國內首個月活破億的手機語音助手,其智能創(chuàng)新實踐也備受矚目。自2018年12月首次發(fā)布以來,小布助手歷經三年探索,完成了從單模態(tài)到多模態(tài)的技術演進。
小布虛擬人的發(fā)布則是小布助手技術成果的關鍵表現(xiàn)。萬玉龍介紹,小布虛擬人將傳統(tǒng)的人機交互演化為“人與虛擬人”的交互,打破機械交流與情感交互之間的又一鴻溝,突破了用戶與智能助手的距離感,在互動體驗更自然流暢的同時,讓情感交互體驗升級。
日程、天氣、鬧鐘等全天候服務提醒,“快捷指令+語音”的便捷場景化讓老人無憂,更有多設備協(xié)同等應用全面觸及各種生活所需。小布助手堅持以技術為基礎,服務為根本,創(chuàng)新實踐為檢驗,在人工智能領域不斷地探索和開發(fā)。
寫在最后的話:
除了五位業(yè)內專家的分享,在交流環(huán)節(jié),各位觀眾也積極交流了自己工作生活中與人工智能有關的經驗,在良好的交流氛圍中分享行業(yè)各領域從業(yè)者對于AI應用的不同看法。
OPPO創(chuàng)始人兼首席執(zhí)行官陳明永此前曾發(fā)布OPPO品牌信仰“科技為人,以善天下”,在本次交流活動OPPO依然貫徹此心,OGeek Day將以技術沙龍活動為基石,著力搭建業(yè)內技術交流的橋梁,促進云、大數(shù)據(jù)、AI等技術蓬勃發(fā)展。