近日,自然語言處理頂級學術會議之一EMNLP 2020在線上舉行。EMNLP由國際計算語言學學會(ACL)旗下SIGDAT組織,會議涵蓋語義理解、文本理解、信息提取、信息檢索和機器翻譯等主題。會上,由百度聯合Google舉辦的首次機器同聲傳譯學術講習班(Tutorial)召開,圍繞機器同傳的背景、挑戰、模型、數據集、實用系統和產品、未來研究方向等展開報告和研討,吸引了數百位國際學者參會。
(EMNLP2020同聲傳譯學術報告會)
同聲傳譯一直都被學界和工業界廣泛認為是自然語言處理最難的問題之一。從翻譯模式看,相比傳統的文本翻譯,同聲傳譯對翻譯時延和準確率要求極高,這使得翻譯模型總是需要在信息不充分的情況進行翻譯,因而較之傳統機器翻譯,同聲傳譯難度又翻倍;從譯員角度看,同傳專業性極強、難度極大、耗腦又耗嗓,對同傳譯員要求極高,除了深厚的語言能力外,還需要極強的反應能力,邊說邊聽,精力高度集中,對譯員的腦力和體力都是極高的挑戰。因此往往一場會需要兩個甚至多個譯員共同完成同傳。
近年來,隨著語音處理、機器翻譯等人工智能技術的快速進步,機器同傳成為學術研究前沿課題,既取得了很大進步,同時也仍然面臨諸多挑戰。基于此,由百度聯合Google主辦的前沿講習班圍繞機器同傳展開了深入剖析,從機器同傳的發展背景、面臨挑戰展開,詳細介紹了機器同傳的發展現狀和技術演進,同時介紹了實用系統研發面臨的實際問題以及目前同傳的多種產品形式,最后對機器同傳未來的發展方向進行了探討。據悉,這是國際上首次舉辦的有關機器同聲傳譯的學術講習班。
此次報告會指出,人類同傳員的稀缺和人腦能力極限,正凸顯了自動同傳系統的必要性和相比人類同傳的優勢。在此現狀下,機器同傳開始逐步應用于大型國際會議,并在翻譯策略上持續演進。同時,會上還深入淺出地介紹了機器同傳技術在文本和語音翻譯層面的演變方向,從固定翻譯策略模型朝動態翻譯策略改進,再到業界新近提出的增量式語音合成模型(incremental TTS)。
作為此次學術報告會的領銜舉辦方,百度分享了其目前在同傳方向、不同場景下的實際落地的產品和使用效果。據介紹,百度AI同傳先后提出集成預測與可控時延的翻譯模型、語義單元驅動的上下文感知翻譯模型、融合音節與文本的聯合編碼模型、基于知識蒸餾的端到端同傳模型、語音識別與翻譯交互解碼等一系列創新技術。同時,還發布了覆蓋線下會議、遠程會議、線上線下融合會議,以及主題演講、多人討論等全場景、高質量、低時延的同傳解決方案。
(百度AI同傳解決方案)
目前,百度AI同傳技術已廣泛服務于中國國際服務貿易交易會、全球人工智能技術大會、第三屆中國國際進口博覽會等多個國家級大型會議,幫助數千萬海內外觀眾實時了解會議內容。其中,在服務第三屆中國國際進口博覽會中,百度AI同傳技術還實現了產品層面的突破,提供了“大屏+手機”的創新雙模式,使得與會人員能夠通過會議大屏“看同傳”,也能夠通過手機端的AI同傳服務 “聽同傳”。
針對當前面臨的挑戰,百度希望可以聯合學界、工業界共推同傳技術進步。明年將繼續舉辦機器同傳國際研討會和機器同傳評測,希望更多單位參與進來,一起推動技術進步。
隨著全球貿易發展的提速和跨國學術商業交流的頻繁開展,AI同傳的作用將持續放大。而百度AI同傳憑借先進的技術、完整的解決方案和不斷創新的產品體驗,將在其中扮演重要角色,助力國際會議、講座培訓、內部會議、商業洽談等多場景下的跨語言交流,打破語言障礙,讓溝通更便捷。