【TechWeb】8月25日消息,在今天舉辦的百度大腦語言與知識技術峰會上,百度CTO王海峰發表題為“掌握知識、理解語言、擁有智能”的主旨演講,分享了百度語言與知識技術的十年發展歷程、最新突破等等。
王海峰表示,語言與知識技術是人工智能認知能力的核心。在百度語言與知識技術的布局和發展中,百度始終在注意把握兩個趨勢,即技術發展趨勢和產業發展趨勢,并力爭引領趨勢,從研究方法、研究對象、研究方向、產業應用等各個層面,完整布局,不斷打磨成熟,始終與應用的發展趨勢、需求一脈相承。
同時,王海峰展示了百度完整的語言與知識技術布局,包括知識圖譜、語言理解與生成技術,以及上述技術所支持的包含智能搜索、機器翻譯、對話系統、智能寫作、深度問答等在內的的應用系統,并對上述技術布局逐一展開解讀和分享。
知識圖譜是機器認知世界的基礎,王海峰透露,目前百度打造了世界上最大的多元異構知識圖譜,擁有超過50億實體和5500億事實,并在不斷演進和更新,已應用于各行各業,每日調用次數超過400億次。
此外,王海峰介紹,在知識的加持下,語言理解相關技術的能力不斷增強,機器也可以逐漸像人一樣不斷學習、不斷進步。百度提出知識增強的語義理解框架文心(ERNIE),即在深度學習的基礎上融入知識,具備人類一樣的學習能力,曾一舉登頂全球權威數據集GLUE榜單,首次突破90分大關,刷新榜單歷史,并且超越人類得分。
同時,百度還研制了知識增強的跨模態深度語義理解方法,通過知識關聯跨模態信息,運用語言描述不同模態信息的語義,進而讓機器實現從“看清”到“看懂”、從“聽清”到“聽懂”,即圖像和語言、語音和語言的一體化理解。