人工智能的發展是否會讓機器大量取代人類的思考和工作,現在難以定論是非,但目前我們至少可以利用人工智能來幫助我們挖掘數據的金礦,讓我們通過數據理解自我和世界。這也和TED創始人、被譽為“信息架構之父的” 理查德•沃曼(Richard Saul Wurman)曾表達的觀點不謀而合。
日前,在百度德爾塔俱樂部組織的交流活動中,針對如何洞察數據和世界、如何利用科技增進人類相互了解等問題,百度研究院副院長余凱博士和理查德•沃曼展開了一次智慧交鋒。余凱表示,“數據給了我們很多機遇,尤其是人工智能在過去10年的發展中,讓我們意識到數據可以在許多領域產生新的玩法。”
理查德•沃曼和余凱(右)親切交流
余凱之所以會對數據有此洞見,是出于多年來在機器學習和數據挖掘等人工智能領域的鉆研。他曾受邀在美國斯坦福大學主講人工智能課程,一直從事深度學習等領域的核心技術研發和團隊管理。他曾帶領百度多媒體部大力推進公司在圖像和語音技術方面的研發。他所領導的百度深度學習研究院(IDL - Institute of Deep Learning)于2013年成立,成為與IBM、谷歌、微軟所設研究機構齊名的全球著名研究機構之一。值得一提的是,他所領導的項目團隊在短短兩年里已經三次問鼎百度最高獎。
如今在百度,深度學習已經被成功用于鳳巢廣告系統,網頁搜索,語音識別,圖片搜索等方方面面。百度語音識別的準確率已達到94%,圖片搜索的準確率也達到80%,均處于業界領先水平;在人工智能領域,百度大腦擁有200億個參數,超越谷歌大腦,構造起世界上最大的深度神經網絡。
沃曼認為,對大數據的分析利用應該進一步準確定義為“大理解”。在他看來,盡管今天很多人提到“信息爆炸”,但事實上人類在很多領域對數據的理解并不夠深入,如在城市信息化、金融、醫療等領域,數據可以幫助我們把復雜的事情變得簡單。
一直在深度學習領域鉆研的余凱深有感觸,但余凱也提到,“雖然數據是真實的,但是它會具有偏向性,不同的分析方式,會有不同的解讀,所以它可能不會是完全客觀的。要審慎的用正確方法處理數據,才能獲得正確的信息。”
深度學習領域的探索依賴于足夠大體量的數據和聰明的工程師。一方面,百度在過去多年發展中,在“數據采集”和“數據加工”領域積累了豐厚的家底,并且移動互聯網的廣泛普及使得百度能從更多維度去獲取數據,如移動搜索方面的用戶搜索習慣,百度地圖上的LBS數據,智能硬件方面的人體健康數據等。另一方面,百度在深度學習領域的投入也包括吸引一大批世界級科技精英加盟,包括“谷歌大腦”之父吳恩達教授,前Facebook資深科學家徐偉、美國新澤西州立大學統計系教授張潼、前AMD異構系統首席軟件架構師吳韌等,使其成為業界推動“大數據驅動的人工智能”的領導者之一,位列深度學習研究的第一陣營。
對話中,沃曼不止一次提到自己的“好奇心”,稱正是好奇心驅動他創辦了TED,以及后來備受推崇的“用思想的力量來改變世界”的TED大會。如今年近八旬的沃曼仍然保持著探索未知的熱情。沃曼說,當前,全球人口的50%在城市里生存。未來這一數字將達到70%。云和大數據是我們理解數據的方式之一。我們希望為城市設計這樣一種語言,使得大家可以互相交流、理解。
對此,余凱表示,百度研究院不僅致力于深度理解大數據,更在逐步將大數據轉變為“大行動”, 只有行動,科技才真正改變世界。例如自去年春節期間推出“百度遷徙”之后,百度大數據部聯合大數據實驗室陸續推出了景點城市預測、疾病預測、高考預測、世界杯預測、經濟預測、百發100指數等多款大數據產品,內容涉及出行、體育、宏觀經濟、股市行情的多個領域,成為全球范圍內大數據落地產品最多的一家互聯網巨頭。甚至有人將其和IBM、谷歌共同列為全球大數據三巨頭,并稱“BIG”。而在今年的世界杯預測中,百度更以58.33%的小組賽預測準確率和93.75%的淘汰賽預測準確率,領先其他兩家巨頭。
余凱看好技術對世界的改變。隨著百度深度學習團隊在深度學習領域的耕耘,他們所開發技術廣泛應用于百度的鳳巢系統,網頁搜索,手機百度,圖片搜索,百度翻譯、涂書筆記,百度魔圖、百度識圖等產品,在改變人們的思想和行為,增進人們對世界的了解。近期百度深度學習研究院更是陸續曝出開發無人駕駛自行車和汽車的消息,為人們未來的自由溝通、自在出行打造更大的想象空間。余凱談到未來團隊的使命時表示,“我們希望通過百度的服務和產品,讓用戶每天的生活充滿意義,不僅如此,我們想要用技術讓每一個人普通人更有創造力,更偉大。”