谷歌(微博)工程主管雷-庫茲韋爾(騰訊科技配圖)
騰訊科技訊(小貝)北京時間5月1日消息,據國外媒體報道,谷歌工程主管雷·庫茲韋爾(Ray Kurzweil)日前接受了媒體采訪,介紹了他加盟谷歌的目的。作為一位著名企業家、發明家和未來學家,他加盟谷歌曾引起轟動。但庫茲韋爾介紹說,他畢生的目標就是創造真正的人工智能,而谷歌擁有龐大的數據和計算資源,這是其他公司不能提供的優勢,也是他開發人工智能的必備因素。
以下為文章主要內容:
今年1月份,谷歌宣布雷·庫茲韋爾加盟的時候,很多人想知道這位成就卓著的優秀企業家和未來學家,為何要加盟一家并非由他創立的大公司。
庫茲韋爾的答案是:除谷歌之外,沒有任何一家公司能夠提供他實現畢生工作所需的計算和工程資源。庫茲韋爾現年65歲,他有過很多發明成果,包括音樂合成器、語音識別系統等。早在14歲的時候,他就想要創造一種真正的人工智能,甚至預測機器將在2029年達到人類的智能。
現在,作為谷歌的工程主管,他尤其專注于使計算機真正理解,甚至發出自然語言,并最終希望創造一種“電子好友”(cybernetic friend),能夠在你做事情之前就知道你想做什么。
在最近的一次采訪中,庫茲韋爾透露了他計劃在谷歌完成的工作細節。毫無疑問,隨著庫茲韋爾在谷歌工作的深入,這項工作也會隨之發展,但目前為止,這是關于他的計劃的最深層次披露。
最起碼剛開始的時候,這項工作不會直接與廣告相關,但營銷商需要知道,庫茲韋爾和谷歌其他員工的工作不僅能夠改變越來越智能的機器搜索,而且能夠改變我們與信息,以及相互之間的互動方式。所有這些都意味著廣告和營銷的實質發生巨大變化。
問:在你的著作《如何培養思維》(How to Create a Mind)當中,你提出了大腦如何工作的理論。能否簡要解釋一下?
答:世界是多層次的,只有哺乳動物擁有大腦皮層,而大腦皮層的發展有助于更好地理解世界結構,因此你可以更好地根據自己的需求進行調整,并在多層次的世界里解決問題。我們應當分層次進行思考。我們的第一個發明就是語言,而語言也是分層次的。
深入學習,也就是我所說的分層次學習,背后的理論在于,你應當有一種模式來反映想要學習的自然現象的不是層級。如果沒有這種模式,你的學習能力就會變弱,也會被表面現象所迷惑。
問:你如何在谷歌應用這種理論?
答:在這里,我將發展分層方式,尤其是針對自然語言的理解、語義的提取等,事實上就是研發一種方法,對文件中的語義內容進行描述和模仿,進而在搜索和回答問題方面做得更好。
谷歌收到的越來越多的搜索以問題的形式出現,目前這些問題還不具有語義模糊的復雜性。但如果我們能夠真正以分層方式模仿語言,也就是模仿這數十億個網頁想要說什么,我們就能夠更好地回答這些問題,并改進整體的搜索。
問:谷歌或其他公司以前沒有做過這樣的工作嗎?
答:這個方面曾經有過一些學術項目,但沒有人真正研究出解決方案。我要說的是,通過在人機競賽節目《Jeopardy》中的表現來看,IBM的沃森超級計算機在理解語義方面做得非常不錯,它顯示了這項工作的可行性。沃森所具備的知識并非計算機語言編碼,實際上用計算機語言記錄所有常識的觀點顯得非常脆弱,因為它無法反映語言和常識的模糊性。
沃森并非以這種方式工作,它通過閱讀維基百科和其他一些百科全書獲得知識,然后參與這樣一項并不簡單的知識競賽。這其實就是回答問題,問題的覆蓋范圍可能會非常廣泛。而在《Jeopardy》競賽中,沃森的得分超過了兩位最優秀的人類選手之和。
問:為何要來谷歌工作?
答:當然,我經過了深思熟慮。這是我第一次在一家并非由自己創辦的公司工作,我認為這是最佳的選擇。過去多年,我曾有機會與拉里·佩奇(Larry Page)在一些項目上合作,他與我就人工智能進行過很多探討。這里使用的一些算法技術雖然并不深刻,但是谷歌龐大的數據規模使其算法具備了強大的能力。我們經過探討后認為,谷歌龐大的數據和計算架構是創造更強大的人工智能的必要因素。
去年7月份,我曾與拉里·佩奇就我的書進行過會晤,因為我曾向其贈予了一本尚未出版的草稿。我說,我有興趣發起一個項目,或許會創建一家公司來落實某些理念。他則建議說,我應當考慮在谷歌進行這些工作,因為正如我和拉里·佩奇所探討過的,谷歌龐大的數據和計算架構是必備因素。他說:“我可以給你一些接入點,在一家獨立的公司做這項工作會很困難。”這非常觸動我,因此我堅信,除了谷歌之外,我無法在別的地方完成這項工作。
問:這仍然令很多人感到驚訝,因為在做了這么多年企業家之后,你成了一名公司員工。
答:這是制造影響的一個機會,也是我作為一名發明家的目標。盲人閱讀器或許取得了一些科學突破,但真正的滿足來自于數以億計的盲人說,這有助于他們獲得工作,或者接受教育。現在有十億人使用谷歌。如果我可以做出類似的貢獻,那么會給人們帶來巨大的幫助。這是對人類知識的充分利用。
這并非小型項目,而是我在人工智能方面超過50年的經驗積累。我腦海中一直考慮如何應對終極的挑戰,即真正模仿和理解自然語言,并據此完成實際的工作。
問:為何理解自然語言是終極挑戰?
答:阿蘭·圖靈(Alan Turing)進行的圖靈實驗完全依據書面語言。根本上講,這是一個即時信息游戲。要真正掌握自然語言,甚至是掌握書面形式的語言,達到完全令人類信服的水平,這需要全面的人工智能。你需要的不僅僅是簡單的語言處理技巧,有很多聊天機器人也能做這樣的事情,這會令一些人感到誤解。事實上,它們根本無法有效地通過圖靈實驗。
因此,自然語言是人工智能的一個非常深奧的領域,在其他地方我無法像在谷歌一樣完成這樣的項目。現在,我已經在這里工作了幾個月,我能夠看到拉里·佩奇的團隊具備的智慧。
問:為什么這么說?谷歌能夠為你實現目標提供什么幫助?
答:以谷歌的知識圖譜(Knowledge Graph)為例,這是一個擁有7億個主題、地點、人和其他概念的目錄。如果想要理解自然語言,你就必須理解世界上的這些概念和事物,無論是抽象事物還是具體事物。現在知識圖譜擁有7億個入口,數十億個鏈接,并且仍在快速增加。這是我無法創造的內容。顯然,我們要充分利用知識圖譜,因為如果要模仿語言在說什么,你就必須鏈接到這些概念的知識基礎,它們之間已經建立了一些聯系。還有其他一些技術,例如句法分析,這是谷歌以外的地方看不到的。
問:你的著作里有個章節介紹了在芯片和軟件里培養真正思維的步驟。這是否是你在谷歌工作的目的,至少是最終目的?
答:我曾披露過總體的方向,但是我也有一些私人的觀點,顯然不會在書里分享,尤其是如何建立層級。我并沒有在書里談及這些內容。關鍵在于,這些層級并非生而有之,與生俱來的是毫無關聯的模塊,相互之間沒有形成任何模式。然后我們開始學習,甚至在我們出生之前就開始學習,因為我們在26周的時候就睜開眼睛,并開始學習聲音。
重要的是,大腦皮層創造了這種層級,也就是這些模塊如何與更高級的模塊聯系起來。這需要很多年,甚至幾十年才能達到一定的水平。因此,即便大腦皮層非常出色,如果沒有學習過程,這也無濟于事。因此,打造人工智能實際上就是創造一個學習過程。
問:你打算怎么做?
答:我知道如何利用模擬大腦形成的數據層級。這正是我在這里需要做的事情。拉里·佩奇對這本書感到非常興奮,并且非常重視人工智能。因此我有很大的獨立性,我并沒有受到什么規格限制,也不必受制于接下來幾年需要做什么。
盡管沃森曾經擊敗過兩位最出色的人類選手,但它獲勝是因為規模大,因為它可以處理2億頁的內容,而你我卻無法閱讀100萬頁的內容。因此,它的理念就是要擁有足夠的語義,即便我們無法發掘全部的語義,或者像人類世界那樣的規模,但我們可以通過每個網頁,每部書頁,一步一步地在搜索領域做得更好。這就是搜索和知識導航的總體方向。
問:你的出發點在哪里?是否需要克服什么挑戰才能走上正軌?
答:關于如何模仿語義,我腦海里的想法就是眼前面臨的挑戰。在語音識別方面,我可以非常簡單地描述出語音信號輸出的意義:這其實是其他人所說內容的轉述。然后,我可以努力創建一個擁有100萬種發音和正確翻譯的數據庫。這是一個巨大的項目,但卻是切實可行的。隨后你可以進行一些學習算法。我們使用的是分層次學習方法。然后,你可以通過自己的經驗開始學習。
這是第一個步驟,也就是正確地翻譯語言發音,這與自然語言理解一樣困難。你如何反映語言的正確意思?即便不考慮人們語言中的含糊之義,你如何描述它的意思?我腦海中有一個以圖形表達語義的想法。或許它無法抓住每一個細節,但目前的計算機程序無法抓住任何一個語義細節。
然后,我想要建立一個語音識別數據庫。你可以便捷地獲得很多文本范例,只需前往維基百科就可以獲得數百萬個頁面。然后可以建立一個正確翻譯的數據庫,用來表達語義。隨后,我們可以研發一種深入學習算法,用于進行語義翻譯。這樣在遇到一個新句子的時候,或許是用戶在提問中使用的新句子,也或者是每分鐘都會出現的新網頁里的新句子,它能夠正確地進行翻譯。
問:你和你的團隊會不會與谷歌的其他人工智能相關團隊進行合作?
答:我已經成立了一支團隊,有些是內部轉崗,有些則來自外部。我會充分利用這里的其他資源。例如,我們需要充實知識圖譜,使其具有更廣闊的關系網。目前的知識圖譜還不足以涵蓋語言所表達的所有關系。因此,我們在自然語言理解方面首先要做的就是讓知識圖譜團隊擴充知識圖譜,并加入更多的關系。
問:你的最終目標是不是打造一種能夠通過圖靈實驗的人工智能,或者能夠利用這些技術提升人類大腦?或者你會不會把這兩件事情分開來完成?
答:如果你談的是我的職業,那么我首先是一個發明家。我進入未來學術領域,也是為了服務于自己的發明事業。時間很重要,著名發明家都能夠很好地把握時機。拉里·佩奇和謝爾蓋·布林在整理互聯網鏈接、打造更好的搜索引擎方面形成了出色的理念。如果他們早幾年或者晚幾年,你或許就不會知道他們的名字。這就像雙向飛碟射擊一樣。回想三到四年前,大多數人還沒有使用社交網絡、維基和博客。回想十多年前,大多數人還沒有使用過搜索引擎。
我的個人動機并不是打造一臺能夠通過圖靈實驗的計算機,而是做出一種短期的貢獻。自然語言理解是一個沒有終點的目標,搜索也是如此。我認為這個項目沒有結束的那一天。
問:深入學習和神經網絡會如何改變計算機的本質?
答:馮諾伊曼計算機(也就是如今所有傳統計算機的基礎)的結構與大腦結構有很大區別。在大腦里,100萬億個神經元連接都在同時進行計算。因此這是真正的大規模平行處理。但是這些計算速度非常緩慢,例如每秒只能計算100次。而且這些計算本身并不重要,它只是形成了一個概率整體。計算機并不是這樣。
超級計算機的速度已經超過了模仿人腦所需的運算能力,不僅在分子層面模仿,而且在功能方面模仿。這是一個重要的區別。過去曾有亨利·馬克萊姆(Henry Markram)發起、已獲10億歐元資助的“藍腦計劃”,現在美國又有了“腦活動地圖”(Brain Activity Map),這是為了在分子層面復制大腦。
問:你認為這并非可行的道路?
答:這是一個偉大的項目,但并非創造人工智能的正確道路,而是檢驗我們對人腦工作理念的方法。這是了解大腦、了解神經如何工作、了解離子渠道如何運行的有效方法,也是創造大型大腦模仿器并看它是否正確運行的好方法。這是研究大腦的方法,然后我們可以進行借鑒,利用這種生物算法來創造人工智能。
問:還有哪些因素會決定我們何時看到真正的人工智能?
答:需要考慮“加速回報定律”。根據信息技術的進步,我們總是用今天的技術去創造下一個技術。軟件領域同樣如此。只要有一個系統運行,我們就可以改進它,而且是成倍地改進,而非漸進式的改進。同樣的技術可以使我們看到大腦內部,大腦掃描的分辨率不斷提升,我們通過神經學獲得的數據模塊也越來越多。然后,我們可以利用這些信息研究如何利用大腦的生物算法改進人工智能。