日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

【編者按】在開源與人工智能的燦爛星河里,賈揚清的名字都格外地耀眼。因為導師 Trevor Darrell 教授的一句“你是想多花時間寫一篇大家估計不是很在意的畢業論文,還是寫一個將來大家都會用的框架?”,學生賈揚清一頭扎進了創 Caffe 的世界。Caffe 成了賈揚清的代表作,而賈揚清的開源與 AI 征途還將走得更遠。

采訪 | 劉韌,云算科技董事長、《知識英雄》作者、DoNews 創始人

作者 | 李欣欣 劉韌 周揚 責編 | 唐小引

出品 | 《 新程序員 》編輯部

2013 年 6 月,伯克利大學。28 歲的賈揚清(見圖 1)正在寫 Decaf(Caffe 的前身)。3 個月后,賈揚清博士畢業,此刻,他在和伯克利心理學系的 Thomas Griffith 教授合作,研究一個心理學課題──人類在個人成長過程中是如何形成“類別”概念的。研究中,賈揚清用一個概率框架來表達人的行為,但從圖像中提取到的人的行為特征較弱,很難推導出完整的結論。

圖 1 伯克利時期的賈揚清

一天,賈揚清看到,一篇獲得 2012 年 ILSVRC 比賽第一名的論文“ Advances in neural information processing systems”,提到深度學習 Ale.NET 模型,用 Convolutional Neural Network(卷積神經網絡,簡稱 CNN)技術,擊敗了其它非神經網絡的算法,只用兩塊 GPU 即可替代此前 google 1 萬 CPU 方案。一臺機器頂一萬臺機器,且錯誤率從 25%降到 15%。這篇論文,一石擊水,震驚行業。此前,神經網絡一直不被業內人看好。

賈揚清受到啟發,思考著將論文里的 CNN 提取特征技術,運用到他手頭的心理學項目研究上。于是,賈揚清找到 Alex Krizhevsky(AlexNet 模型的作者之一),問他是否可以分享 AlexNet 的源代碼?Alex 這樣回復:抱歉,我開了公司,正在創業,因知識產權問題,無法直接給代碼,但你在研究過程中,遇到問題時,可隨時問我。

恰在此時,賈揚清得到 NVIDIA 的學術捐贈計劃,收到了一塊 K20 的 GPU(見圖 2),對學生來說,“GPU 是很貴的!”于是,正在寫畢業論文的賈揚清,動手攢了一臺機器,利用空閑時間,復現 AlexNet 框架,用以提取圖像中的特征。

圖 2 最早做框架的 GPU

此時的賈揚清每日搭乘地鐵,去 Google 公司實習。坐在地鐵座位上,賈揚清打開電腦,攤在雙腿上,見縫插針地繼續寫框架。作為 GPU 的初學者,萬事開頭難,但賈揚清沉迷其中,“寫代碼可能和玩游戲上癮差不多。”“我花在編程上的時間從 20%、40%、80%……逐漸遞增。”在 Google,賈揚清每天都要喝數杯咖啡,“這樣不好”,賈揚清把正寫著的框架命名為 Decaf,是想警醒自己,戒咖啡。

此時,賈揚清的任務清單里有:⒈博士畢業論文;⒉心理學研究課題;⒊找工作;⒋復現 AlexNet 框架。比起前三項任務,賈揚清把更多的時間花在了最后一項,寫論文的時間被嚴重擠壓。他找導師 Trevor Darrell(計算機科學家、伯克利教授)尋求建議,導師只問了一個問題:“你是想多花時間寫一篇大家估計不是很在意的畢業論文呢?還是多花時間寫一個將來大家都會用的框架?”

導師的話鼓舞了賈揚清,他把論文擱在了一邊,一頭扎進 Decaf。“導師總能教會我,分清主次。”

賈揚清寫好了腳手架,小規模“跑起來”后,他把 Decaf 放到了伯克利的小組里,讓同學們試用,大家都覺得“還挺好用的” 。Evan Shelhamer、Jonathan Long、Jeff Donahue、Sergio Guadarrama 和賈揚清一拍即合,決定組成一個“核心小團伙”,在日常科研和工程工作以外,一起開發 Decaf。很快,“小團伙”復現出 AlexNet 模型。

Decaf 需要基于 cuda-convnet 來訓練,但是通過 Decaf 驗證,深度學習特征能夠利用學習范例進行深入實驗,大家覺得,干脆二次開發,做成一個完整的深度學習框架,讓它成為通用又干凈的 AI 框架工具。

因為 GPU 飛快的速度,賈揚清忖思著把 Decaf 改為 Caffe,伯克利小組的同學們更喜歡 Caffe 的叫法。于是,Decaf 更名為 Caffe。兩個月后,Caffe 寫完了。賈揚清特意跟導師申請了一筆費用,買來一臺冰滴式咖啡機,放在研究室。此后,Evan Shelhamer 經常給大家做咖啡喝,這導致本想戒掉咖啡的賈揚清“最終也沒能戒掉咖啡”,大家索性把對外接洽咨詢工作的郵箱也改為了 caffe-coldpress。

圖 3 賈揚清最早用來開發 Caffe 的電腦主機

賈揚清面臨一個難題:該用哪種方式公布 Caffe?是像 Alex Krizhevsky 一樣成立創業公司,商業化運作?還是作為程序庫,純粹支持科研?還是開源?賈揚清舉棋不定,而其他 Caffe 開發者的意見也各有傾向,莫衷一是。

賈揚清有心開源 Caffe。他想到過去幾個月,若是有一個公開的深度學習框架,能獲取代碼和算法的細節,自己就不必再浪費精力復現。而且,“當學生時,我內心深處就有‘做出一個東西,放到開源上’的愿望”,“我在伯克利所用到的代碼,絕大多數都是開源的”,“只有把市場做大,大家才可能都有蛋糕吃”,“開源,并不會抹滅個人的技術能力”,“反正,買咖啡喝,我還是買得起的!夫復何求呢。”

該如何讓大家同意呢?“這可比寫 Caffe 難多了”。賈揚清決定,挨個找核心開發的同學們談。有的同學好談,有的則難辯,賈揚清急了,脫口說出氣話“這是我寫的框架,所以我應該有決定權!”的時候也有,前后談了 7 天,最后,所幸同學們都同意 Caffe 開源。

2013 年 12 月,Caffe 放到 Github 上,正式開源。得知消息的 Alex Krizhevsky 也很開心。賈揚清的導師建議把伯克利大學寫在 Caffe 的說明上,賈揚清也很樂意,“Caffe 以伯克利大學的名義開源,大家很驕傲,覺得為母校爭光了。”

在 Google 實習時,賈揚清拿到了 Google 的正式 Offer,只等畢業后入職。不再想找工作的賈揚清完全放飛,索性畢業論文也不寫了,最初研究的心理學課題,也不了了之。

Caffe 開始吸引用戶和開發人員,借由 Caffe 光環,賈揚清結識了許多業內人士。兩個月后,賈揚清意外收到英偉達公司的郵件,英偉達提出,將為伯克利研究所提供計算的資源,派工程師和賈揚清他們一起做框架優化,提升 Caffe 的應用穩定性。賈揚清同意合作,他看中英偉達在系統側的優勢。接下來的一年,汲取各方的力量的 Caffe,走在加速發展的路上。

Google 工作之余,賈揚清繼續和伯克利的同事們一起維護 Caffe。賈揚清開始重新設計 Caffe 的一些結構,使它更模塊化,更能適配各種環境下部署。有開源社區經驗的 Evan Shelhamer 主導和各方進行合作;Jeff Donahue 幫助 Pinterest 建立了一個深度學習系統;Jonathan Long 給 Caffe 提供了包括 Python/ target=_blank class=infotextkey>Python 接口在內的諸多新特性……在社區建設上,由 GitHub 和 caffe-users 郵件組一起組成了松散、自由的組織,依靠 Caffe 的使用者們自發管理。

做 Caffe,賈揚清經歷了從 0~1 的完整項目經驗積累,“Caffe 應該算是我第一個 C++ 的項目。”整體上“對我的鍛煉很大,從組團開發、到如何推廣、如何獲取反饋、如何改進流程,我親歷了每個環節。”離開伯克利的第二年 5 月,賈揚清才終于完成了博士畢業論文。

小鎮青年上清華

1984 年,賈揚清生在紹興上虞縣。父母都是中學語文老師。1 歲時,賈揚清最愛聽故事,媽媽常拿著圖畫書給他講故事。3 歲時,賈揚清已識兩三百個字,常常捧著一本書,讀得入迷。5 歲,父母帶他去新華書店,賈揚清挑了《安徒生童話》,媽媽驚訝地問:書里的字,你能看懂嗎?賈揚清點了點頭。

賈揚清一家人住在校園,安寧平靜,生活規律。6 點,父母起床,去守早自習,賈揚清也跟著起來了。小學六年級,賈揚清從父母所在的學校插班到上虞市中心學校,新環境,賈揚清感到好奇之余也有點自卑感,他更加努力學習,想通過成績來證明自己。中考,賈揚清以上虞區第三名的成績考進春暉中學。

初二,流行學計算機,盡管學校有機房,賈揚清父母還是花 7000 多元,給他買了臺奔騰Ⅱ。賈揚清憑感覺在機器上搗鼓,試裝各種軟件、玩掃雷游戲……有一次,賈揚清去同學家玩,看到同學用鼠標在計算機屏幕上的圖形界面上點來點去,并向他演示自己在學編程,賈揚清覺得好玩。回家后,他摸索著用 BASIC 寫出一個小程序──在方框里輸入一個年份數字,屏幕上顯示出年份所對應的生肖。

計算機讓賈揚清覺得“可以創造出一個新東西。”“很開心。”但賈揚清聽父母話,為高考的目標,仍把精力放在學習上。初中,語文老師教同學們寫文學評論,賈揚清把《論<西廂記>里詩歌的描寫和藝術》當選題,老師很詫異,跟賈揚清的媽媽說:讓孩子看《西廂記》是否太早了?媽媽則說“看吧,沒關系。”父母教語文,賈揚清家里文學類書多,他常隨意從父母的書架上抽出一本書,翻看。拿下一本錢鐘書的《談藝錄》,翻了翻,當然“看不懂,又放了回去。”賈揚清看《西方文學史》《荷馬史詩》,感覺“外面的世界和我生活的小城是不一樣的。”賈揚清看《十四行詩》發現,西方的詩歌講究韻腳,類似中國古代詩歌平仄。“居然可以相互印證,很有意思……”賈揚清一直對文學感興趣,但他選了理科。“比起文科,理科可以靠自己的努力,走得更遠一點。”又或許,受當時人人都說“學好數理化,走遍天下都不怕”的大環境影響。

高中,賈揚清拿到了全國物理和化學競賽兩個一等獎,英語也獲得了綜合能力二等獎。數學不突出,父母給他買了“洪恩在線”光盤,大量刷題。“不會做的題,也會買一整本練習題來做,直到熟悉運用為止。”賈揚清數學成績逐漸好起來,獲得了全國數學聯賽二等獎。

2002 年,高考,物理試卷的最后一題,賈揚清失誤了,痛失 27 分!結果,考了 686 分。賈揚清心之所向是清華計算機系,在跟清華招生辦老師討論后,穩妥起見,第一志愿上,填寫了“清華大學自動化系”。當賈揚清打開通知書,看到封面寫著“清華是你一生的驕傲”這句話時,很開心。

開啟人工智能研究

清華圖書館早上 8 點開門,7 點多,賈揚清已和幾位要好的同學站在門前排隊等待自習。班里 27 個同學,賈揚清成績很快又排到了前幾名。本科四年,除了學習,賈揚清的生活還是學習。課余,賈揚清把微積分當作研究課題,做《吉米多維奇數學分析習題集》。

清華信息學院由自動化系、計算機系和電子系組成,三個系所學基礎科目相同,計算機系偏理論和軟件。“自動化系本質上就干兩件事——燒鍋爐和開電梯。燒鍋爐,要讓溫度迅速升高,到達一定高溫后,要讓溫度維持穩定,這就是控制理論要解決的問題。開電梯也同理。”

一人獨講 5 篇國際論文

2008 年 7 月,芝加哥,計算機國際學術會議。天氣炎熱,穿短袖的賈揚清,被會議廳巨冷的空調吹得瑟瑟發抖。賈揚清心里也忐忑不安,他要反復上臺,用英文講 5 篇國際論文,其中 4 篇都是他陌生的領域,而臺下都是來自世界各地的專業人士。

實驗室 5 位同學論文入圍,但只有賈揚清拿到了美國簽證。無奈之下,賈揚清只好“依葫蘆畫瓢”代講。導師鼓勵他:“你放心,講得爛,別人都不會記得,你沒那么重要。放心講就行了。”“搞砸了,人家記不住你;搞好了,人家會說,這個人還不錯哦!” 學術會議上,歐美同行樂于主動展示自己的風氣,對賈揚清沖擊很大。國內實驗室,大家普遍悶頭做自己的科研,歐美人則非常希望自己的科研讓更多人看見,他們主動找人攀談,在講臺旁邊支起易拉寶,努力宣傳自己的項目。他們講起自己正做的事,便眉飛色舞,眼里放光,渾身洋溢著自豪感。賈揚清被深深感染。“我學會了跟別人溝通自己做科研背后的想法。當時,我們普遍欠缺這種能力。”

Google 實習

伯克利研討會上,一位大廠同行主動找到賈揚清說:“我們很喜歡 Caffe。代碼里,居然有單元測試!很多時候,搞科研的人寫出來的代碼真是沒法看啊,但你們寫的還不錯!”這得益于賈揚清在 Google 實習,學寫代碼時養成了好習慣。

每年的 5 月下旬到 8 月,伯克利放暑假,學生們為培養工業實踐經驗,多數都會去大廠實習。2011 年,夏天,賈揚清在 NEC 實驗室實習,第?次接觸到稀疏編碼(Sparse Coding),賈揚清做了?個?動學習每個特征的感知域算法,在 CIFAR 數據集上獲得了當時最好的準確率。

置身 Google,賈揚清感受到,幾萬名工程師分布式協同工作的極致高效。Google 的工程實踐流程體系健全,寫代碼的過程用規范固定下來:要求寫程序時,要把單元測試方式寫到旁邊,方便他人修改后測試;要求用標準的格式寫文檔。短時間內,賈揚清寫代碼的能力,被迅速提升。“這一方面,得益于我從眾多開源軟件中學習;另一方面,我覺得好奇心是衡量學習的普世標準。看到好的代碼,自己動手試一試,多寫幾次,不斷改進。”“每個人都有好奇心,就像兒童敢吃任何東西,是因為兒童沒有吃的經驗,嘗試吃新東西的邊際收益大,世界真美味的歡樂大于偶爾吃到泥巴的苦。”“上了年紀,可借鑒的經驗數據越來越多,就需要用哲學代替經濟學,用信仰強行將自己置于探索行動中,而非總是科學理性地在經驗中深度學習,選優。”

在 Google 實習,賈揚清“一邊學東西,一邊改善生活”。Google 食堂飯菜豐盛,有款名為“十磅”的甜點小蛋糕,寓意在 Google 待上一年,體重會漲 10 斤!賈揚清用 Google 的實習工資,換了一輛新車。在 Google 養成的良好工作習慣留痕在 Caffe 的代碼里。

2013 年,賈揚清從伯克利畢業,獲計算機博士學位。

從 TensorFlow 到 PyTorch

賈揚清到西班牙開會,患重感冒,深夜去藥店買藥,不懂西班牙語,打開 Google 翻譯的照相機翻譯,順著貨架一排排掃描過去,居然找到了布洛芬。

2013 年,賈揚清入職 Google Brain(2023 年 4 月,Google Brain 與 DeepMind 合并為 Google DeepMind),兩年后,賈揚清成為 TensorFlow 的創始團隊一員。“TensorFlow 第?代框架的作者大多還在 Google,二代框架做得深入又完備。被 Google 的產品廣泛采用。”TensorFlow 被 Google 公司開源,一度成為 GitHub 上 Star 數超高的項目。在 Google,賈揚清找到了個人的”比較“優勢。“我先從 AI 的科研開始,和科學家們有共同語言;做工程,工程師們覺得我寫代碼不錯。”“我能夠讓兩邊溝通協作。”

圖 3 扎克伯格親自官宣藝術家風格轉換的功能

就在賈揚清做 Caffe2 的同時,紐約的 Facebook 人工智能研究院主導的 PyTorch 獲得成功。2018 年,在賈揚清的主導下,Caffe2 的后端、PyTorch 的前端、ONNX 的標準合成?個完整的框架,命名為 PyTorch1.0。“如果說 TensorFlow 像一個龐大又復雜的聯合收割機, PyTorch則更像是一輛靈活又便捷的單車。”

問答實錄

劉韌:機器翻譯靠什么突破?

賈揚清:以往,機器翻譯依賴建立語法規則實現,但兩種語言間的句法差異巨大,很難用手寫的方式,窮盡定義語法規則。現在,用神經網絡,再借助互聯網收集數據,訓練神經網絡,逐步優化、提升其精準度。

劉韌:規則方式和神經網絡方式,不同在哪?

賈揚清:程序員寫規則,就會陷入到無盡的規則中,進入規則沼澤,例外之外還有例外,是一個無窮盡的問題。用神經網絡,用模糊的方式模糊地解決問題,再通過數據訓練逐步提高預測準確率。

劉韌:深度學習和強化深度學習有什么不同?

賈揚清:強化深度學習意思是,如何把將來獲得的收益或懲罰回歸到現在。

劉韌:人工智能會在哪個方向上和人爭工作?

賈揚清:簡單重復的人類勞動被替換是個好事,人解放出來的時間,可以想更多的可能性。達芬奇有幅非常著名的畫叫《巖間圣母》(Virgin of the Rocks),圣母的主體是達芬奇畫的,背景的花草石頭是達芬奇的助手畫的,達芬奇也需要助手。今天很多畫家,他畫主體,再找助手把背景填上去。他也可以讓 AI 來填背景。就像達·芬奇的助手一樣,AI 能提升畫家的效率。

劉韌:中美的技術差距體現在哪方面?

賈揚清:好奇心。我們最優秀的人才在追求執行力,解決具體問題。歐美人更喜歡搞新東西。不得不承認,美國人已經解決溫飽很長時間,因此他們玩得更多,玩得多,總能玩出一些新東西。我們在很多方面要追,這事急不來。

關于《 開源英雄 》

《開源英雄》是由 CSDN 創始人&董事長、極客幫創投創始合伙人蔣濤發起,中國著名 IT 記者、DoNews 創始人劉韌領銜,CSDN、《新程序員》聯合出品的專訪欄目。通過開源開放的 CSDN 寫作班,深入訪談全球頂尖開源人物,為廣大開發者傳遞更多、更高質量的信息,透過他們的人生及成長尋找共鳴、共舞開源世界。

自欄目推出至今,我們專訪了 Vue 作者尤雨溪、LVS 創始人章文嵩、linux 內核守護者吳峰光、中國 Linux 第一人宮敏、小米開源奠基者崔寶秋、Caffe 作者賈揚清,如果你有想讓我們報道的開源人物,歡迎在 GitCode 上提交 Issues 或 PR。

地址:https://gitcode.net/programmer_editor/Open-Source-Heroes

分享到:
標簽:框架 AI
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定