什么是“MEET2023智能未來大會”?
大會上來了哪些重磅嘉賓?
他們在大會上探討了什么主題?
沒錯!ChatGPT也參與了今年的大會,作為AI代表與人類嘉賓們一起回顧這一年來人工智能的發展,展望智能科技的未來。
下面還是老樣子,一文看盡。
不同的是,這次的內容由ChatGPT協助編輯部共同整理。整場大會主要分成三個維度:
新技術新模型變革下,對計算、算力提出的新標準、新要求、新機遇;
時代級機遇求解征途中,誕生了哪些新場景、新物種、新應用;
以及當下已經縱橫于各行各業的AI,究竟還有什么樣的新路徑、新方案、新價值?
新標準、新要求、新機遇鄭緯民院士:AI基準的設計能達到4個指標
首先開場的,是計算機系統結構這一學科泰斗,中國工程院院士、清華大學計算機科學與技術系鄭緯民。毫無疑問的是,人工智能算力是當前人工智能領域發展的關鍵,那么此次他主要分享了他們所在團隊對人工智能的三件事。
簡單來說,就是AI與算力基礎設施的設計、評測和優化。
第一件事,提出了一種AI算力基礎設施的架構和平衡設計原則。目前全國20多個人工智能超算中心基本上都采納了他們團隊的設計思想。
首先,他談到了HPC與AI之間的不同,包括應用領域、運算精度等方面。基于此,他們提出了人工智能計算機設計的平衡性原則,包括計算平衡設計、網絡平衡計算、IO子系統設計。
目前,行業整體趨勢是HPC+AI+BigData融合在一起。未來兩到四年,三者融合的服務器就會出現。
第二件事,就是大規模人工智能算力基準評測程序AIPerf。
傳統的AI算力評測基準存在著只針對單個芯片、只是移動端的硬件、可擴展性不好等問題,因此整個行業沒有太合適的,于是他們就決定自己做一個。
AI基準設計要達到這四個目標:統一的分數、可變的規模、具有實際的人工智能意義、評測程序包含必要的多機通信。最終,以清華大學為主要團隊做了AIPerf來測試,已于2020年11月15日發布。
第三件事,就是百萬億參數超大規模訓練模型的加速方法。
學界達成一個基本共識,那就是模型規模和模型效果呈正相關關系。但模型規模上去了,CPU的內存、計算能力是有限的。因此大模型訓練一定是多機的,分布并行的。
現在主要有三種并行方式:數據并行、模型并行、專家并行。他們把這三種并行訓練模型開源到FastMOE系統當中,得到了工業界許多認可,比如阿里的淘寶天貓,騰訊、百度飛槳的MOE模塊都用到了他們的系統。
最后他希望,他們團隊做的三點小貢獻,能夠推動人工智能的發展。
高通Ziad Asghar:如何讓「智能網聯邊緣」成為現實
高通技術公司產品管理高級副總裁Ziad Asghar,負責驍龍平臺的產品規劃以及公司所有產品線中應用處理器相關技術。他的工作服務于公司所有業務部門,包括移動、汽車、計算、XR、邊緣云和物聯網。
他在大會上提出:AI處理的重心正在持續向邊緣側轉移。
原因有多方面,大量的數據在邊緣側產生,當今消費者希望擁有更好的數據隱私、希望數據可靠,并希望及時獲取處理結果。
高通專注于“基于統一的技術路線圖”進行產品開發,能夠全面覆蓋智能網聯邊緣,實現規模化擴展。
高通的AI技術已經賦能20億終端,實現這一成果的核心是高通AI引擎(Qualcomm AI Engine)。高通AI引擎包含圖形處理單元、CPU,以及更核心的Hexagon處理器,其具備高度可擴展性的硬件架構,并在性能和能效方面全面領先競爭對手。
為了讓AI在終端側發揮最大作用,高通還帶來多項硬件和軟件技術:
支持INT4精度推理,高通傳感器中樞,高通AI軟件棧、Qualcomm AI Studio……
過去,幾乎所有的AI推理都在云端進行。如今,我們已經開始將大量推理工作轉移至邊緣側終端進行。下一步,就是實現完全分布式的AI,也就是轉向終端側學習的范式。
利用終端側學習,將能夠為每一個用戶打造個性化體驗,這就是高通正在前進的方向。據Ziad介紹高通AI研究團隊一直專注不同的方法包括小樣本學習、無標記數據持續學習、支持全局適應的聯邦學習和低復雜性終端側學習,來解決終端側學習部署的挑戰。。
Ziad相信,目前我們所利用的終端側AI能力還只是冰山一角,而從智能車到元宇宙,終端側AI的需求巨大。
高通十分期待能夠引領市場向著充分利用智能網聯邊緣的方向繼續推進,讓智能網聯邊緣成為現實。
潞晨尤洋:AI落地面臨很大問題,是最先進的 AI 技術訓練成本太高
潞晨科技董事長兼總裁、新加坡國立大學校長青年教授尤洋,則介紹了一種全新的AI大模型解決方案Colossal-AI,面向未來各種大模型應用場景的低成本落地。
首先,Colossal-AI解決的是一個什么樣的問題?從過去AI模型發展的參數量來看,2016年—2021年模型大小從200多萬增長到了1.6萬億,相當于翻了成千上萬倍。而不管是大企業、小企業,大家都普遍把自己的模型做得更大,因為效果會更好。
但一個很大問題是,大模型或者是最先進的AI技術訓練成本太高了。Stability AI每年光花計算的錢就大概2000萬美元。
因此未來迫切需要一個可擴展、高效的計算基礎設施Colossal-AI。
其次,Colossal-AI主要由三部分組成。
1)高效的內存管理系統。因為大模型本質上還是太吃內存。
2)自動的N維并行技術。
3)大規模優化技術。
從三方面把AI模型的訓練部署性能提到最高,目標是希望用戶只需要在自己單機筆記本上寫好代碼,通過Colossal-AI能夠無縫地部署到云端或者是超級計算機上。
目前訓練大模型主要有三種并行方式:數據并行、張量并行、流水線并行。
Colossal-AI的解決方案首先是支持了上述主流并行方案,然后我們創新性地打造了2D張量并行、2.5D張量并行以及3D張量并行,以及提出了數據序列并行,還提供了降低顯存消耗的異構內存管理和大規模并行優化,把它們整合起來提供一套自動并行的解決方案。
其實AI工程師、研究員,不需要理解背后的技術細節,只需要把模型的信息、計算資源告訴我們,就可以自動地把計算資源能力發揮到最大化,同時完成虛擬模型訓練和自動部署,輕松低成本應用AI大模型。
浪潮劉軍:智算力就是創新力
浪潮信息副總裁、浪潮人工智能與高性能計算產品線總經理劉軍分享的主題是“AI新時代 智算力就是創新力”。
劉軍提出了“算力當量”的概念,用PetaFLOP/s-days(PD)這個指標來衡量算力消耗,也就是每秒千萬億次計算完整運行一天,完成一個任務需要多少這樣的計算量。
比如特斯拉的DOJO用于感知模型的訓練和仿真,算力當量是500個PD。AlphaFold2的訓練消耗300個PD。
再加上AI大模型訓練、數字人的建模和渲染等方向,我們可以確切地感受到今天在AI領域的眾多創新背后離不開智算力的支撐,所以我們可以說智算力就是創新力。
接下來,劉軍還分享了當前智能計算發展的三個重要趨勢:
第一是算力多元化。在國內市場上有十幾種CPU芯片、將近100種AI算力芯片,原因是算力應用場景多元化。這就需要從系統的硬件角度、從平臺的軟件角度來進行相應的創新支撐。
第二是模型巨量化,大模型使得AI從五年前的能聽會看走到今天能思考、會創作,下一步甚至到會推理、能決策的進步。下一個挑戰是如何把大模型能力交付到眾多中小企業手中,幫助他們實現智能化轉型。
第三是元宇宙。現在元宇宙的構建包括協同創建、高精仿真、實時渲染、智能交互,每一個環節都需要大量算力去支撐。這里不光是AI計算,還有仿真計算、圖像渲染計算,這對算力基礎設施的硬件平臺和軟件棧都提出了更高的要求。
新場景、新物種、新應用小冰李笛:我們為什么想和ChatGPT交流?
AI繪畫、對話式AI為代表的AIGC今年在全球引發熱潮,小冰公司也作為行業先行者備受矚目:剛剛完成一輪10億元的新融資,用于推動虛擬員工的普及。
不過,小冰公司首席執行官李笛在會上沒有多談產品,而是分享了對大家更有借鑒意義的行業趨勢。
李笛認為,每一次技術變革都是在改變人與世界/人與人之間的關系。
在人與世界關系這條線上,我們經歷了門戶網站、搜索引擎、推薦算法。
它們利用計算機系統實現了高并發,一次觸達很多用戶。但缺點是轉化率低,如果想提高轉化率就需要人工客服,人力成本巨大。
下一站,該看向AI Being。
AI Being與之前的人機交互相比,關鍵不同在于高轉化率,如小冰島App的留存率就高達39%。
另一個例子是ChatGPT,通過它獲取知識比搜索引擎的準確度要低,但為什么人們都愿意和它交流?
人們在使用它時往往心里已經有了答案。如果ChatGPT給出的結果都準確,那人們會認為它很強大,即使不準確,人們也會覺得很有意思。
其實ChatGPT改善的不是準確率而是行為,讓AI有了主體性。從行為模式判斷與從結果上判斷一個技術,就會得到完全不同的結論:
它能和你建立一種以往沒有過的一種關聯,這種關聯的價值本身具有非常大的商業價值。
李笛認為,AI Being的未來還會引發很多新的變革。
如數字員工會使toB和toC的界限變得模糊,比如銀行的數字客戶經理可能會與客戶變成朋友。
又比如AI Being將不再隸屬于某一平臺,人們在客服、手機、汽車上與同一個AI Being交流,得到更加無縫、24小時、持續連貫的服務。
同時這種方式也能建立更好的反饋機制,推動系統得到更好的發展。
AI Being比現在的虛擬偶像等數字人應用,還有千倍百倍的價值沒被看到。
路特斯李博:智能車是當下機器人的第一形態
各行各業進入存量競爭時期,互聯網經濟機遇過去,下一個人類的星辰大海會在哪里?
路特斯科技副總裁、路特斯機器人公司總經理李博認為,「機器人時代」比「元宇宙時代」更符合人類對星辰大海的預期。
元宇宙是把人帶入虛擬世界,而機器人則是把AI帶到真實世界。
接下來,李博分享了對「機器人時代」的關鍵認知:
第一,智能車是機器人的第一形態,也是當下最重要的機器人形態。像掃地機器人、酒店服務機器人等,從市場規模、體量及社會影響力來說,和智能車相比仍存在差距。
第二,行業經常提「軟件定義汽車」,但我們認為「硬件定義軟件的天花板」。例如,當不同年代的蘋果手機都升級到同樣的操作系統,其體現出來的性能卻是千差萬別的。
第三,在更高更快更強的時代,路特斯是智能車的最佳實踐平臺。基于此,路特斯機器人推出四條產品線。
智能駕駛全棧軟件解決方案,包含端到端的高階智能駕駛系統、ADAS/PAS功能、以及車端OS操作系統及中間件等。
ROBOVERSE產學研生態系統,一方面用路特斯機器人在實踐開發過程中產生的優質數據,打造公開數據集,為創業公司及院校賦能;另一方面支持院校做智能駕駛的探索和嘗試,在路特斯機器人的加持下,北京理工大學和同濟大學的方程式車隊在2022年中國大學生方程式賽事中各取得優異成績,其中,北京理工大學路特斯無人駕駛方程式車隊更是贏得2022中國大學生無人駕駛方程式大賽全國總冠軍。
智能駕駛運營解決方案,核心目的是對當下智能駕駛系統能力的不足做彌補和提升。例如路特斯平行守護系統,讓后臺專業的平行守護駕駛員接入前臺車輛,輔助前臺車輛更好地完成智能駕駛任務,這一套系統在不久的將來,也會逐步對外賦能。
ROBO Galaxy智駕工具鏈SaaS系統,也稱為智能駕駛的云端數據工廠。ROBO Galaxy包含七大模塊,分別是數據采集、數據合規、數據標注、數據訓練、數據仿真、數據管理及數據監控,提供全流程服務,并構成了全生命周期的數據鏈閉環。
ROBO Galaxy不僅旨在提升算法軟件迭代速度,提供優質的測試環境,也致力于解決目前普遍存在的數據孤島與業務斷點問題。因此,李博認為,未來的智能駕駛產品一定是批量化、高質量、穩定地生產出來,這就要依托ROBO Galaxy,讓智能駕駛開發從「手工坊」變成「流水線」。由此可見,ROBO Galaxy代表著智能駕駛未來的生產力。
百度段潤堯:聰明的腦袋、足夠的資源和最好的技術匹配起來,就能做出量子計算機
當前,量子時代正在加速到來,接近70%全球企業都想或正在布局相關技術。國內像百度這樣的技術大廠,今年率先給出了從底層硬件到上層應用的一整套產業化解決方案。
百度量子計算研究所所長段潤堯就在大會現場分享了百度是如何思考量子計算的。
我們身處的這個時代其實已經到了第二次量子革命,這幾年應該是量子真正開始和計算相結合的關鍵幾年,為什么說量子計算出現是必不可少的。
第一,芯片尺寸小到一定程度就到了量子尺度。要想摩爾定律延續下去,就需要考慮新的計算模式。而且量子計算本身,能耗也非常低。
第二,數據量很大。想模擬一個量子系統,哪怕非常小但所需存儲量也很巨大,比如300個量子比特,就超過整個宇宙可見原子數目。
第三,全新計算范式,在解決特定問題上有指數級優勢。
第四,信息安全,可以攻破RSA系統。
也正因為這些可能性,量子科技一直受到行業關注。有相關機構預計,到了2031年將有8000億元市場規模直接與量子計算相關。
那么量子計算可以應用在那些方面呢?典型的有,藥物研發、金融科技、材料模擬、信息安全等領域。
除此之外,量子計算與的人工智能還是一個相互糾纏的關系,從上層應用、框架到底層硬件都可以產生相互聯系。另一方面,量子計算也受益于AI,尤其是深度學習。2020年百度就曾搭建了一個量子機器學習平臺。
即便有這么多機會,那實際真正走入生活還需要多遠?段潤堯團隊正在做的,就是量子計算的產業化道路。
那就需要解決這幾個方面的問題,硬件的穩定性、好的軟件平臺,以及自動化的芯片設計方案。
百度提出了QIAN戰略。Q就是量子算法、量子AI及量子架構。I就是軟件和硬件的基礎設施。除此之外,還要真正識別出一些具有重大應用價值的場景,A就是實際的一些重要的應用。最后當然還有網絡,N指量子互聯網,除此之外我們也需要建立生態網絡。
演講的最后,段潤堯做了一下展望:
實際上我二十多年來一直在思考一個問題,如何真正能夠造出一臺量子計算機,我的結論其實很簡單,就是聰明的腦袋,再加上有足夠的資源和現有的最好的技術,匹配起來就可以做出量子計算機。
從這個意義上講,全球可以有很多不同的組合都可以做出這樣的機器,這個過程是可以等價的。
微軟劉鐵巖:AI for Science:追求人類智能最光輝一面
同樣正在探尋AI for Science價值的,還有微軟亞洲研究院副院長,微軟研究院科學智能中心亞洲區負責人劉鐵巖。
最近十年,人工智能在很多任務已經可以和人類媲美,效果驚艷。但這些結果主要集中在感知和認知層面,并沒有反映出人類智能里最光輝的一面——認識世界和改造世界。
微軟前同事Jim Gray曾對科學發現的四個范式做了總結,分別是經驗范式、理論范式、計算范式和數據驅動。最近幾年大家尤其關注的一種新范式,叫做AI for Science。它是前四種范式的有機結合,發揮了理論和經驗各自的特長,又把人工智能和計算科學融合在一起。劉鐵巖認為,它值得叫做第五范式。
接著他就AI for Science分為三個方面進行深入介紹。
第一,如何用AI求解物理方程?
我們可以不再用數值解法來求解物理方程,而是通過AI得到更高效解。并且只要有足夠算力就可以無限生成完美的訓練數據。此外,近年來還出現了一種physics informed training,甚至不需要提前生成訓練數據,只需要在訓練的過程中,動態驗證AI模型的輸出是否滿足物理方程,定義損失函數即可,而驗證方程比求解方程簡單得多。劉鐵巖介紹了他們團隊在這個方向上的一些最新研究成果,如Graphormer,Deep Vortex Net,并展示了它們在分子模擬、流體模擬等領域取得的突出成果。
第二,如何用AI從科學數據中發掘有效信息?
各種實驗設備每年都產生海量數據,但顯然不能靠人工有效處理;還有每年都有近150萬篇論文發表,但任何科學家都沒有精力讀完。劉鐵巖的團隊利用AI方法來自動分析高能粒子對撞的射流數據,提出了LorentzNet模型,將洛倫茲等變性構建在模型之中,在新粒子發現領域取得了比前人顯著提高的精度;他們還利用科學文獻訓練了SPT模型,對科學文獻信息的科學知識進行抽取、總結、和預測。
第三,如何從實驗數據出發,用AI發現新的物理方程,形成科學發現的閉環。
比如物理的守恒定律,一旦實驗數據不滿足守恒性,往往暗示著一些新物理規律的存在。劉鐵巖的團隊設計了一個雙通道的AI模型,可精準地從實驗數據中自發地學到很多已有規律。
最后,他對AI for Science未來的發展表達了希冀:
我們相信AI for Science將會對自然科學產生巨大影響,尤其在解釋生命奧秘、以及保障環境可持續發展方面,都有很大的潛力,沿著這兩個方面我們進行了很多探索。也希望大家加入我們,一起推動科學發現的新邊界!
新路徑、新方案、新價值阿里賈揚清:工程化和開源是AI普惠最重要的兩大支撐
AIGC爆發成為當下AI繞不過去的話題。如果溯源,是從1999年的紋理生成,再到2015年前后的神經風格遷移,再到現在更強語義的AI創作。這些創新背后的推動機制,總結來說就是AI普惠的兩大支撐:AI工程化和開源。
這也就是阿里巴巴集團副總裁、阿里云計算平臺事業部負責人賈揚清分享的主題。
工程化,讓開發、迭代到應用的路徑變得更加簡單;開源可以讓工作開展更加迅速,實現市場共贏。在這個基礎之上,AI的產業落地有以下明顯趨勢:
第一,云原生的AI工程化平臺;
第二,大規模端到端的異構計算體系;
第三,通過算法的系統組合實現更加智能的、貼近用戶需求的產品;
最后,通過算法的開源助力AI在產業垂直化落地。
這四個趨勢,無論從供給角度還是需求角度,都是推動AI進一步往前走的方向。接著賈揚清從這四個角度介紹了他們正在做的事情。
其中,在端到端的異構計算與優化上,阿里開源的分布式訓練框架EPL和推理優化工具PAI-Blade,能讓算法工程師在訓練和推理環節大幅提升效率;此外,通過軟硬件協同優化,他們也研發了更貼合AI需求的計算設施。
在這個領域比較有意思的點,是AI計算與傳統科學計算之間有很強的共性。AI for Science這個趨勢很明顯,分子學、物理、化學等領域需要處理海量科學數據,而AI和數據系統所積累下來的異構計算的模式和環境,正好符合這個需求。
“今天,非常多的專家、企業、開發者們在建設著上層的AI算法;而在AI底層,如何讓工具變得更加易用、更加普惠,這正是我們在做的事情。”
自動駕駛:路上見真章
作為業內最具影響力和號召力的第三方,MEET2023智能未來大會同樣設置了一場自動駕駛論壇——路上見真章。
從第一年圍繞Demo談技術進展,第二年談如何交互,到去年談到如何商用,順應時代之發展,今年就開始談到上路On the Road的問題。本次邀請到的兩位代表性嘉賓分別是:
禾多科技創始人、CEO,國內自動駕駛最早的先行者倪凱;
小馬智行副總裁、北京研發中心負責人,清華姚班校友張寧。
在量子位總編輯李根的主持下,主要圍繞三大話題展開:過去成果進展、核心驅動力以及行業趨勢。
“上路”進展
首先是今年一年,對于禾多和小馬智行都是關鍵的時間點。
倪凱表示,今年是自動駕駛飛速發展的一年,就禾多來說,跟廣汽的合作算是開結果,跟傳祺的影酷和埃安的AION LX,不管是高階的泊車還是高階的行車都有落地。這樣的上路運行,打開禾多未來服務更多用戶、產品落地的先機。
而張寧總結道,三大業務板塊包括Robotaxi、Robotruck、面向輔助駕駛的乘用車業務,都取得了了關鍵性進展。比如Robotaxi實現了前排無人,Robotruck獲得了整個智能卡車領域最大的單量。
那么跟行業預期相比,今天站在這個時間節點為什么出現2022年?倪凱和張寧都認為,今年整個上下游產業鏈正在肉眼可見的蓬勃發展,這是一個非常好的趨勢。
核心驅動力
既然如此這背后的核心驅動力又是什么呢?
張寧表示,技術依舊是所有發展的核心驅動力。到了今天有兩個趨勢越來越明晰,一條路徑往深水區深耕;另一條是整個技術的普惠和規模化。
倪凱則更關注兩個驅動力,一個整個社會或行業,對自動駕駛未來的預期,包括經濟效益、社會效益,這樣才會有更多創業者、資本參與進來。
第二大驅動力是為消費者創造價值。尤其是跟四五年前相比,輔助駕駛普及率越來越高,這種商業化落地,是真正地驅動人們,越來越篤定地走在這條道路上。
行業趨勢
而對于目前整個行業而言,明星公司說倒就倒,市場都在說自動駕駛寒冬,兩位是如何看待行業的趨勢變化的?
張寧則表示,這跟整個資本大環境相關。做無人駕駛是需要戰略定力的一件事,像跑馬拉松,需要耕耘最終才能取得收獲。對Argo而言,其實這是一個個例,只是剛巧在節骨眼上放大化了。很多時候一點點變化,背后其實是革命性、階段性的躍遷。我們很看好2023年自動駕駛技術可以在國內進一步落地應用。更多耕耘在L4領域的玩家,真正以無人駕駛形態向大眾提供服務。
在倪凱看來,目前有兩個比較大的時間點。第一件事,高階自動駕駛大規模落將在2025年形成相對成熟期,后面就是一個比較線性或者比較快速的增長狀態。第二件事本質上是跑通商業模式,這可能是一個更長要去探索的事情,需要整個行業來共同把它從黎明前的黑暗推向最后真正光明的艱難過程。
最后,還有一個互動打分的環節:如果將自動駕駛的終點定為滿分,那么現在距離100分還有多遠?
張寧認為,對小馬智行來說,已經到99.99后面的小數點了,可能我們也就只差臨門一腳了,但要耐得住寂寞、能夠有這種定力是很難的一件事情。
而倪凱則表示,他們現在是在往90分、100分走的過程中,接下來的三年非常關鍵,可能是真正打磨產品,讓產品體驗上升一個臺階,最終贏得市場的一個關鍵時間。
中關村科金張杰:對話式AI走到L0-L5的哪個階段?
在數智化轉型的大趨勢中,中關村科金以AI+數字化營銷·運營·服務為引擎,為500余家金融、零售、教育、醫療、智能制造等行業頭部企業提供了數字化解決方案。
中關村科金技術副總裁張杰,在會上分享了關于對話式AI在企業服務中的一些觀點和經驗。
在過去60年時間里,對話式AI經歷了三個大的技術發展階段:基于規則匹配的時代、“虛擬個人助理”應用的時代,基于大規模預訓練語言模型的時代。
發展到現在的階段,張杰認為目前對話式AI幾個趨勢值得關注:
細分賽道,過去十幾年間對話式AI主要的應用場景還是在toC,如智能音響、智能家電、個人手機助理等市場滲透率較高,依照《AI對話系統分級定義》已經能夠達到L3的等級。相比之下,企業服務方面市場滲透率比較低、開發潛力大,同時技術成熟度相對落后,只能夠完成單一場景下的對話,在L1-L2之間。
對話形式,在腦機接口真正商用落地之前,對話仍然是最主要的一種溝通手段,除了基礎的文本和語音交互外,多模態、數字人的交互方式會越來越多,比如遠程銀行、數字營業廳等。
從技術維度上來看,對話式AI不僅是對話的技術,將來還會是多種前沿科技的一個集大成者,融合感知智能、認知智能和決策智能。
聚焦在企業服務賽道上,張杰認為對話式AI潛在市場空間巨大,應用場景豐富,但現階段面臨著幾項技術挑戰,例如場景遷移問題、可解釋性,快速運維等。”
如何解決這些難題呢?中關村科金在過去8年間,服務了10多個行業、500余家客戶的對話場景,總結出了一套雙引擎對話系統的技術實踐。領域知識中臺和對話分析系統作為對話決策系統的雙引擎,一方面,領域知識能夠提升系統的可解釋性和可運維性;另一方面,會話分析能夠挖掘出話語背后的常見目的、和常見的行為模式。
而對于未來發展方向,張杰表示:“對話式AI在企業服務賽道上存在巨大的市場空間和技術提升空間,為此中關村科金提出了領域知識和會話分析雙驅動的對話系統。希望通過對話式AI為企業打造金牌銷售,幫助企業帶來創新增長和用戶體驗的提升。“
AI for Science圓桌論壇:AI三要素之外,還有哪些挑戰?
AI for Science在這一年備受矚目且進展不斷,除了AlphaFold所在的生物醫藥領域,還在材料、物理甚至數學上發揮出越來越重要的作用。
下午的圓桌論壇話題就聚焦于此,參與討論的嘉賓有:
深勢科技 CTO胡成文,負責組建業務研發、平臺研發兩大團隊。深勢科技致力于運用人工智能和分子模擬算法,結合先進計算手段求解重要科學問題。
百圖生科BioMap副總裁、產業基金董事總經理瞿佳潤。百圖生科是中國首家由生物計算引擎驅動的創新藥物研發平臺。
英矽智能聯合首席執行官兼首席科學官任峰。由他帶領的藥物研發團隊,是業內首批利用AlphaFold展開藥物研發實踐的團隊之一。
討論的第一個話題,面對AI for Science在今年的迅速火熱,會覺得有一些意外嗎?
三位嘉賓一致認為,這其實是可預測、可預見的。
胡成文重點介紹了AI for Science這個概念的起源和發展情況:
2018年最早由由深勢科技首席科學顧問、中科院院士鄂維南提出2019年各大高校開始成立這個方的實驗室。2021年之后迅速被英偉達、DeepMind等國際機構公開采用。2022年微軟在全球成立了重磅機構AI for Science研究院,國內外產業界也紛紛跟進。
胡成文希望有更多同仁加入進來,一起推動AI for Science從概念到落地、從學界走向工業界,真正解決行業面臨的實際問題。
AI4S備受矚目是其重要性和發展的必然結果,AI4S能夠在很多人類文明的基礎且關鍵問題的研究上給予我們高質高效的支撐,當現有的途徑或者工具無法滿足時,新的,更好的途徑和工具就會出現,且被迅速應用起來。
瞿佳潤的理解是,AI for Science對應著AI for Industry,也就是說AI在工業界的應用開展更早。科研上希望利用AI去提高效率的痛點長期存在,所以一旦當技術條件成熟,AI for Science的快速鋪開還是可以預見的。
任峰則提出AI for Science還分為狹義和廣義。廣義的AI for Science不光是解決底層的問題,也解決實際應用上的問題,它的爆發完全在意料之中。
下一個話題,AI for Science對于目前的科研和應用帶來了怎樣的變革?
胡成文從計算層面給出回答。在復雜問題上往往數據線性增長,而需要的計算量指數級增長。AI可以在在保持科學原理精度的情況下降低它的計算復雜度,解決傳統的科學范式解決不了的問題。
瞿佳潤具體舉了生物制藥的例子,有了AI for Science工具之后,流程從3、4個月縮短到一個月,顯著提升效率問題。另外在靶點研究上,AI還能把問題系統化,最終體現在成功率的提升。
任峰認為傳統的藥物研發都是靠人來想象的,有了AI加持可以探索更多的化學空間和生物學空間,帶來更大的創新性。
第三個話題,還有哪些領域可能復制AlphaFold今天在生物醫藥領域所帶來的改變?
瞿佳潤提到了生物領域還有基因組學上的預測,包括一個細胞怎么表征免疫激活狀態,再進一步到藥物響應問題。
胡成文認為,很多問題本質上都是底層原子、分子的性質/結構/相互作用力決定了上層宏觀的性質,因此AI for Science在很多基礎科學的研究方面都有廣泛的發展空間。近年來,人工智能和傳統科研結合呈現的巨大潛能使得人工智能在科學中的應用出現了眾多重要主題。與此同時,AI4S(AI for Science,AI用于科學發現)在工業產業實踐中的應用潛力已被頭部廠商充分認可和重視。生物科技、能源、半導體、材料等領域的行業先鋒已經開始系統性投入AI4S的研究和具體行業解決方案的大規模應用。在工業仿真、合成農業、環境科學、機器人、天體物理、地質學、圖形學等領域,AI4S也有巨大的想象空間有待開發。未來,AI4S帶來的將不僅僅是幾個點上的突破,而是科研方法的全面改變。從生命的基本組成(蛋白質)到世界工業的基本要素(材料)到各個科學技術領域,AI4S 不只是解決具體問題的有力工具,更是重新定義科學問題的系統性思路,我們深勢科技正在引領實踐這一思路。
最后一個話題,AI for Science目前面臨的最大挑戰是什么,還是算法、算力、數據這三要素么?
任峰認為最大的挑戰是如何管理預期。預期太高的話,任何一個失誤都會造成社會對整個行業失去一定信心。目前就算有AI的加持,只是提高了效率和一些成功率,但并不能做到100%的成功。
瞿佳潤認為生物學問題上最重要的還是數據,比如體外的數據很難映射到體內環境,并且目前公開數據的質量還是非常差的。另外無論是AI還是傳統生物學手段做科研,還需要一個好的研究體系去配合。
胡成文認為傳統的三大要素肯定還是重要的,新出現的挑戰還有人才問題,尤其是跨學科復合型人才比較緊缺。以及生態共建問題,相比于傳統AI在商業形成了完整的生態鏈,AI for Science在這方面剛開始起步。
騰訊劉偉:只靠數據驅動的AI缺乏可解釋性,要與領域知識相結合
最后登場的,騰訊醫療健康AIDD技術負責人劉偉,他從騰訊制藥AI算法實踐的角度來探討AI for Science的價值。
主要做了三個部分的介紹:騰訊云深平臺、平臺案例分享,以及騰訊云深AI平臺的技術優勢總結。
首先,目前騰訊云深AI藥物發現平臺主要包括兩大功能模塊,第一個功能模塊就是小分子藥物發現,第二塊是大分子藥物發現,主要指抗體藥物發現。
其中,小分子藥物發現還包括蛋白質結構預測、分子生成等模塊,大分子里面包括抗體結構預測、抗體抗原的對接以及抗體的人源化改造等模塊組成。
接著,劉偉分享了他們幾年來制藥AI實踐中的典型案例。包括國內做得最早的蛋白質結構預測tFold、結合物理學特征和本地數據訓練的ADMET基礎模型以及骨架躍遷分子生成算法等。
基于這些實踐的積累,劉偉團隊搭建了屬于自己的優勢壁壘。核心有四個方面。
第一塊,就是AI算法方面。藥物AI研發這塊的最主流就是圖神經網絡,在做藥物之前,騰訊在深度圖神經網絡就有深厚的研發積累,包括現在的大規模隨機采樣、自監督學習和層次圖深度學習等領域。
第二塊和第三塊,就是大算力、大數據的能力。比如在一個龐大的化學空間發現藥物分子是不容易的,這就要求AI模型能夠理解這么大的空間,也就需要分子、蛋白質、核酸等領域的大模型,以及訓練大模型的算力和基礎架構。
最后一塊,AI與物理、化學領域知識方面的結合。這是基于之前的算法算力上面的能力新生長出來的獨特優勢,騰訊云深在AI與量子化學的結合方向上研發了獨特的DeepQC框架,可以在大的體系上,花費較少的算力達到高的精度。實際上,只靠數據驅動的AI缺乏可解釋性,如果能將AI算法跟物理、化學領域知識結合起來,這樣訓練出來的模型過擬合風險較低,在實際應用中也有非常好的可解釋性。
以終為始,生生不息
即將過去的這一年,是時代級機遇與挑戰交織的一年。
一方面我們深刻的感知到,隨著硬科技創新、產學研轉化、全新冪集創新周期的到來,一場關于數字化、智能化的機器革命,正在加速落地。
但另一方面,全球風云波云詭譎,技術創新也來到深水區,內外交織的挑戰比以往來得更加嚴峻。
于是關乎本源、關于終局的思考求解,要比以往更加迫切:
科技發展的起伏周期,如何穿越?
是終極場景倒推技術創新,所誕生的新場景、新物種、新應用?還是順勢而為下的新計算、新方案、新價值?亦或是以一敵百,堅定的技術創新信念者?
以終為始,生生不息。
這場大會上,十余位行業領域用他們過去的積淀積累,做出對未來的解答。而這些也只不過眾多智能技術變革的前行路徑的一撮。
為了給更多同行者落地參考,「2022人工智能年度評選」結果也已揭曉,50大領航企業、20大最具價值創業公司、30大領軍人物、10大最佳產品,以及10大最佳解決方案等人工智能領域年度獎項悉數頒出。
同時,也為了讓更多關心前沿科技的讀者了解更多前沿趨勢,本次大會還發布了2022年度前沿科技報告書,由量子位智庫出品,后續將上線詳細解讀稿,敬請期待。