“ ‘AI+Science’”的系統性機會是用AI連接各個物理尺度,解放科學研究與工業設計的生產力。’AI+Science’的大規模工程化正當時!”10月19日,2021年云棲大會在杭州舉行,大會首日主論壇上,深勢科技創始人、首席科學家張林峰博士在演講中表示。
作為全球頂級科技盛會,云棲大會被視為科技界的創新風向標,主論壇的話題尤為受關注,代表了最具前沿性、探索性和想象空間的科技方向。
2021年度,AI和Science是兩個很有熱度的詞。AlphaFold2以深度學習技術在預測蛋白質結構上做出突破,這項計算工作展現出AI在科學領域解決問題的巨大潛力。從生物這一單一場景延展開來,在物理、化學、材料、地質等多領域,以深度學習為代表的AI與科學計算結合形成新的計算方法,可以產生怎樣新的科學模型、新的實驗方法、新的產業業態?
思潮之下,“AI+Science”也成為2021云棲大會討論碰撞的焦點。
解決傳統科學計算問題,AI的系統性機會在哪里
張林峰博士此次演講的題目是“‘AI+Science’從科學愿景走向大規模工程化”。
令人關注的是,他所帶領的深勢科技團隊引領的跨尺度建模技術成功應用了人工智能和高性能計算等能力,于2020年在世界上最大的超級計算機上將量子精度的分子動力學模擬推向了上億個原子,革命性地提高了微觀科學計算的尺度和精度。這一研究成果在全球范圍內都處于領先位置,獲美國計算機協會ACM公布的2020年戈登貝爾獎,并當選中國科學院、中國工程院主辦,中國科學院院士和中國工程院院士評選的2020年中國十大科技進展。并被認為有望為力學、化學、材料、生物乃至工程領域解決實際問題發揮更大作用。
張林峰認為,長期以來我們對世界的認知遵循著兩大范式:開普勒范式和牛頓范式。前者從數據中提取規律,后者尋求基本原理。兩者都能用來解決實際問題。當代AI在CV/NLP等領域的應用是集前者之大成,而當代仿真模擬和工業設計軟件則是后者的精華沉淀。開普勒范式面臨的挑戰是所謂“知其然不知其所以然”的問題,即模型的可解釋性、可遷移性等;而牛頓范式面臨的挑戰是帶來棘手又漫長的計算過程,即所謂“維度災難”。“AI+Science”的本質實則是兩種范式的結合。
由此,帶來“AI+Science”的系統性機會。以機器學習為代表的AI具備復雜數據處理的能力,可以使得訓練出來的物理模型兼具微觀尺度的精度和宏觀尺度的效率,能夠真正有效解決科學計算中的“維度災難”問題。以斬獲戈登貝爾獎的Deep Potential方法為例,張林峰博士展示了AI和分子動力學模型的有效結合,在保證精度的同時,指數級地提升了物理模型的效率。以這套方法為代表的全新范式,可以系統性地解決藥物設計、材料設計和化工設計等領域中的微觀設計層面問題,實現“既快又準”的計算模擬。
事實上,AI+Science的應用場景遠不止于微觀層面設計,在宏觀的飛機、汽車、火箭也將有豐富的應用。
“AI+Science”的工程化正當時
做Science(科學)是探索和理解未知的世界,而工程是還原到實踐的過程。
談到“AI+Science”的工程化,張林峰博士強調,“AI+Science”的工程化正當時!從規模、數據、性能三個維度的工程化來理解:對于AI+Science,“規模工程”將更加面向計算本身;“數據工程”,將需要面向物理、尊重物理約束;“性能工程”,將不再是軟件對硬件的適配,而會是硬件對算法的定制。
“這樣的工程化需要的是科學家、工程師以及各行各業共同的努力。“開源去中心的協同開發、在開發基礎上快速地實現分布式評審,就是一種被驗證且最佳的軟件協同發展模式。張林峰指出打造“AI+Science”新一代基礎設施的新思路——“開源協同”。
開源模式在過去的半個世紀給計算機領域帶來了高速發展,在科學計算領域尚屬新事物,但這種基于開放共享精神和同行評價機制的高效合作模式發展非常迅速。張林峰博士作為核心發起人并推動的DeepModeling開源社區之上,新一代的AI+Science體系正在建立:底層算力調度、各尺度物理引擎、數據庫、面向各類計算需求的工作流都在快速迭代。基于DeePMD開源軟件,來自世界各地的數千個材料、化學、生物等領域的研究組正在拓寬著他們的科研邊界,也產生了很多優質的科研成果。
AI+Science的未來:解放科學研究與工業設計的生產力
張林峰博士最后強調,AI+Science的未來在于解放科學研究與工業設計的生產力。
他所帶領的深勢科技正在聚焦微觀尺度,打造微尺度工業設計平臺,用開源社區和Lebesgue科學計算平臺解放科學家的生產力,用藥物設計和材料設計兩大平臺解放這兩個行業的研發生產力。為微觀尺度的工業設計解決難題,這也是深勢科技創立的初衷。
關于深勢科技
深勢科技有限公司(“深勢科技”)是一家成立于2019年的科技公司,致力于以新一代分子模擬技術解決微觀尺度工業設計難題。 以打造切實服務于藥企、材料商和科研機構的模擬研發平臺為主要業務方向,以解放研發工作者的生產力為主要業務目標。
深勢科技具有強大的科研與產業落地能力。其新一代分子模擬算法在保持量子力學精度的基礎上,將分子動力學的計算速度提升了至少五個數量級,且對算力的需求與體系的原子數量呈線性依賴;結合高性能計算,能夠對數十億原子規模的體系進行量子力學精度的計算模擬。團隊核心成員獲得2020年全球計算機高性能計算領域的最高獎項“戈登·貝爾獎”,相關工作當選2020年中國十大科技進展,以及2020年全球人工智能十大科技進展。
公司核心團隊由中國科學院院士領銜,研發隊伍由物理建模、數值算法、機器學習、高性能計算及藥物和材料計算等多個領域的數十名優秀青年科學家和工程師構成。