當科學開始以更快的速度激蕩,有一部分人先看到了未來。
隨著互聯網的普及、傳感器的泛在、大數據的涌現、電子商務的發展、在線社區的興起,數據和知識在人類社會、物理空間、信息空間以及生命科學之間交叉融合、相互作用,量子科學、生物醫藥等一系列的前沿科學與人工智能學科交織碰撞,將發生什么呢?
首先,量子計算(量子力學和計算機科學的交叉學科)給現有的信息處理方式和人工智能技術帶來了全新的想象。我們所熟知的經典計算機以經典比特作為信息處理的基本單位,一個經典比特的狀態要么為0,要么為1。相比之下,量子計算機則利用了量子力學中存在的獨特現象,通過量子比特來存儲和處理信息。其比特狀態可以為0和1的“疊加”態,也就是說可以同時表達0和1。如果把經典計算機和量子計算機擬人化,讓他們同時在一個復雜迷宮內尋找出口,那么經典計算機需要一條路一條路地嘗試,一條不通再試下一條。雖然這個過程相比容易“暈圈”的人類來講已經非常具有速度優勢,但對比量子計算機那種可以同時并行嘗試多條路徑并找到出口的“新計算”來講,還是顯得“慢”了許多。量子計算機的種種特殊性質可能會為經典計算機無法有效解決的問題帶來新的希望。
在帶來潛在優勢的同時,量子計算機需要人們對于更深層微觀系統的操控能力,這在工程上是一個巨大的挑戰。近年來,國內外在量子計算機的硬件上都有做出了巨大突破,這也為人們初步使用量子計算機來解決實際問題帶來了可能。而量子人工智能,就是可能產生重要突破的方向之一,作為量子計算與人工智能的交叉融合領域,該方向可以使得兩個學科相互借鑒、相互補充,從而實現雙贏。一方面人工智能可利用量子計算的信息處理優勢促進自身發展(新型的人工智能算法等等),另一方面量子科學也可以利用人工智能來突破研發瓶頸(例如通過深度學習技術實現對微觀系統更優的操控)。總的來說,量子計算在大規模應用落地之前還有許多棘手的科學與工程技術難題待解,而這就需要以人工智能為代表的先進技術做支持。
在這方面,國內像百度這樣自身具有AI技術優勢的企業也早就開始了研發與應用探索。去年,百度就接連在國際量子頂會TQC 2020和QIP 2020亮相并有著驚艷的表現。其中,在TQC 2020大會中,百度憑借著自身在量子計算領域的技術積累,成功入選1個邀請報告和1個貢獻報告,這是大陸地區首次且唯一入選TQC的邀請報告,百度在全球量子計算學術界的影響力得以凸顯。
事實上,百度早在2018年便成立了量子計算研究所。到了2020年,百度基于自身開源開放的深度學習平臺飛槳發布了“量槳”——支持量子神經網絡的搭建與訓練的量子機器學習工具集。而飛槳作為中國首個自主研發、開源開放、功能完備的產業級深度學習平臺,全面涵蓋核心框架、基礎模型庫、端到端開發套件、工具組件,以及飛槳企業版AI開發平臺,可以說是為產業、學術、科研創新提供了基礎技術底座。
基于飛槳打造的量子機器學習工具“量槳”,建起了人工智能與量子計算之間的橋梁,支持常用的量子電路模擬并提供組合優化、量子化學等前沿應用工具包。同時,為了便于開發者利用量子科學快速進行應用向探索,量槳還提供了翔實的入門教程和場景案例(qml.baidu.com),為廣大量子計算愛好者提供了一條可行的學習途徑。
今年1月,在量子計算頂會QIP2021上,量槳重點新增了分布式量子信息處理模組LOCCNet,在量子糾纏處理場景中達到業界最優并得到了廣泛的關注,更是支持量子態分辨、量子隱形傳態等核心量子信息處理方案的便捷開發。量槳團隊通過LOCCNet發現了全新的糾纏提純方案,達到業界最優,可用于推動量子通信等技術的發展。今年3月,量槳適配飛槳框架2.0也重磅升級至2.0版本,運行性能最高可提升40%,達到國際領先。
同時,量槳還新增量子噪聲模塊,支持開發者在量子算法中設置常見的噪聲從個人開發適用于近期含噪量子設備的應用。通過百度飛槳深度學習平臺賦能量子計算,量槳為領域內的科研人員以及開發者提供了便捷開發量子人工智能應用強有力的支撐,也推動著人工智能與量子計算的融合創新。
事實上,學術界長久以來往往瞄準世界先進的方向進行投入,即學科前沿,但應用落地的速度相對緩慢。隨著本世紀的信息環境發生著巨大而深刻的變化,開始快速反映并聚集人類的發現、需求、創意、知識和能力,學科交叉碰撞,為前沿學科的技術應用帶來“加速度”,特別是近期可深刻感受到的生物醫學研究方向上的突破與創新。
2020年人類與病毒之間的一場遭遇戰,人工智能以生物計算角度切入生命科學,加速了生物醫藥研發的效率與速度。去年5月,百度推出了全球首個mRNA疫苗基因序列設計算法 LinearDesign,可用來高效設計優化mRNA序列。而從生物學角度看,疫苗的研制有多個方向,如DNA疫苗、mRNA疫苗、蛋白質疫苗和最常見的滅活疫苗等。其中,技術成熟且效果不錯的滅活疫苗研制一般在10年左右,而這次我們之所以能夠一年研制出滅活疫苗可以說是舉全國之力創了奇跡,但這不是常態。相比來講,mRNA疫苗可省去蛋白質疫苗需要體外培育抗原的環節,大大減少了生產周期,更有希望成為未來的預防工具。一旦成功,以后再有其他類似病毒,我們只要搞定病毒的關鍵基因序列疫苗就算完成了一半,這讓疫苗的研發周期瞬間從10年左右拉至周級單位,疫苗研發也由此從一種生物化學問題轉變為工程問題。
但mRNA疫苗的挑戰在于非常“脆弱”,很容易在保存和運輸過程中因為降解而失效,并導致蛋白質表達效率的大幅降低,而百度研發的LinearDesign算法則針對mRNA疫苗的這一挑戰做出優化,提出了一種更為直接和高效的解決方案。目前,在新型冠狀病毒刺突蛋白序列上的計算機模擬實驗也已證明了LinearDesign的有效性。該算法帶來的解決方案不僅可以設計出結構最穩定的蛋白序列,而且只需要1個半小時左右的時間。
此外,如果再進一步采用線性時間近似算法,所需的時間將可再縮短至16分鐘,而與最優解的能量差距(衡量穩定性的指標,能量越低越穩定)只有0.6%。這兩種設計相比于自然界天然存在的新型冠狀病毒刺突蛋白mRNA序列要穩定的多(能量降低了150%)。早在去年,領先的LinearDesign算法就已向全球疫苗研發機構及研究中心等免費開放,并在arXiv發布了相關論文,助力新型冠狀病毒疫苗研發。
目前,百度也已與中國疾病預防控制中心病毒病預防控制所簽署戰略合作協議,聯合設立“中國CDC應急技術中心-百度基因測序工作站”。此外,中國疾病預防控制中心后續還將使用百度LinearDesign算法設計的mRNA疫苗序列進行體外實驗,驗證疫苗的穩定性和蛋白質表達效率。2020年底,在國際頂尖人工智能峰會The AI Summit上,百度憑借LinearFold和LinearDesign算法在新冠抗疫中的杰出貢獻,榮獲了AIconics首屆“AI For Good(人工智能向善)”獎。中國AI的技術實力、責任擔當以及與行業深度結合的能力再次收獲國際盛贊。
除了LinearDesign外,百度在生物計算方面積累的其他成熟經驗已基于飛槳打造的螺旋槳PaddleHelix進行開源,提供包括大規模的分子預訓練、藥物-靶點親和力預測、以及 ADMET成藥性預測等一系列算法和模型。同時,螺旋槳PaddleHelix生物計算平臺底層依舊以飛槳核心框架作為支持,有深度開發需求的開發者也可以滿足自身所需。從上層應用場景來講,PaddleHelix滿足了藥物研發,疫苗設計和精準醫療三大主要場景,幫助生物信息學、計算機交叉學科背景的學習者、研究者和合作伙伴,更便利地構建AI算法模型。
今年三月,憑借PaddleHelix在分子表示方面的技術創新,飛槳還在圖神經網絡國際權威榜單OGB(Open Graph Benchmark)多項分子性質預測任務中亮麗登頂,在AI藥物發現領域取得新的技術突破。
綜上所述,我們已不難感受到,技術的進步讓科學研究越來越多地呈現出集成創新、融合發展的新態勢,學科交叉融合已成為當前科學技術發展的重大特征,而強化學科交叉和尋求新的科研范式已經成為支撐實現科技創新重大突破、發展戰略性新興產業的迫切需要。
截至2020年底,飛槳已凝聚超265萬開發者,服務10萬家企業,基于飛槳平臺創建了超過34萬個模型,在城市、工業、電力、通信等很多關乎國計民生的領域都有飛槳在發揮作用。飛槳顯著降低了人工智能的應用門檻,加快了創新速度的同時,也在通過前沿學科的交叉不斷拓展創新的邊界。未來,作為智能時代開源開放、技術領先、便捷易用的基礎技術底座,飛槳還將為整個智能社會帶來更多、更大的可能。