10月21日,第三屆“創世技”顛覆性創新榜發布暨顛覆性創新成果(海淀)轉化促進中心揭牌儀式在北京海淀舉辦。作為2020年全國雙創周云上活動周部委、北京市和中關村創新創業季重點活動之一,本次活動發布了2020“創世技”顛覆性創新榜和最具顛覆性潛力榜。其中,百度研究院的“AI助力新冠病毒分析和疫苗序列設計”成果入選2020顛覆性創新榜。
百度技術委員會理事長陳尚義(左四)領獎
自2020年新冠疫情發生以來,百度持續上線一系列技術和服務,全面支持疫情防控和復工復產。特別是在新冠肺炎病毒基因測序和疫苗研究方面,百度此前免費開放的線性時間算法LinearFold等人工智能前沿技術更是發揮了巨大作用。今年五月,百度研究院再次深化在AI算法領域的能力,重磅推出全球首個mRNA疫苗基因序列設計算法LinearDesign,大大提升了疫苗設計的穩定性和蛋白質表達水平,加速了疫苗研發速度。
顛覆性AI新算法 LinearDesign 16分鐘優化mRNA疫苗穩定性
從生物學角度看,疫苗的研制有多個方向,如DNA疫苗、mRNA疫苗、蛋白質疫苗等。其中,mRNA疫苗是最有希望的預防工具。但mRNA本身穩定性差、易被分解,所以在保存、運輸過程中及體內表達時很容易失效。因此,如何穩定mRNA,提升研發效率,成為了全球科研機關、防疫機構和生物醫學公司的難題。
基于此,百度LinearDesign算法應用計算機科學領域經典算法——動態規劃算法,將這一問題的搜索時間從億萬億年降低到分鐘級。在新冠病毒的刺突蛋白序列上的計算機模擬實驗表明,LinearDesign能夠設計出結構最穩定的序列,而且設計時間只需要1個半小時。
值得一提的是,如果采用線性時間近似算法,所需時間還可以進一步縮短到16分鐘, 且與最優解的能量差距(衡量穩定性的指標,能量越低越穩定)只有0.6%。這兩種設計相比于自然界天然存在的新冠病毒刺突蛋白mRNA序列要穩定的多(能量降低了150%)。
AI算法免費開放 百度持續釋放技術原力
事實上,在LinearDesign算法出爐之前,百度已經開始用AI算法助力疫情防控。今年1月,百度研究院免費開放了將此次新型冠狀病毒的全基因組二級結構預測從55 分鐘縮短至27 秒的LinearFold算法,而新算法LinearDesign正是基于線性時間算法LinearFold的升級。
因此,同LinearFold算法一樣,百度研究院繼續向全球疫苗研發機構及研究中心等免費開放LinearDesign算法,并在arXiv發布了相關論文、提供了CoV-Seq工具平臺,讓研究人員能夠加速科研的進展,助力新冠病毒疫苗研發。
可以看到,人工智能技術可以從技術角度為新冠疫苗研發提供全新的解題方法。LinearDesign算法,正是來源于百度與全球生物、醫藥專家的思想碰撞。而隨著人工智能技術的不斷發展,在生物計算領域,AI與生物、醫藥等行業的深度融合可以有效填補復雜行業問題與前沿算法之間的關鍵空白地帶,加速算法落地和反哺計算問題的定義,而這可能會成為生物計算領域發展的新方向,同樣也可能是AI落地探索的一種全新模式。
目前,百度已與中國疾病預防控制中心病毒病預防控制所簽署戰略合作協議,聯合設立“中國CDC應急技術中心-百度基因測序工作站”。中國疾病預防控制中心后續也將使用百度LinearDesign算法設計的mRNA疫苗序列進行體外實驗,驗證疫苗的穩定性和蛋白質表達效率。未來,百度將繼續以AI技術助力全球抗疫事業。