新華網北京9月30日電(凌紀偉)隨著文明的演進、科學的進步和社會的發展,藥物和新材料這兩個數萬億量級的超大市場,誕生和衍生出了許多全新的研發需求和支撐需要,它們指向一個共同的物理基座。而機器學習作為一種應用數學方法,能夠有效解決復雜和高維問題,也為很多行業帶來了更多再發展再深入的機遇。物理模型+機器學習+高性能計算+高效采樣算法的結合正將機遇逐漸變為現實。
9月26日,作為AI for Science科學研究范式引領者的深勢科技宣布,胡成文加入公司擔任CTO,全面負責公司前沿技術研發方向,實施技術發展戰略,以及管理研發團隊。
胡成文曾供職于百度,負責社區、搜索、推薦等領域的技術架構和團隊管理工作。此后,他先后擔任金融科技上市公司、健康保障科技平臺技術負責人。加入深勢科技后,胡成文將組建業務研發、平臺研發兩大團隊,孵化并打造AI for Science新范式下的技術生態。
作為人工智能初創公司,原始創新是深勢科技的關鍵競爭力所在,CTO的使命重大、責任艱巨。未來如何助推深勢科技從技術原始創新,到工程規模化實現,再到產品持續交付的創新-落地閉環邁上新臺階?新華網近日采訪了剛剛履職的胡成文。
加強連接
深勢科技致力于運用人工智能和分子模擬算法,結合先進計算手段求解重要科學問題,為生物醫藥、能源、材料和信息科學與工程研究打造新一代微尺度工業設計和仿真平臺。
盡管剛成立四年,但深厚的科研背景,讓這家公司顯得與眾不同。與團隊接觸一段時間后,胡成文深刻感受到,專注于底層技術創新的深勢科技的確“很不一樣”。
胡成文說,深勢科技的員工學歷高,學科背景交叉融合。這里的科研人員,既有物理、化學、生物、數學等學科背景,也有很多科學家是計算機專業出身,大家的交叉能力比較強,所以整體科研實力非常強。
深勢科技專注用創新技術解決現實問題,這也給胡成文留下深刻印象。他表示,公司許多科研人員都曾在求學階段取得卓越成果,甚至奪得國際大獎,但大家除了做好原始創新外,還大膽走出實驗室,用創新成果解決現實問題。“公司創始團隊能夠跳出圈子,看到行業的訴求,把領先的算法、領先的科研轉化成行業產品,真正解決用戶痛點,這讓團隊展現出非常不一樣的特質。”
在這樣一家依靠底層創新驅動的高科技公司,如何帶領技術團隊更好地支撐公司業務發展?
談及未來規劃,胡成文表示,他將發揮出“連接”這一核心作用。“前面是客戶,后面是我們的科學家,未來要把我們前沿的創新算法高效落地,打造成為一套成熟的產品體系,為行業用戶提供一套超預期的工業解決方案。同時,作為CTO,我會帶領團隊打造公司的技術護城河、提升行業影響力。”
扎根互聯網十余年,胡成文積累了豐富的互聯網研發經驗,他將用好這些實踐經驗,讓AI進一步貼近產業,讓基礎研究更有效地轉化為現實生產力。
在胡成文看來,傳統互聯網行業具有大規模工業化的經驗,怎樣交付給用戶一系列復雜的產品,做到高可用,并且根據用戶需求快速迭代,這些經驗能夠幫助深勢科技讓領先科技更好賦能行業用戶。
強化技術
微觀世界有其自身規律,薛定諤方程被視為微觀世界的“牛頓力學”。但微觀世界充滿不確定。
胡成文指出,微尺度創新的關鍵在于有效求解物理方程。百年前,科學家就從第一性原理出發,揭示了藥物分子設計、篩選及發現的底層邏輯。但藥物研發之所以緩慢,就是因為這個解方程的成本實在太高。而算法的更新、算力水平的提升,開啟了AI輔助藥物研發的新篇章。
傳統的AI藥物研發面臨的一大挑戰就是數據不夠標準化,清晰度不夠,無法用足夠多的數據訓練出可用的模型。面對這個難題,深勢科技的解決方案是什么?
胡成文表示,深勢科技一方面用AI工具大幅加速解方程的過程,解決科研的問題;另外就是科研創新解決工業化問題。首先通過AI加速解方程過程,創造新的數據,對不確定的數據進行小范圍驗證,反復迭代數據,并運用這些數據訓練模型。在此基礎上,再去解決工業上的遇到的實際問題。所以深勢科技的思路是從底層往上延伸,在這方面深勢科技具有強大的創新優勢。
在解方程的過程中,深勢科技也在不斷對外賦能。胡成文透露,深勢科技下一步將要做一件事——開源開放。
“我們希望把一些成果開源開放出來,同時能夠做一些預訓練模型。我們很快將發布一款預訓練大模型。”胡成文表示,AI主要是視覺和單元處理,深勢科技希望把這套模式引入到醫藥行業,促進行業朝著良性、快速成長的方向發展。
藥物研發異常復雜繁瑣。對許多科研人員來說,面對新的疾病,當找到相關靶點后,需要從頭到尾開始做實驗,從包含幾千萬個化合物的庫里做篩選。
大模型帶來的好處是什么?一般認為,大模型能夠降低一項技術應用的門檻。“簡單來說,找一個藥,就不需要從頭到尾,從幾千萬個分子里面去找了,從模型中調調參數,可能變成從幾萬個、幾十萬個里面去找,整個迭代速度大幅加快。”胡成文說,目前深勢科技已經與許多藥廠展開這項合作。
在他看來,臨床之前的整個藥物研發過程,許多環節都可以通過計算來代替。未來,AI會代替一些傳統的實驗成為藥物發現的標配。
微觀尺度的創新,包括通過技術推動藥物研發,深勢科技是行業內最早一批從事這項工作的企業。胡成文希望深勢科技能夠借助行業的力量,一起來把這件事做大。
洞察需求
在跨尺度科學研究領域,每當解答出一個方程式,就會產生很多新的需求。
比如針對藥物研發企業,當洞察到他們提升研發效率、降本增效的訴求后,怎樣加快藥物迭代的過程?其實核心還是需要像深勢科技這種既有交叉背景又懂現實需求的團隊來滿足需求。
另據胡成文介紹,目前,除了藥物研發和材料研發企業,深勢科技另一大用戶群體是科研計算人員。他們存在大量做實驗、做計算的需求,而他們的科研手段和工具又比較傳統。當深勢科技發布了一系列算法和應用后,很多科研人員品嘗到了使用這些平臺做科研、發論文的好處,獲得專業人群的認可,幫助深勢科技贏得了一大批客戶。
據了解,基于科研人員面臨的計算需求,深勢科技開發了Lebesgue科學計算平臺,希望在業務底層之上,打造一個面向科研人員的開箱即用的云服務。在這個平臺上,能夠提供充沛的算力,科研人員所需要用到的工具也都已經裝好,而且能兼容各種環境。
胡成文說,深勢科技專注微尺度領域創新。“我們想做一個VI管理平臺,類似于微觀領域的CAD,最終呈現給用戶的產品是一個SAAS平臺。用戶在這里能夠做藥物研發、材料研發,它可以開源即用,打開一個web界面,就可以跑模型。”
在AI for Science領域,中國已經進入世界領先行列,而且具有自己的優勢。胡成文認為,以深勢科技為代表的中國的AI for Science企業,所開創的產品和服務能夠解決現實問題;其次,中國企業有自己的創新。“比如,我們的算法能夠落地,作為一個成熟產品,作為一套解決方案,能夠真正的反哺行業,能夠解決工業化的問題。”
深勢科技是AI for Science科學研究范式的引領者和踐行者,胡成文表示,未來深勢科技仍將聚焦微觀領域做技術創新。
他認為,一方面,這個行業更偏向底層技術,深勢科技擁有這樣一批科學家,他們本身就是研究微觀領域的各種計算問題,這是公司的人才壁壘;另一方面,從用戶的反饋來看,能夠實實在在幫助他們解決痛點;從深勢未來的愿景看,人類文明最關鍵的生命、能源、材料、信息技術及產業的創新升級,都面臨著共同的顯著瓶頸——微觀尺度的有效計算與理解,AI for Science恰好為微觀尺度的技術變革帶來了從未有過的機遇。這一領域的商業化才剛剛開始,市場存在著巨大的發展空間。