2021年8月4日,上海——全球領(lǐng)先的人工智能平臺(tái)公司商湯科技SenseTime公布了以原創(chuàng)AI技術(shù)賦能新藥研發(fā)和精準(zhǔn)醫(yī)學(xué)的多項(xiàng)最新重磅研究成果,覆蓋藥物發(fā)現(xiàn)、臨床前研究、臨床試驗(yàn)、新藥上市后等多個(gè)藥物研發(fā)環(huán)節(jié),旨在通過AI技術(shù)加速新藥研究和上市流程,縮短新藥研發(fā)周期、降低藥品研發(fā)成本、提高新藥研發(fā)成功率。目前,相關(guān)成果已發(fā)表在《自然精準(zhǔn)腫瘤學(xué)》(Nature Precision Oncology)、《生物信息學(xué)》(Bioinformatics)、國(guó)際人工智能聯(lián)合會(huì)議(IJCAI)等國(guó)際頂尖期刊及會(huì)議上,同時(shí)開源相關(guān)代碼,為醫(yī)藥行業(yè)的基礎(chǔ)研究和創(chuàng)新提供前沿的突破思路。
商湯科技副總裁、研究院副院長(zhǎng)張少霆表示,“新藥研發(fā)是關(guān)系著人類生命健康的事業(yè),是一項(xiàng)艱巨且風(fēng)險(xiǎn)極高的工作,需要多學(xué)科之間的相互合作。依托商湯科技沉淀多年的原創(chuàng)技術(shù)能力,商湯智慧健康首次以AI賦能新藥研發(fā),希望全面深入發(fā)掘化合物、蛋白、細(xì)胞系和臨床大數(shù)據(jù)中的潛在規(guī)律,為加速新藥研發(fā)進(jìn)程提供精準(zhǔn)的依據(jù),并逐步覆蓋新藥研發(fā)多個(gè)環(huán)節(jié),幫助藥企和相關(guān)研發(fā)機(jī)構(gòu)降低藥物研發(fā)風(fēng)險(xiǎn)、提高效益,加速新藥的研發(fā)和落地,為提升人類健康水平貢獻(xiàn)力量。”
藥物發(fā)現(xiàn):自主學(xué)習(xí)蛋白相互作用及其分類,輔助藥物作用靶點(diǎn)定位
作為構(gòu)成細(xì)胞的基本有機(jī)物,蛋白質(zhì)分子及其之間的相互作用是細(xì)胞實(shí)現(xiàn)各項(xiàng)復(fù)雜功能的基礎(chǔ)。因此,基于蛋白相互作用(protein-protein interactions,簡(jiǎn)稱PPI)構(gòu)建蛋白關(guān)系網(wǎng)絡(luò),可幫助分析疾病發(fā)生時(shí)的分子作用機(jī)制,從而幫助研究人員發(fā)現(xiàn)和理解藥物作用靶點(diǎn),推動(dòng)新藥研發(fā)。然而,以實(shí)驗(yàn)研究為主的傳統(tǒng)PPI研究方法不僅耗時(shí)長(zhǎng),且難以有效分析PPI的具體分類。通過計(jì)算機(jī)模擬雖然可以快速為實(shí)驗(yàn)室研究提供候選PPI、加速實(shí)驗(yàn)效率,但是現(xiàn)有方法在遇到訓(xùn)練集中未包含的蛋白數(shù)據(jù)時(shí)仍會(huì)出現(xiàn)性能損失,不能很好地泛化到未知的蛋白及PPI。這也對(duì)不斷發(fā)現(xiàn)的新蛋白質(zhì)及其PPI、以及由此產(chǎn)生的潛在新靶點(diǎn)的分析提出了巨大挑戰(zhàn)。
商湯智慧健康團(tuán)隊(duì)基于大量研究,在發(fā)布于IJCAI的《Learning Unknown from Correlations: Graph Neural Network for Inter-novel-protein Interaction Prediction》一文中提出了一種新的衡量指標(biāo)(metrics),通過新的數(shù)據(jù)劃分方式,有效衡量模型在跨數(shù)據(jù)集、未知蛋白上的性能效果;同時(shí)還提出了一種新的建模方法(methodology),創(chuàng)新性地訓(xùn)練了一套能夠?qū)W習(xí)蛋白間關(guān)聯(lián)關(guān)系的GNN(圖神經(jīng)網(wǎng)絡(luò))模型,實(shí)現(xiàn)了更穩(wěn)定的跨數(shù)據(jù)集表現(xiàn),從而實(shí)現(xiàn)了在未知PPI預(yù)測(cè)上的更優(yōu)性能。在行業(yè)通用的公開數(shù)據(jù)集上進(jìn)行的跨數(shù)據(jù)集實(shí)驗(yàn)中,商湯提出的新方法比現(xiàn)有方法的預(yù)測(cè)精度提高了36%。這兩大創(chuàng)新方案可以在新藥研發(fā)過程中,更好地幫助藥物作用靶點(diǎn)的發(fā)現(xiàn)、理解和選擇。
高魯棒性的基于GNN的PPI分析框架
臨床前研究:高效細(xì)胞系數(shù)據(jù)處理,準(zhǔn)確預(yù)測(cè)癌癥藥物反應(yīng)
在新藥研發(fā)的臨床前實(shí)驗(yàn)階段,對(duì)目標(biāo)疾病的藥物反應(yīng)進(jìn)行準(zhǔn)確預(yù)測(cè)是最重要、也最具挑戰(zhàn)性的任務(wù),尤其是在癌癥治療領(lǐng)域。臨床前的實(shí)驗(yàn)主要涉及使用計(jì)算模型和相關(guān)細(xì)胞組織在實(shí)驗(yàn)室環(huán)境下的各項(xiàng)分析測(cè)試,為后續(xù)的人體臨床試驗(yàn)墊定基礎(chǔ)。近年來,高通量基因測(cè)序技術(shù)的快速發(fā)展極大地推動(dòng)了基于細(xì)胞系的癌癥藥物反應(yīng)研究。然而,鑒于癌癥致病機(jī)理和藥物作用機(jī)制的復(fù)雜性,傳統(tǒng)方法仍不能有效抓取藥物的化學(xué)結(jié)構(gòu)特征,并充分整合基因組、轉(zhuǎn)錄組等多種組學(xué)信息,限制了藥物反應(yīng)預(yù)測(cè)準(zhǔn)確率的進(jìn)一步提升。
在發(fā)布于《生物信息學(xué)》的《DeepCDR: a hybrid graph convolutional network for predicting cancer drug response》研究中,商湯智慧健康團(tuán)隊(duì)首次將GCN(圖卷積網(wǎng)絡(luò))應(yīng)用在癌癥藥物反應(yīng)研究領(lǐng)域,提出了一種全新的混合圖卷積網(wǎng)絡(luò)模型DeepCDR。該模型可以自動(dòng)挖掘和建立藥物化學(xué)結(jié)構(gòu)特征,并能高效處理細(xì)胞系里的基因組學(xué)、轉(zhuǎn)錄組學(xué)、表觀基因組學(xué)等多元組學(xué)數(shù)據(jù),實(shí)現(xiàn)了對(duì)抗癌藥物反應(yīng)的精準(zhǔn)預(yù)測(cè)。在覆蓋238種藥物和561種細(xì)胞系的公開數(shù)據(jù)集上,該模型將預(yù)測(cè)精度指標(biāo)(皮爾森相關(guān)系數(shù))從0.780提升到了0.923,為抗癌藥物在臨床前的實(shí)驗(yàn)室環(huán)境下測(cè)試藥物敏感性、以及尋找腫瘤中調(diào)節(jié)藥物反應(yīng)的新基因等提供了更加精準(zhǔn)高效的研究工具。
基于混合圖卷積網(wǎng)絡(luò)的基因多組學(xué)和藥物化合物在癌癥藥物療效評(píng)估分析
臨床研究:基于病理圖像預(yù)測(cè)癌癥亞型,為降低亞型評(píng)估成本提供全新思路
隨著精準(zhǔn)醫(yī)療技術(shù)的不斷發(fā)展,針對(duì)某種癌癥亞型或特定基因突變進(jìn)行個(gè)性化治療的靶向藥物逐漸成為癌癥藥物治療的主要手段。新的抗癌藥物的研發(fā)也大都集中在這一領(lǐng)域。目前,為了確定患者所患的具體癌癥亞型,需要對(duì)患者的病灶組織進(jìn)行基因測(cè)序,通過不同的基因突變情況進(jìn)行分類,檢測(cè)的成本十分昂貴。
商湯智慧醫(yī)療團(tuán)隊(duì)提出了一種全新的思路,利用深度學(xué)習(xí)技術(shù)挖掘數(shù)字病理圖像中的細(xì)胞特征信息,從而判斷組織的基因突變類別和相關(guān)生物信號(hào)通路信息。利用這一方法,商湯智慧醫(yī)療團(tuán)隊(duì)成功的預(yù)測(cè)了肺癌、乳腺癌、肝癌中的多個(gè)重要基因突變特征,其中最好的預(yù)測(cè)性能指標(biāo)(AUC)達(dá)到0.852。這一項(xiàng)研究為確定患者癌癥亞型提供了一種全新的思路和方法,未來可能將大幅度降低確定癌癥亞型的成本,從而造福癌癥患者。
基于病理細(xì)胞圖像的TP53基因突變預(yù)測(cè)
新藥上市后:助推老藥新用,AI預(yù)測(cè)藥物新適應(yīng)癥
鑒于新藥研發(fā)超長(zhǎng)的研發(fā)周期和巨大的投入,上市后的老藥新用可以基于已知的化合物信息,以較低的成本和較短的周期進(jìn)入臨床。然而,由于已上市的藥物數(shù)量相對(duì)有限,同時(shí)缺乏有效的藥物與新適應(yīng)癥的篩選模型,導(dǎo)致目前市面上老藥新用的成功案例很少。只有做到充分挖掘藥物、疾病、蛋白之間的多維關(guān)系,才能為預(yù)測(cè)新適應(yīng)癥提供更可靠的分析。
對(duì)此,商湯智慧健康團(tuán)隊(duì)創(chuàng)造性地訓(xùn)練了一套覆蓋藥物、疾病、蛋白多個(gè)領(lǐng)域間相互作用復(fù)雜關(guān)系的大規(guī)模GCN網(wǎng)絡(luò)模型,從而精準(zhǔn)預(yù)測(cè)藥物與疾病之間的關(guān)系。該模型無需任何人工干預(yù)便可自主學(xué)習(xí)各關(guān)鍵信息間的關(guān)系,實(shí)現(xiàn)預(yù)測(cè)過程的全自動(dòng)化以及對(duì)未知藥物適應(yīng)癥的有效預(yù)測(cè)。在公開的repoDB小分子藥物重定向的數(shù)據(jù)集上,相比目前使用的機(jī)器學(xué)習(xí)方法公開的最好結(jié)果,此方法的預(yù)測(cè)結(jié)果取得了更好的成績(jī),使相關(guān)科研團(tuán)隊(duì)的預(yù)測(cè)結(jié)果性能指標(biāo)(AUC)提升了8%(0.792→0.857)。目前,利用這項(xiàng)研究結(jié)果預(yù)測(cè)出的某種已經(jīng)上市的心臟疾病藥物對(duì)于乳腺癌治療的潛在有效性,已經(jīng)被臨床文獻(xiàn)所證實(shí)。未來,商湯智慧健康團(tuán)隊(duì)希望利用這種方法,助力更高效的藥物新適應(yīng)癥篩選過程,推動(dòng)老藥新用的臨床進(jìn)展。
基于藥物、蛋白、疾病關(guān)系建模的藥物重定向分析框架
回首過往,新冠疫情加速了全球醫(yī)藥行業(yè)的創(chuàng)新步伐。與此同時(shí),國(guó)內(nèi)今年來的藥品帶量采購(gòu)、藥品管理法修訂等新政也助推了行業(yè)變革的到來,國(guó)內(nèi)外各大藥企紛紛加大新藥研發(fā)力度。展望未來,人工智能技術(shù)也將為推動(dòng)醫(yī)藥行業(yè)的創(chuàng)新發(fā)展發(fā)揮積極作用。憑借領(lǐng)先的原創(chuàng)AI技術(shù),商湯科技此次公布的四大研究成果將為新藥研發(fā)的多個(gè)環(huán)節(jié)奠定創(chuàng)新基礎(chǔ),助力醫(yī)藥行業(yè)智能化升級(jí),進(jìn)一步推動(dòng)“醫(yī)療新基建”的長(zhǎng)遠(yuǎn)發(fā)展。目前,商湯也已經(jīng)與國(guó)內(nèi)外多家頂級(jí)藥企和基因檢測(cè)公司建立商業(yè)合作,共同利用AI技術(shù)加速新藥、基因等前沿創(chuàng)新方向的研發(fā),加快成果轉(zhuǎn)化,從而造福人類健康事業(yè)。
關(guān)于商湯科技
作為全球領(lǐng)先的人工智能平臺(tái)公司,商湯科技以“堅(jiān)持原創(chuàng),讓AI引領(lǐng)人類進(jìn)步”為使命和愿景。
商湯科技擁有深厚的學(xué)術(shù)積累,并長(zhǎng)期投入于原創(chuàng)技術(shù)研究,自主研發(fā)并建立了全球頂級(jí)的深度學(xué)習(xí)平臺(tái)和超算中心,推出了一系列領(lǐng)先的人工智能技術(shù),包括:自動(dòng)駕駛、增強(qiáng)現(xiàn)實(shí)、面部識(shí)別、圖像識(shí)別、物體識(shí)別、文字識(shí)別、醫(yī)療影像分析等。此外,商湯前瞻性打造新型人工智能基礎(chǔ)設(shè)施——SenseCore商湯AI大裝置,打通算力、算法和平臺(tái),大幅降低人工智能生產(chǎn)要素價(jià)格,實(shí)現(xiàn)高效率、低成本、規(guī)模化的AI創(chuàng)新和落地,進(jìn)而打通商業(yè)價(jià)值閉環(huán),解決長(zhǎng)尾應(yīng)用問題,推動(dòng)人工智能進(jìn)入工業(yè)化發(fā)展階段。
目前,商湯科技在多個(gè)垂直領(lǐng)域的市場(chǎng)占有率位居前列,業(yè)務(wù)涵蓋智慧商業(yè)、智慧城市、智慧生活、智能汽車四大板塊,相關(guān)產(chǎn)品與解決方案深受客戶與合作伙伴好評(píng)。
商湯科技現(xiàn)已在香港、上海、北京、深圳、成都、杭州、南平、青島、三亞、西安、臺(tái)北、澳門、京都、東京、新加坡、利雅得、阿布扎比、迪拜、吉隆坡、首爾設(shè)立辦公室。另外,商湯科技在泰國(guó)、印度尼西亞、菲律賓等國(guó)家均有業(yè)務(wù)。更多信息,請(qǐng)?jiān)L問商湯科技網(wǎng)站、微信、微博和領(lǐng)英。