6月27日,國家基因庫生命大數據平臺(以下簡稱CNGBdb)在CARSI正式上線,向CARSI所有用戶提供文獻檢索、科學數據交匯與存儲、分析計算等集“搜存算用”于一體的服務。CNGBdb的加入,標志著CARSI公共服務向生命科學領域縱深拓展,助力生命科學數據開放共享和應用。聯盟全體師生可通過CARSI直接使用,無需付費購買也無需申請開通。
CNGBdb由深圳國家基因庫(以下簡稱“國家基因庫”)傾力打造,是國家基因庫樣本和數據資源開放共享的統一平臺,提供科學研究中數據資源開放共享服務,如數據匯交管理、數據在線分析等;同時提供樣本資源開放共享服務,如樣本共享展示和樣本共享申請。目前,平臺匯聚全球超11PB的科學數據,并已經獲得21家國際出版社/系列期刊認可。
CARSI的資源共享特性為生物遺傳資源共享提供了新渠道,師生們可以在CNGBdb平臺上共同存儲、分析樣本/數據、發表成果、制作課件、實操學習等。用戶身份真實性可通過CARSI來保證這一前提,為CNGBdb平臺和高校進一步合作科研項目,推動科學數據庫建設,促進可管控的樣本和數據資源的開放流通和合理利用,提供了強有力的底層支撐。
強強聯合,協同發展。深圳國家基因庫作為CARSI的第100個資源服務商,為CARSI注入新鮮血液,具有特別的紀念意義。目前,CARSI服務范圍逐漸擴大,已覆蓋全國32個省的740多萬用戶,CNGBdb可以借助聯盟高校持續增長的規模優勢,服務更多用戶。
CNGBdb平臺主要包含哪些數據庫?如何助力生命科學研究?一起來看看吧。
【搜】海量信息,智能檢索
CNGBdb整合了來源于國家基因庫、NCBI、EBI、DDBJ等平臺的數據,包括文獻、變異、基因、蛋白質、序列、項目、樣本、實驗、組裝、物種10個結構的大量分子數據和其他信息,通過CNGBdb搜索建立索引,并將這些數據與樣本甚至樣本活體相關聯,從而實現數據從活體到樣本再到信息數據全過程的可追溯性,達成綜合數據的全貫穿。
【存】國際認可,規范管理
國家基因庫序列歸檔系統(CNSA)是一個歸檔全球組學數據的系統,致力于組學數據的存儲、管理和共享,促進組學數據的再利用,推動生命科學的發展。服務國家戰略,加強我國遺傳數據資源的安全性,為國內科研人員提供更加安全、規范、可靠、便捷、開放的數據歸檔系統。
國家基因庫序列歸檔系統(CNSA)是一個歸檔全球組學數據的系統,致力于組學數據的存儲、管理和共享,促進組學數據的再利用,推動生命科學的發展。服務國家戰略,加強我國遺傳數據資源的安全性,為國內科研人員提供更加安全、規范、可靠、便捷、開放的數據歸檔系統。
國家基因庫樣本信息共享平臺(E-BioBank,簡稱EBB),致力于搭建樣本持有方與使用方之間的橋梁,整合國內外生物樣本信息和樣本庫信息,規范并統一樣本信息整合標準,創造公平、公開的生物樣本共享環境,促進生物樣本的科學、合理利用,是一個公益性、基礎性、戰略性的科技創新服務平臺。
【算】安全可信,高效擴展
生命大數據可信計算平臺(CODEPLOT)以數據匯交模塊存儲的海量數據構建的數據廣場為支撐,以靈活工作空間管理模式為核心,同時采取權限管理以及區塊鏈存證等多種模式,確保用戶數據安全共享。基于平臺數據和工具流程,CODEPLOT面向高校和學生打造基因組、轉錄組、單細胞、時空、代謝等多組學生物信息分析課程和教研服務平臺。
國家基因庫高性能混合計算池,擁有CNGB獨有的千種植物轉錄組數據集、萬種鳥基因組項目數據集、大規模免疫序列數據集 等,同時整合了NCBI 最新的nt、nr庫,方便用戶對核酸或蛋白質序列進行搜索對比。安全多方計算工具,結合區塊鏈技術,在不暴露原始數據的情況下進行聯合計算,實現數據安全共享。
【用】30+實用科學數據庫
CNGBdb基于重大項目成果及現有數據資源,構建了動植物多樣性、 微生物、 健康與疾病等不同領域方向的30余+科學數據庫。與多家高校、科研院所合作共建組學數據應用,構建了全球最大的生菜數據庫LettuceDB、時空組學數據庫StomicsDB等高質量數據庫,并為數據庫提供穩定、安全的網絡和服務器資源。
基于的“搜、存、算、用”四大功能,CNGBdb建立一體化的科研支撐服務,支撐科研數據構建全流程閉環。從“科研數據檢索”、“科學數據歸檔”到“生物信息分析挖掘”再到“科研成果共享發表”,實現了生命科學研究用戶在科學數據領域的穩定保存和高效應用。
【關于深圳國家基因庫】
深圳國家基因庫(China National GeneBank,CNGB)是由國家發展和改革委員會等四部委批復建設的我國首個國家級綜合性基因庫,定位于有效保護、開發、利用遺傳資源,為生命科學研究和生物產業創新發展提供服務的國家級科研支撐平臺。
深圳國家基因庫是服務于國家戰略的重大科技基礎設施之一,對生物遺傳資源進行存儲、讀取和開放共享,并以此為基礎搭建起支撐生命科學研究與生物產業創新發展的公益性、開放性、引領性、戰略性科技平臺,是世界領先的綜合性生物遺傳資源基因庫。