環形RNA是一類在真核細胞中廣泛存在的內源性非編碼RNA分子,在生物體發育過程中發揮重要作用。之前研究已在不同物種中鑒定出數百萬個環形RNA分子,并產生了大量用于揭示生物體組織表達模式的環形RNA數據資源。然而,由于大多數環形RNA表達量較低,傳統的轉錄組測序方法無法表征單個細胞環形RNA表達譜系特征及異質性。近年來,隨著單細胞全長轉錄組測序技術的發展,已可對單個細胞中環形RNA進行捕獲測定。盡管效率較低,仍可部分揭示單細胞分辨率下環形RNA的表達模式。因此,單細胞水平的環形RNA表達及功能研究已成為該領域重點關注的問題。
中國科學院北京生命科學研究院研究員趙方慶團隊致力于環形RNA方面的研究。6月10日,該團隊在《自然-通訊》(Nature Communications)上,發表了題為Exploring the cellular landscape of circular RNAs using full-length single-cell RNA sequencing的研究論文。該研究基于海量單細胞全長轉錄組測序數據集,實現了單細胞分辨率下環形RNA的高效識別及深度挖掘,基于大規模時空組學數據的整合分析,探索了環形RNA的細胞異質性,揭示了環形RNA作為細胞類型標志物的應用潛力。該研究將目前環形RNA研究從傳統組織水平提升至單細胞水平,為探究不同細胞類型中環形RNA的生物學功能提供了重要的數據資源和分析技術。
科研人員收集整理了171個已發表的單細胞全長轉錄組數據集(圖1),包含人和小鼠中58種組織和細胞類型,共計172,137個細胞。同時,研究建立了基于單細胞轉錄組數據的環形RNA識別和整合分析方法,在人和小鼠中共識別出40,604和131,533個高度可靠的環形RNA分子。基于以上數據所生成的單細胞環形RNA綜合表達圖譜,為環形RNA的研究提供了有力的數據支持,并為揭示環形RNA在不同細胞類型及發育階段的動態變化提供了重要資源。
該研究深度剖析了單細胞數據中環形RNA的表達模式,發現它們在不同細胞類型上具有高度特異性。研究對小鼠大腦不同細胞類型中環形RNA的表達的分析表明,抑制性和興奮性神經元的差異性表達與RNA結合蛋白的表達具有高度相關性。此外,研究觀察到胚胎發育不同階段的特征性環形RNA,闡釋了環形RNA從母體來源至合子表達發生的動態轉變過程。
進一步地,基于單細胞測序技術可有效的揭示腫瘤發展和轉移過程中細胞水平的異質性,研究建立了20名乳腺癌患者的單細胞數據集,分析發現環形RNA在正常和腫瘤細胞的上皮間質轉換過程中的表達規律和潛在功能。研究篩選出人和小鼠中細胞類型特異性環形RNA,并驗證了其可作為生物標志物在解析腫瘤浸潤性免疫細胞中的適用性。最后,研究構建了目前首個單細胞環形RNA數據分析和資源平臺——circSC(
http://circatlas.biols.ac.cn)(圖2),為環形RNA研究奠定了獨特而重要的數據和技術基礎。
研究工作得到國家杰出青年科學基金、國家自然科學基金基金重點項目和國家重點研發計劃的支持。趙方慶團隊致力于建立高效的算法模型和實驗技術,探索人體微生物與非編碼RNA的結構組成與變化規律,解析它們與人類健康和疾病的關系。近年來,相關成果先后發表在Cell(2020)、Gut(2022/2020/2018)、Nature Biotechnology(2021)、Nature Computational Science(2022)、Nature Communications (
2022a/2022b/2021/2020/2017/2016)、Genome Biology(2021/2020/2016)、Molecular Biology and Evolution(2022)、ISME J(2019)等上,這些研究豐富了科學家對人體微生物與非編碼RNA多樣性、結構組成與功能的認識,并為相關數據挖掘及功能機制研究提供了重要方法學工具。
圖1.基于單細胞全長轉錄組的環形RNA識別和整合分析
圖2.環形RNA單細胞表達圖譜及數據平臺——circSC
來源:中國科學院北京生命科學研究院