close

今天小編分享一篇2021年3月26日發表於Computational and Structural Biotechnology Journal的文章,題目為《Identify differential genes and cell subclusters from time-series scRNA-seq data using scTITANS》,IF=13.44。

時間序列在單細胞RNA 測序(scRNA-seq)的研究,使研究人員能根據從單細胞水平的獲取多個細胞發育時間點的樣本,從而有效對基因和細胞的動態進行分析和研究。然而,細胞的不同步性和多個時間點的識別,給scRNA-seq數據的識別隨時間變化的基因和細胞亞群帶來了挑戰。我們提出scTITANS(https://github.com/ZJUFanLab/scTITANS),這種方法通過使用軌跡推理分析的偽時間校正細胞的不同步性,充分利用了所有時間點的單個細胞。通過引入基於時間序列分析方法的隨時間變化的協變量,為時間序列單細胞RNA測序數據的研究帶來新的突破。


1

介紹

最近,人們做了一些嘗試,從時間序列scRNA-seq數據中識別差異表達基因(DEG)和細胞亞群。Hadas等人確定了一種新的小膠質細胞類型和與神經退行性疾病(DAM)相關,Lauren等人確定了胰腺器官發育過程中不同的七個細胞亞群。在這些嘗試中,單個基因的差異表達分析是在發育途徑中的離散細胞群進行的,例如,通過比較分化的細胞類型的集群。這種離散的差異表達方法沒有利用多個時間點提供的連續表達分辨率,無法充分利用隱藏在生物過程中的時間信息,如發育、分化、衰老、藥物反應和疾病發展。相比之下,對於基於聚類的方法,往往不清楚應該對哪些聚類進行比較,以及如何正確結合幾個成對的聚類比較的結果。此外,大量的研究表明,在同一時間點捕獲的細胞可以有很大的不同。由於在分析過程中沒有考慮到不同時間點獲得的細胞之間的變化,目前的嘗試所得到的DEGs和差異細胞亞群可能會因細胞的不同步性而出現偏差。因此,迫切需要開發一種新的時間序列scRNA-seq數據的方法,這種方法要易於使用、定量,並能處理細胞間的異質性。

至於細胞間的異質性,大量的研究表明,細胞的不同步性並不是完全無序的,細胞分化可以被看成是一個連續的過程。當捕捉到足夠數量的單個細胞時,就有可能代表整個連續發展過程中的所有細胞狀態。在這方面,軌跡推理(TI)方法優於基於離散聚類的方法,因為它們可以通過細胞的假時空重新排序來減少細胞不同步的影響。因此,多種基於軌跡的差異表達分析方法,如Monocle和tradeSeq,已經被開發並成功應用於利用快照scRNA-seq數據沿軌跡的連續表達分辨率。另一方面,時間序列分析能夠考慮到多個時間點同時產生的信息,確定表達模式(如周期性模式),並以定量和無知識的方式識別動態生物過程中的調控因素,將成為從多個快照中獲得的時間序列scRNA-seq數據的最佳選擇。目前,時間序列分析正在成功地應用於關注人類疾病和藥物開發的研究。雖然沒有應用於scRNA-seq數據,但時間序列分析在識別基於高通量RNA-seq數據的動態生物過程中的DEGs方面的優勢也已被揭示。因此,應該開發一種能夠結合TI和時間序列分析方法優勢的時間序列scRNA-seq數據的策略。

這裡我們提出scTITANS,一種基於軌跡推理的方法,從時間序列scRNA-seq數據中識別二基因和細胞亞群。在糾正了基於TI分析的單細胞的不同步性後,引入了一個隨時間變化的協變量來識別動態過程中的DEGs和細胞亞群。與目前的嘗試相比,該方法是定量的,能夠處理細胞間的異質性並充分利用隱藏在生物過程中的時間信息。此外,scTITANS實現了更高的準確性,並具有廣泛的應用前景。


2

結果

scTITANS 的工作流程

圖2

圖2展示了scTITANS方法的示意圖。在對數據進行過濾和歸一化的預處理後,首先利用TI方法來構建軌跡並解決潛在的偽時間。基於偽時間,所有單細胞被重新排序。對於DEGs,沿偽時間對每個基因的動態表達進行曲線擬合,並引入時間相關的協變量來計算q值,表示每個基因在偽時間內波動的重要性。對於有差異的細胞亞群,首先將偽時間分成幾個倉。將每個倉中的單細胞分配到相應的簇中後,為每個亞簇擬合一條代表落入每個區間的細胞數的曲線。再次利用一個隨時間變化的協變量來評估每個簇的細胞數沿偽時間的變化。q值越低,基因或細胞亞群的意義就越大。scTITANS 可以在兩種模式下執行。完成數據預處理和TI分析的用戶應提供數據集、軌跡分析產生的細胞和基因的詳細元數據以及根細胞類型。scTITANS 還接受由 Cell Ranger (10X Genomics) 等工具生成的原始數字基因表達矩陣或過濾和歸一化作為輸入的矩陣。然後使用一系列示例數據集來評估 scTITANS 方法的性能。

scTITANS 在識別差異基因方面表現良好

線蟲型神經系統存在於早期發育階段的胚胎發育細胞中,其分化和發育成多種類型的沿發展軌跡的成熟細胞的。(圖3a和b)用偽時間和時間點着色的單元說明了構建的軌跡。如圖所示,pseudotime 期間不同細胞類型的逐漸分布與開發期間獲得的一致。基於上述 TI 分析產生的假時間,擬合代表每個基因沿假時間的相對豐度的曲線,並用 q 值評估和量化擬合線和平線之間差異的顯着性。q值越小,基因越顯着。使用scTITANS方法,一系列基因被識別為CEED數據集中的差異基因。

圖3

scTITANS 中的偽時間校正有助於重建基因表達趨勢

時間序列scRNA-seq數據中隱含的基因表達趨勢是scTITANS性能的關鍵。因此,我們進一步評估了偽時間校正對scTITANS在重建時間序列數據中真實基因表達趨勢的貢獻。如圖3所示,scTITANS中的偽時間校正(圖4a)重建了多個時間點之間明顯差異表達的基因的趨勢(圖4b)。Gcy-8編碼鳥苷酸環化酶,它對優雅動物的熱敏感性至關重要。據報道,gcy-8的表達隨着化感神經元系統的發育而逐漸增加,然後隨着年齡的增長和線蟲對外界熱敏感性的降低而減少。scTITANS可以成功地描述上述過程,儘管gcy-8的減少有些微不足道(圖4a和4b)。此外,scTITANS還重建了被細胞不同步所掩蓋的基因表達趨勢,特別是那些在發育過程中表達水平非線性變化的基因。daf-7(q = 2.21E-32)、neg-1(q = 1.11E-42)、ced-4(q = 1.51E-59)和mec-8(q = 1.90E-32)等基因被scTITANS識別為差異基因,但沿着發育過程沒有表現出明顯的擾動。如圖4c所示,daf-7的表達首先增加,然後減少,並且明顯不同於與真實時間點擬合的平線(圖4d)。類似的結果適用於基因neg-1、ced-4和mec-8。據報道,daf-7與神經系統的發育密切相關,它是一種發育調節的生長因子,調節轉錄和凋亡過程,在幼蟲發育中起重要作用,對蛻皮和排泄管的發育有較大影響。一些證據支持neg-1、ced-4和mec-8在發育過程中發揮重要作用。因此,所有上述結果證實,scTITANS中基於TI分析的單細胞重排有助於從真實的時間序列數據中重建真實的基因表達趨勢。

圖4

scTITANS 在識別差異細胞亞群方面表現良好

圖5a顯示了本研究中使用Monocle3對數據集MRD獲得的細胞亞群,該數據集是由小鼠視網膜發育的10個時間點的視網膜祖細胞測序而成。與實驗結果一致,視網膜祖細胞(RPCs)、神經源細胞和成熟的細胞類型,如視黃質細胞、雙極細胞和錐體,被成功地聚類和注釋。經過TI分析並將偽時間分割成許多時間區間,每個區間的細胞數的曲線沿着每個亞簇的偽時間進行擬合,並計算q值以確定差異性亞簇。偽時間校正有助於重建細胞亞群的趨勢。圖5b 和 5c 分別顯示了三個細胞亞群沿偽時間和實時點的擬合趨勢。scTITANS 確定了在多個時間點之間明顯差異表達的細胞簇,例如「早期 RPC」。此外,scTITANS 還鑑定了被細胞異質性掩蓋的差異細胞簇,例如「神經源性細胞」和「視網膜神經節細胞」,它們在實時點上沒有表現出明顯的擾動。負責整合視覺信息並將其傳遞到中樞神經系統的視網膜神經節細胞在發育過程中應逐漸增加。這種趨勢的成功表徵證實了 scTITANS 中通過偽時間進行的細胞重新排序有助於重建細胞亞群的趨勢。

圖5

3

結論

scTITANS首次結合了TI和時間序列分析的優勢,為時間序列scRNA-seq數據確定了DEGs和差異細胞亞群。通過將單細胞沿着TI分析產生的偽時間重新排序,在隨後的時間序列分析中可以完全排除與單細胞的不同步有關的偏差。與目前的嘗試相比,scTITANS更準確、定量、無知識,能夠處理細胞間的異質性,並充分利用隱藏在生物過程中的時間信息。當擴展到更大的數據集和更廣泛的研究領域時,scTITANS將在使用單細胞測序的研究中引起新的突破。




掃二維碼

關注我們




今天一定要努力學習哦

絕對不要浪費時間


arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()