在過去20多年中,非編碼小RNA(small non-coding RNAs (sncRNA))的研究不斷地給學界帶來驚喜。現有證據充分證明siRNA, miRNA, piRNA, 等經典sncRNA在基因轉錄後調控以及多種疾病發生過程中起着重要的作用。然而,隨着測序技術和生物信息分析工具的進步,近年來學界逐步認識到在熟知的經典小RNA之外還存在大量其它類型的新型sncRNA,例如近年來發現的tRNA-derived small RNA(tsRNA)、rRNA-derived small RNA(rsRNA)等。這些小RNA具有比經典小RNA更古老的進化起源,而且它們的生成(biogenesis)可以被多種RNA酶(RNase)和RNA修飾調控,另外它們在細胞的生理功能以及疾病發生中也發揮着重要的作用。目前對這些新型sncRNA及其RNA修飾的研究正在逐步打開探索非編碼小RNA宇宙的新紀元。
2022年4月12日, 加州大學河濱分校Junchao Shi、Qi Chen和內華達大學雷諾醫學院Tong Zhou在Nature Cell Biology上以封面故事(圖1)發表題為Exploring the expanding universe of small RNAs的前沿綜述(Perspective)。文章介紹了近年來興起的對經典小RNA以外的新型小RNA(例如tsRNA, rsRNA, ysRNA)的研究以及這些小RNA與siRNA/miRNA/piRNA在生成和作用機制上的差異;重點討論了近年來新的測序方法帶來的對小RNA類型在組織細胞中組成結構的重新認識,以及對小RNA測序數據進行生物信息分析時的盲區/誤區。由於tsRNA/rsRNA等新型小RNA攜帶有大量RNA 修飾,文章着重討論了基於新型質譜技術或納米孔技術對小RNA修飾進行系統定量/定位的方法以及面臨的挑戰,並指出針對這些小RNA修飾的研究是未來小RNA領域的一個新方向。
圖1:Nat Cell Biol 2022年4月候選封面:探索不斷擴展的小RNA宇宙
非經典小RNA在生成和作用機理上的主要特點
由於tsRNA, rsRNA, ysRNA等非經典小RNA的產生主要來自於細胞內其他含有高級結構的較長RNA(例如tRNA, rRNA)的斷裂和代謝,因此很長時間以來這些小RNA被認為僅僅是其RNA前體的降解產物而沒有受到太多重視。然而近年來越來越多的研究發現,這些小RNA呈現明顯的組織細胞特異性,其生成和表達受到細胞環境和遺傳因素的精密調控,在許多生物過程中發揮重要作用(例如細胞應激反應、癌細胞轉移、幹細胞分化、病毒複製、細胞間交流以及早期胚胎表觀遺傳調控等),並且還可以作為臨床上無創診斷的分子標記物。
從演化的尺度上看,tsRNA, rsRNA等非經典小RNA在生物界廣泛存在,橫跨細菌、古細菌以及真核生物。與siRNA/miRNA/piRNA相比,tsRNA/rsRNA在進化起源、細胞內豐度、生物發生和發揮功能的方式等方面具有一系列特徵,這些特點也更新了我們對於sncRNA的傳統認識。例如,tsRNA, rsRNA 在不含有siRNA、miRNA 和 piRNA的單細胞生物(比如細菌、古細菌和一些單細胞原生動物)中呈現出動態表達模式且能夠發揮功能。這表明tsRNA、rsRNA在進化上出現的時間早於siRNA、miRNA 和 piRNA。這些現象也支持了一種觀點,即最古老最原始的小RNA生成途徑是:通過降解/斷裂/切割較長的 RNA(例如,tRNA、rRNA、snRNA、snoRNA, yRNA和vtRNA)生成小RNA。
此外,tsRNA、rsRNA 等非經典 sncRNA的生物發生涉及其前體RNA(tRNA、rRNAs)通過不同種類的RNase酶家族成員切割產生(例如,RNase P、RNase Z、RNase T2, RNase A),這些保守的RNase酶在進化上出現得比負責siRNA/miRNA生成的Dicer酶(僅存在於真核生物中)更早,並且tsRNA/rsRNA的生成受到多種RNA修飾以及相關修飾酶的調控。
在行使功能方面,siRNA/miRNA/piRNA主要是通過與Argonaute(AGO)家族蛋白結合對目標序列實現RNAi效應(例如,參與轉錄後mRNA切割、降解、翻譯抑制,或轉錄沉默);而tsRNA/rsRNA等非經典sncRNA可以獨立於AGO蛋白家族成員行使功能。針對這方面的研究尚處於起步階段,也有待未來進一步探索。
此外,為了今後對非經典小RNA命名統一,文章提出了一套標準命名規則如下:
新的測序方法—重新認識組織細胞小RNA全景圖
儘管對各種新型非經典小RNA功能和機理的認識還處於起步階段,近年來的針對非經典小RNA的系統發掘和測序技術已經取得一系列重要進展。研究認識到,許多tsRNA/rsRNA具有與siRNA/miRNA/piRNA不同的末端和內部修飾,這也導致了針對經典小RNA的傳統測序方法無法對非經典小RNA進行有效地發掘(這也是過去對於tsRNA/rsRNA等小RNA關注不足的原因之一)。近年來隨着學界認識到這個問題的嚴重性,對RNA修飾特性的研究催生了一系列新方法來克服這些RNA修飾帶來的測序問題,這些最新的測序方法也促使學界對小RNA在組織細胞中的表達圖譜有了全面的重新認識。
例如,PANDORA-seq, CPA-seq等技術通過一系列酶學處理,解決了由於RNA末端修飾導致的接頭連接問題,以及RNA特定甲基化修飾妨礙逆轉錄過程的問題。和傳統小RNA測序結果相比,PANDORA-seq等方法的測序結果揭示了完全不同的小RNA全景圖(landscape)。例如,大多數哺乳動物組織細胞中,miRNA的占比要遠低於tsRNA 和rsRNA的占比,並且在一些組織細胞(例如脾臟,胚胎幹細胞,Hela細胞,成熟精子)中tsRNA/rsRNA的含量占絕對多數。
文章審視了小RNA的發掘史,認為這是一個類似「盲人摸象」的故事。隨着技術和認知的發展,可能還會有更多種類的小RNA被發掘。今後小RNA測序的改進方向包括進一步優化接頭連接效率以及逆轉錄過程,減少建庫擴增產生的偏差,以及在新技術的背景下實現微量/單細胞水平的小RNA建庫測序等。
小RNA數據分析及解讀中的誤區和解決方案
過去小RNA的生物信息工具主要針對miRNA、piRNA等某一特定種類的小RNA進行分析。然而隨着測序技術的發展,研究發現同一樣本中往往同時存在不同種類小RNA(例如miRNA、tsRNA 和 rsRNA),這對於sncRNA的生物信息學分析提出了新的要求和挑戰(見BioArt報道:SPORTS1.0),特別是如何通過測序數據準確推斷生物樣本之間小RNA的變化情況。為了解決這一問題,研究者需要了解測序數據的產生過程/局限性以及特殊樣本對測序結果的影響。文章介紹了sncRNA測序數據分析中的主要注意事項,分析並討論了不同情況下出現問題的潛在解決方案。
首先,測序結果分析報告中對sncRNA表達量的描述不管是原始讀值(raw reads)還是標準化後的讀值(例如reads per million (RPM))往往表示對應序列在樣本中的相對富集水平,而非其在樣本中的絕對數量。因此,不同條件下測序結果中某個小RNA序列的讀值變化不一定反映出其真實表達水平的變化。舉例來說,如果一個細胞中同時表達 miRNA 和 tsRNA,通過測序發現在某種處理後miRNA的讀值相對於正常條件中的讀值下降,而tsRNA的相對讀值上升。這種測序結果的呈現不能簡單理解為miRNA表達的下調以及tsRNA的上調,而可能由以下多種情況導致。例如:1)miRNA表達不變,tsRNA表達上升。由於測序分析時將樣本總讀值進行了標準化,使得測序結果中miRNA的讀值降低而tsRNA的讀值升高;2)miRNA表達降低,tsRNA表達不變。同樣地,對讀值的標準化導致了最終測序分析結果中miRNA的讀值降低而tsRNA的讀值升高;3)miRNA表達降低,tsRNA表達上升(圖 2)。因此,如果只通過讀值本身的變化來評估小RNA表達的變化是不夠的,甚至會導致對測序結果的系統性誤讀,使得後續的實驗方向(例如選擇具體上調/下調的小RNA進行驗證研究)與預期目標南轅北轍。
圖2:sncRNA測序結果中基於RPM的小RNA變化模式可由細胞內部多種表達情況產生(miRNA, tsRNA的相對變化)
為了校準測序結果,其中一種策略是對選定的多個sncRNA進行 Northern blot分析,通過被探測的RNA條帶的亮度衡量其真實表達量。這一過程中針對不同條件的樣本,較優選擇是使用相等的總RNA量,而非使用某些看家(housekeeping)RNA作為內參,這是由於這些看家RNA的表達量在某些條件下也可能發生改變,從而影響判斷。
另一種矯正策略是通過在構建RNA測序文庫過程中添加外源spike-in RNA,從而建立定量標準曲線。然而添加spike-in RNA的基準選擇尤為重要:如果基於相等的RNA含量添加等量spike-in RNA時在某些情況下也會產生系統性的誤差。例如,在細胞數量相等的情況下,一些癌細胞中總RNA的含量是正常細胞的2-3倍。如果根據相同總RNA水平添加等量的spike-in RNA則會導致癌細胞中小RNA的表達水平被系統性地低估。因此,文章推薦基於相等細胞數量而非相等RNA量添加spike-in RNA。然而,對於含有大量細胞的組織進行細胞數目的精確定量並不現實。而在細胞數目很大的情況下,計數的微小偏差也會帶來小RNA定量的系統性誤差。因此未來的研究方向旨在降低測序測序所需細胞數量,理想情況下通過在單細胞中添加spike-in RNA,從而實現對小RNA的絕對定量。
對小RNA全修飾譜進行直接定量及定位:新方法與新挑戰
過去研究者往往更為關注小RNA本身的序列,而忽視了小RNA上的修飾信息。但越來越多的證據表明,RNA修飾信息是小RNA功能中不可或缺的一環,例如對調節RNA穩定性、RNA結構、RNA結合的潛力等具有着重要作用。這個問題對於tsRNA等來源於被高度修飾的前體RNA(tRNA擁有超過150種不同類型的RNA修飾)的非經典小RNA顯得尤為重要。然而,目前大多數小RNA的修飾仍然無法被檢測或被定位。這很大程度上是由於當前主流的RNA測序方法實際上是對RNA反轉錄獲得的cDNA進行測序(而不是RNA序列本身),因此大部分的RNA修飾信息在反轉錄過程中被丟失了。目前已有的特定位點的RNA修飾檢測方法往往針對的是長RNA上的修飾,可檢測的修飾種類(例如m5C、m6A、ψ、I、m1A,ac4C)也受到限制,且這些方法通常只能鑑定其中一種修飾類型。為了分析包含大量修飾的非經典小RNA的全修飾譜,領域迫切需要可以直接對RNA進行測序並同時對所有RNA修飾進行定位和定量的方法。針對這一問題,目前有兩類方法正在開發和發展中,一是基於新型質譜的測序技術,二是基於納米孔的測序技術(圖3)。
新型質譜技術:
液相色譜串聯質譜(LC-MS/MS)技術已被廣泛用於分析 RNA 修飾並被認為是對RNA修飾定性和定量的「金標準」。LC-MS/MS的傳統優勢是可以測量特定的RNA片段或單個核苷酸的分子量,從而推斷出RNA上的修飾種類。然而由於RNA在質譜檢測前往往需要被消化成更小的片段或單核苷酸,使得原始RNA修飾的位置信息被丟失。為了解決這一問題,研究人員提出一種可能的實驗方案,即通過處理將RNA逐核苷酸梯度降解成不同長度的RNA片段(形成mass ladder),再利用質譜差值獲得末位核苷酸及修飾信息(圖3)。這一方案與Sanger法DNA 測序策略類似。但這一方案的難點在於如何準確獲得一套完整的mass ladder。
2015 年,Jack Szostak實驗室發表了一篇具有里程碑意義的論文,開發了一種通用且高效的方法克服了這一挑戰。他們發現通過甲酸處理RNA可以可控地對RNA進行片段化並生成較為均勻的各個長度的RNA片段,形成了完整的mass ladder,從而實現了後續利用LC-MS/MS對RNA進行直接從頭測序的同時對各個位點的RNA修飾進行直接檢測的策略。一系列基於該項技術的後續改進也在進行中,最終目標是實現針對RNA序列和修飾的高通量直接測序。該項技術極大地方便了針對tRNA/tsRNA等被高度修飾的RNA的研究,為了解tRNA/tsRNA 的組織特異性及其在正常和疾病條件下的差異提供了重要的研究手段。
圖3:基於質譜技術對RNA序列從頭測序和RNA修飾的定量定位的技術原理
納米孔技術:
納米孔技術的開發來自於對天然膜離子通道結構的研究,其技術原理是通過記錄不同核酸分子穿過納米孔時形成的離子電流來判斷序列信息。自1996年首次將納米孔技術用於檢測和鑑定單鏈DNA和RNA序列之後,該技術迄今已經發展了30多年。納米孔技術不但為直接DNA/RNA測序帶來一場革命,也有望用於鑑定RNA上的修飾信息。目前,基於納米孔的直接測序技術已經實現了對m6A、ψ,2'-O-methylation等修飾信息的測序,並基於機器學習對修飾信息進行了定位。然而,目前對於同時檢測多個RNA修飾以及被高度修飾的RNA仍然非常困難。
使用納米孔技術同時準確定位多個RNA修飾的一大難點在於:一個特定的RNA修飾不但會改變修飾位點的離子電流,而且會影響附近位點的電流(這是由納米孔蛋白的物理和化學性質決定的)(圖 4)。尤其對於tRNA/tsRNA等被高度修飾的RNA而言,不同RNA修飾的影響可產生不計其數的重疊效應,為準確判定修飾位置帶來很大的困難。理論上可以通過合成各種不同的帶有已知修飾的RNA獲得數據建立機器學習模型解決該問題。然而由於目前許多RNA修飾還不能進行有效的實驗室合成使得這一方向困難重重,仍然需要大量的技術投入。
提高納米孔測序準確性的另一個方向是改進(例如位點特異性突變)現有的納米孔道蛋白,採用新的孔道蛋白或者使用其它不基於蛋白的新型納米材料孔道,最終找到能夠更準確靈敏檢測特定RNA及其 修飾的孔道材料。
圖4:基於納米孔技術對一條RNA上多種RNA修飾進行定位的主要問題以及今後的改進方向
總結與展望
除了系統捕獲具有所有小RNA及其RNA修飾以外,小RNA在亞細胞水平的空間組學仍方興未艾。相對於mRNA/lncRNA的空間轉錄組研究,小RNA的空間組學研究難度更大。這主要是因為小RNA的序列較短,不容易獲得特異的原位雜交信號;另外小RNA上的密集修飾也可能影響探針雜交效率。這些均為今後亟待解決的問題。
另一個更為深層和長期的問題是如何研究小RNA的功能和工作機理。文章使用「RNA代碼」來描述小RNA其所包含的複雜信息,其中包括但不限於它們的序列信息及位點特異性RNA修飾信息;它們與靶RNA、DNA及蛋白結合的能力,以及小RNA在細胞內和細胞間的社會行為(如競爭和協同對共同目標的影響)。如何結合細胞生理學特性系統地解碼這些RNA信息在當下仍然極具挑戰性,同時這也說明小RNA的研究代表了一個無盡的前沿方向,值得新一代研究人員(和機器)運用其智慧進行不斷探索。
原文鏈接:
https://doi.org/10.1038/s41556-022-00880-5
轉自:BioArt
為了方便大家交流學習,共同進步,我特地創建了微信交流群
後台留言「生信交流群」入群
往期內容(點擊圖片獲取相關信息)


