早上好,今天分享一篇2021年6月發表在Bioengineered(IF=3.269)的文章(Ref: 34565282),作者研究的是與甲狀腺癌發病機制和預後密切相關的hub基因。該研究方法同樣適用於其他腫瘤的研究,有相關需求的老師歡迎聯繫我們!

背景&方法
背景:
甲狀腺癌(THCA)是累及內分泌系統的最常見癌症,也是頭頸部最常見的惡性腫瘤,約占全身惡性腫瘤的1%-2%。
方法:
1、識別THCA的差異基因(DEG);
2、通過WGCNA獲得THCA相關的關鍵模塊和關鍵基因(CEMG);
3、DEG和CEMG取交集得到候選hub基因;
4、對候選hub基因進行GO和KEGG通路富集分析;
5、使用關鍵基因構建PPI網絡,篩選hub基因;
6、hub基因的KM生存分析與臨床相關性分析;
7、預後相關hub基因蛋白質豐度的驗證。
結果
DEG的識別
從TCGA-THCA數據集中識別出1916個 DEG:910個被下調,1006個被上調(圖1a)。還從GSE153659數據集中識別了665個DEG:471個被下調,194個被上調(圖1b)。每個數據集中前50個DEG用熱圖可視化(圖1c,d)。

圖1
表達矩陣的WGCNA
選擇β=2和6分別作為最佳軟閾值參數(圖2g,h)。模塊特徵基因的層次聚類樹狀圖如圖2a,b)所示。我們從TCGA-THCA數據集(圖 2c)和GSE153659數據集(圖 2d)中分別確定了7 個和11個模塊。與臨床表型相關性最高的兩個模塊是TCGA-THCA中的MEred和MEturquoise以及GSE153659中的MEred和Mepink(圖2e,f)。

圖2
DEG和CEMG的交集
WGCNA在TCGA-THCA的MEred和MEturquoise模塊中識別出5459個CEMG,在GSE153659的MEred和MEpink模塊中識別出1602個CEMG。在DEG和CEMG之間共檢測到162個重疊基因(圖3)。

圖3
162個重疊基因的富集分析
對162個重疊基因進行了GO功能和KEGG富集分析。生物過程類別下豐富的GO術語(圖4a)主要是甲狀腺激素代謝過程、脂肪細胞分化、跨膜受體蛋白絲氨酸/蘇氨酸激酶信號通路的調節、內質網應激誘導的內在凋亡信號通路。在細胞成分類別下,豐富的術語主要與頂端質膜、內質網腔和含膠原的細胞外基質有關。在分子功能類別下,富集的術語主要與氧化還原酶活性、細胞外基質結構成分、GTP酶調節活性和肌動蛋白絲結合有關。KEGG通路分析(圖4b)發現酪氨酸代謝、甲狀腺激素合成和蛋白質消化吸收通路顯着富集。

圖4
識別PPI網絡中的hub基因
使用STRING數據庫構建了162個重疊候選hub基因的PPI網絡(圖5a)。Cytoscape中 cytoHubba插件的MCC算法用於識別hub基因(圖5b)。前10個hub基因為QSOX1、WFS1、EVA1A、FSTL3、CHRDL1、FABP4、PRDM16、PPARGC1A、PPARG和COL23A1。

圖5
預後相關hub基因的鑑定和蛋白質豐度的驗證
OS分析顯示,EVA1A低表達與THCA患者預後不良顯着相關(圖6a)。DFS分析顯示CHRDL1和FABP4的低表達與預後不良顯着相關(圖6b)。HPA結果表明,EVA1A和CHRDL1蛋白在腫瘤組織中的豐度低於正常組織(圖7a,b)。此外,臨床相關性分析表明CHRDL1、COL23A1、EVA1A、FABP4、FSTL3、PPARGC1A、PRDM16和QSOX1與THCA的臨床分期密切相關(圖8)。

與6

圖7

圖8
今天的分享就到這裡啦,對上述分析方法感興趣或者沒有研究思路的小夥伴,歡迎掃下方二維碼前來諮詢哦!先到先得,欲購從速!


中科生信
提供「一站式」科研服務