一
論文題目:
Molecular design in drug discovery: a comprehensive review of deep generative models
論文摘要:
這次給大家分享一篇綜述文章,作者首先回顧了深度生成模型,介紹了藥物發現新分子設計的最新進展;然後,作者根據硅片中的分子表示將這些模型分為兩類,並對這兩類經典的模型進行了詳細的報道,討論了它們的優點和缺點。作者還指出了目前用於新分子設計的深度生成模型的挑戰,從頭開始的分子設計是很有希望的,但也是一條漫長的道路,有待探索。
論文鏈接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab344/6355420?searchresult=1
二
論文題目:
DeepLncLoc: a deep learning framework for long non-coding RNA subcellular localization prediction based on subsequence embedding
論文摘要:
長鏈非編碼RNA (lncRNA)是一類含有200多個核苷酸的RNA分子。越來越多的證據表明,lncRNA的亞細胞定位可以為其生物學功能提供有價值的見解。現有的預測lncRNA亞細胞定位的計算方法使用k-mer特徵編碼lncRNA序列。然而,僅使用k-mer特徵會丟失序列順序信息。文章提出了一個深度學習框架DeepLncLoc來預測lncRNA亞細胞定位。在DeepLncLoc中,引入了一種新的子序列嵌入方法,它保留了lncRNA序列的順序信息。子序列嵌入方法首先將序列劃分為一些連續的子序列,然後提取每個子序列的模式,最後將這些模式進行組合,得到lncRNA序列的完整表示。然後,利用文本卷積神經網絡學習高級特徵並執行預測任務。與傳統機器學習模型、流行的表示方法和現有的預測器相比,DeepLncLoc取得了更好的性能,說明DeepLncLoc可以有效預測lncRNA亞細胞定位。文章不僅提出了一種新的預測lncRNA亞細胞定位的計算模型,而且提出了一種新的子序列嵌入方法,該方法有望應用於其他基於序列的預測任務。
論文鏈接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab360/6366323
Github鏈接:
https:// github.com/CSUBioGroup/DeepLncLoc
三
論文題目:
Hyperbolic relational graph convolution networks plus: a simple but highly efficient QSAR-modeling method
論文摘要:
定量結構-活性關係(QSAR)方法已被確立為不可或缺的工具,有助於快速、可靠地評估藥物中化合物的物理化學和生物特性。目前,主要有兩種類型的QSAR方法,基於描述符的方法和基於圖的方法。前者是基於預定的分子描述符開發的,而後者是基於簡單的原子和鍵信息開發的。在這項研究中,作者提出了一種簡單但高效的建模方法,將分子圖和分子描述符結合起來,作為圖神經網絡的輸入,稱為雙曲關係圖卷積網絡+(HRGCN+)。作者還探討了加入傳統分子描述符對基於圖的方法預測的影響,發現加入分子描述符確實可以提高基於圖的方法的預測能力。這些結果也突出了方法具有很強的抗噪能力。此外,該方法提供了一種在原子和描述符層面解釋模型的方法,這可以幫助藥物學家從複雜的數據集中提取隱藏信息。
論文鏈接:
https://academic.oup.com/bib/article/22/5/bbab112/6235968?searchresult=1
四
論文題目:
GCRFLDA: scoring lncRNA-disease associations using graph convolution matrix completion with conditional random field
論文摘要:
長鏈非編碼RNA(lncRNAS)在各種生物調控過程中發揮重要作用,與疾病的發生發展密切相關。識別lncRNAS與疾病的關聯對於揭示疾病的分子機制和探索治療策略具有重要價值。因此,有必要計算預測lncrna與疾病的相關性,作為生物學實驗的補充方法。文章提出了一種基於圖卷積矩陣補全的預測方法GCRFLDA。GCRFLDA首先使用可用的lncrna-疾病關聯信息構建了一個圖。然後,構建了一個由條件隨場和注意機制組成的編碼器來學習節點的高效嵌入,以及一個解碼器層來評價lncrna-疾病關聯。在GCRFLDA中,將高斯相互作用譜核相似度和餘弦相似度融合為lncRNA和疾病節點的側信息。在四個基準數據集上的實驗結果表明,GCRFLDA方法優於現有的其他方法。
論文鏈接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab361/6363052
Github鏈接:
https:// github.com/jademyC1221/GCRFLDA