一
論文題目:
A novel molecular representation with BiGRU neural networks for learning atom
論文摘要:
分子表徵在研究藥物設計和特性方面起着關鍵作用,有效的方法有利於協助計算和解決藥物發現中的相關問題。在這篇文章中,作者提出了一種名為Smi2Vec-BiGRU的新方法,該方法旨在學習原子並解決藥物發現領域的單任務和多任務二元分類問題,這些問題是該領域的基本問題也是關鍵問題。具體來說,是將SMILES格式的分子數據轉化為一組樣本向量,然後將其送入雙向門控遞歸單元神經網絡進行訓練,學習分子藥物的低維向量表示。作者在幾個廣泛使用的數據集上進行了廣泛的實驗,包括Tox21、SIDER和ClinTox。實驗結果表明,該方法可以在這些基準數據集上達到最先進的性能,證明了提出的方法的可行性和競爭力。
論文鏈接:
https://academic.oup.com/bib/article/21/6/2099/5618830?searchresult=1Github鏈接:
https://github.com/deepchem/deepchem
二
論文題目:
Heterogeneous graph attention network based on meta-paths for lncRNA–disease association prediction
論文摘要:
發現長鏈非編碼RNA與疾病的關聯是理解疾病病因和發病機制的基礎和關鍵部分。然而,由於耗費時間和昂貴的生物學實驗,只有少數的lncrna與疾病的關聯被確認。因此,一種高效的計算方法對於識別潛在的lncrna與疾病的關聯是非常重要和迫切需要的。基於圖的學習模型具有挖掘網絡中節點特徵和關係的能力,在生物分子關聯預測中得到了廣泛的應用。然而,這些方法在綜合融合節點特徵、異構拓撲結構和語義信息方面的能力還遠遠不夠,甚至不能令人滿意。此外,在lncrna與疾病之間的複雜關聯建模方面仍然存在局限性。文章開發了一種新的基於元路徑的異質圖注意網絡框架,用於預測lncrna與疾病的關聯,稱為HGATELDA。首先,將lncRNA與疾病特徵結構圖、lncRNA-疾病拓撲結構圖結合,構建異構網絡。然後,對於異質圖,利用圖注意網絡從這些同質和異質子圖的鄰居中學習節點嵌入。其次,利用自注意力機制,自適應地為基於元路徑的子圖分配權重,獲得更多的語義信息。此外,文章還結合神經誘導矩陣補全來重建lncrna與疾病的關聯,用於捕捉lncrna與疾病之間複雜的關聯。文章將代價敏感神經網絡引入損失函數,以解決lncrna與疾病關聯預測中常見的不平衡問題。
論文鏈接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab407/6377515
三
論文題目:
Prediction of RNA secondary structure including pseudoknots for long sequences
論文摘要:
偽結RNA結構元件參與了包括核糖體轉移在內的各種生物現象。由於構建包含偽結的可計算二級結構模型不可行,考慮偽結的二級結構預測方法尚未得到廣泛應用。作者開發的IPknot,它使用啟發式來加快計算速度,但仍難以應用於長序列,如信使RNA和病毒RNA,因為它需要立方的計算時間與序列長度,並有需要手動調整的閾值參數。文章提出了IPknot的改進,通過使用線性劃分模型,在線性時間內計算,並根據偽期望精度自動選擇最優閾值參數。通過詳盡的基準測試,IPknot在廣泛的條件下顯示了良好的預測準確性。
論文鏈接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab395/6380459
Github鏈接:
https://github.com/satoken/ipknot
四
論文題目:
Representation of molecules for drug response prediction
論文摘要:
在化學領域,機器學習已被廣泛用於輔助藥物篩選、藥物毒性預測、定量結構-活性關係預測、抗癌協同預測等。這篇綜述專門討論機器學習在藥物反應預測中的應用。討論重點集中在分子表徵,它是藥物反應預測和其他化學相關預測任務成功的關鍵因素。作者介紹了三種常用的分子表示方法,以及它們的實現和應用實例。這篇文章將作為對分子表徵這一廣泛領域的簡要介紹。
論文鏈接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab393/6375515?searchresult=1