一
論文題目:
Protein sequence design with a learned potential論文摘要:
蛋白質序列設計的任務是幾乎所有蛋白質工程問題的核心,在開發指導設計的能量函數方面已經付出了巨大的努力。在這裡,作者研究了一個深度神經網絡模型的能力,它可以自動設計蛋白質骨架上的序列,它直接從晶體結構數據中學習,沒有任何人類指定的先驗。該模型可推廣到訓練期間未見的拓撲結構,產生實驗上穩定的設計。作者評估了該方法對一個新的TIM-barrel的可推廣性。該模型產生了新的序列,兩種設計的高分辨率晶體結構顯示出與硅模型的一致性。研究結果證明了一個完全學習的蛋白質序列設計方法的可操作性。
論文鏈接:
https://www.nature.com/articles/s41467-022-28313-9Github鏈接:
https://github.com/ProteinDesignLab/protein_seq_des
二
論文題目:
Combinatorial optimization of mRNA structure, stability, and translation for RNA-based therapeutics論文摘要:
在包括 COVID-19 在內的多種人類疾病正在開發治療性 mRNA 和疫苗。然而,它們的優化受到 mRNA 不穩定性和低效蛋白質表達的阻礙。作者描述了克服這些障礙的設計原則。我們開發了一個基於 RNA 測序的平台,稱為 PERSIST-seq,以系統地描述細胞內 mRNA 穩定性、核糖體負載以及不同 mRNA 文庫的溶液內穩定性。令人驚訝的是,與高核糖體負載相比,細胞內穩定性是蛋白質輸出的更大驅動力。作者進一步介紹了一種稱為 In-line-seq 的方法,適用於數千種不同的 RNA,它揭示了減輕水解降解的基於序列和結構的規則。研究結果表明,可以設計高度結構化的「超級文件夾」mRNA,通過假尿苷核苷修飾進一步增強穩定性和表達。研究證明了作者的工作是的 mRNA 穩定性和蛋白質表達的同時改善,並提供了計算實驗平台。
論文地址:
https://www.nature.com/articles/s41467-022-28776-w代碼地址:
https://github.com/DasLab/openvaccine-CE-analysis
三
論文題目
CR-I-TASSER: assemble protein structures from cryo-EM density maps using deep convolutional neural networks
摘要
低溫電子顯微鏡 (cryo-EM) 已成為蛋白質結構測定的主要方法,但使用低溫電子顯微鏡密度圖準確模擬原子結構仍然具有挑戰性。作者提出了一種混合方法,CR-I-TASSER(低溫電磁迭代線程裝配細化),它將深度神經網絡學習與 I-TASSER 裝配模擬相結合,用於自動低溫電磁結構確定。該方法以具有模擬和實驗密度圖的 778 種蛋白質為基準,其中 CR-I-TASSER 為 643 個目標構建了具有正確摺疊(模板建模 (TM) 得分 > 0.5)的模型,比其他一些目標中的最佳模型高 64%高分辨率數據樣本的從頭和基於細化的方法。詳細數據分析表明,CR-I-TASSER 的主要優勢在於基於深度學習的 Cα 位置預測,可顯着提高線程模板質量,從而通過優化的片段組裝模擬提高最終模型的準確性。這些結果證明了一種新的途徑來確定冷凍電鏡蛋白質結構,具有高精度和魯棒性,涵蓋各種目標類型和密度圖分辨率。
論文地址
https://www.nature.com/articles/s41592-021-01389-9代碼地址
https://zhanggroup.org/CR-I-TASSER/download.html
四
論文題目:
Masked graph modeling for molecule generation論文摘要:
從頭開始,高通量分子設計是一個具有挑戰性的問題,應用於藥物發現和材料設計。作者引入了一個掩蔽圖模型,該模型通過捕捉觀察到的節點(原子)和邊(鍵)上的條件分布來學習圖上的分布。作者通過迭代掩蔽和替換初始化的圖的不同部分來訓練模型,然後對模型進行採樣。作者使用GuacaMol分布學習基準來評估我們在QM9和ChEMBL數據集上的方法。作者發現有效性、KL-divergence和Fréchet ChemNet Distance分數與新穎性是反相關的,並且可以在這些指標之間進行比現有模型更有效的權衡。在分布度量上,模型優於先前提出的基於圖的方法,並與基於smiles的方法具有競爭力。最後,作者展示了模型在保持與訓練分布的物理化學相似性的情況下,生成具有特定屬性的期望值的分子。
論文鏈接:
https://www.nature.com/articles/s41467-021-23415-2github鏈接:
https://github.com/nyu-dl/dl4chem-mgm