設計熒光分子需要考慮多種相互關聯的分子特性,而不是與分子結構直接相關的特性,例如分子的光吸收。
在這項研究中,RIKEN 高級智能項目研究中心和東京大學等機構的研究人員合作,使用從頭分子生成器(DNMG)與量子化學計算(QC)相結合來開發熒光分子,這些分子在各個學科中都引起了廣泛關注。使用大規模並行計算(1024 核,5 天),DNMG 產生了 3643 個候選分子。
研究人員選擇了一個未報道的分子和七個報道的分子併合成了它們。光致發光光譜測量表明,DNMG 可以以 75% 的準確度(n = 6/8)成功設計熒光分子,並產生一種未報告的分子,該分子發出肉眼可檢測到的熒光。
該研究以「De novo creation of a naked eye–detectable fluorescent molecule based on quantum chemical computation and machine learning」為題,於 2022 年 3 月 9 日發布在《Science Advances》。
熒光化合物作為可見光發射體在多個學科的應用中非常重要,包括有機發光二極管、傳感器和生物成像。儘管已經為這些和其他應用開發了許多熒光分子,但不斷需要新的分子來解決當前材料在功能、可持續性和低成本方面的缺點。即使是化學結構的細微變化也可能導致重大改進。
熒光是一種受量子力學支配的光化學性質。然而,儘管熒光研究的歷史悠久,但沒有明確的指導方針來製造熒光分子,就像製造吸光分子一樣。
分子熒光發射的簡化物理化學機制如下圖所示。最初,研究人員認為分子處於單線態(S0)狀態;在 S0 最小值時,它吸收光並轉變為單線態第一激發態(S1)。S1 激發分子在 S1 狀態下弛豫到最小值並回到 S0 狀態,將 S1 和 S0 狀態之間的能量差作為光(熒光)發射。激發的分子應該在 S1 狀態下移動到最小值,以便在不失活的情況下發光。
一些因素,包括與氧分子的反應、分子碰撞、分子內/分子間電子轉移和聚集,可能會在分子在激發狀態下運動時使其失活;這導致很難將熒光與分子結構相關聯。因此,自動化熒光分子設計將是有幫助的。
圖示:熒光分子的單線態基(S0)態和單線態第一激發(S1)態的 PES 示意圖。(來源:論文)
近期,基於機器學習(ML)的從頭分子生成器(DNMG)已被開發用於設計具有簡單和可預測值的分子,例如分配係數(logP)的對數,可以從分子的組成部分估計。
將 DNMG 與經典模擬相結合,成功地生成了具有改進的多功能性和實用性的分子。例如,DNMG 和對接模擬的結合可用於設計生物活性分子;這是通過有機合成研究的。結合分子動力學或預測模型,DNMG 還可以指導功能聚合物的合成。
在之前的研究中,研究人員將量子化學計算(QC)與 DNMG(稱為 ChemTS)相結合,它(原則上)可以從頭設計以量子力學(QM)特性為特徵的功能分子。因此,ChemTS 與 QC 相結合被應用於設計可以吸收具有所需波長的光的分子。在 86 個設計和生成的分子中,選擇了 6 個未包含在訓練數據集中的已知分子進行紫外-可見 (UV-vis) 吸收測量。結果與發生器的目標波長一致。
此外,DNMG 增加了發現新分子的可能性,因為與傳統的高通量 QM 和使用 ML 模型篩選相比,DNMG 的搜索區域在數據集中不受限制。研究人員還使用 QC 對 ChemTS 產生的分子進行了官能團富集分析,以最大化電子增益能量,並發現了駐極體文獻中未包含的重要官能團。
圖示:在 B3LYP/3-21G* 水平上,生成分子的 S1 狀態吸收和熒光的 OS 分布曲線。(來源:論文)
雖然相對簡單的特性,如光吸收和電子增益能量,可以直接與分子結構相關,但複雜的現象,如僅由特定分子表現出的熒光,難度要大得多。
在熒光的情況下,有必要考慮多種性質,這些性質錯綜複雜地交織在一起。這使得很難為分子結構的設計建立直觀的指導方針。為了設計實用的化合物,控制目標分子特性的複雜機制必須適當地數字化以用於 DNMG。此外,必須考慮計算成本隨着探索化學空間的機制複雜性的增加而增加。
圖示:使用 ChemTS 設計的未報告的熒光分子。(來源:論文)
在這項研究中,該團隊設計了具有大規模並行化 ChemTS 版本的熒光分子。該程序包使用 QC 將熒光機制的最低要求數字化。有幾個基於電子結構理論的用戶友好軟件包可用於分子和材料的 QC。
為了平衡可靠性與計算成本,研究人員使用密度泛函理論 (DFT) (29) 來評估勢能面 (PES)。為了解決廣泛探索化學空間的計算成本,用基於虛擬損失的概念對 ChemTS 進行大規模並行化;使用 1024 個核,生成了 3643 個分子。
為了驗證,他們合成了一種未報告的化合物和幾種已報告的化合物。六種化合物,包括一種未報道的化合物,如預期的那樣發出熒光。未報道的分子可通過市售試劑之間的偶聯合成,具有意想不到的特性,儘管它由常見的片段[香豆素、吡啶和吡唑並嘧啶]組成。這表明大規模並行 DNMG 有可能引發分子設計的範式轉變。
幾十年來,QC 在化學和材料科學中發揮了重要作用。在此期間,計算機輔助分子設計已被用於藥物發現。然而,QC 只專注於對實驗結果的分析和推測;很少考慮諸如預測各種現象和設計材料之類的創造性工作。
ML 算法最近在化學和材料科學中的應用,代表了計算機輔助化學和材料科學的一個積極轉折點。為了自動設計對有機電子有用的分子,將 QC 與 DNMG 相結合至關重要,因為在此類應用中,量子力學不容忽視。然而,基於 QC 的 DNMG 的價值必須先得到證明,然後才能在實踐中採用。
在這項研究中,研究人員使用 DNMG 來創建具有目前無法輕易預測的特性的分子:熒光。他們使用 DFT 設計了熒光化合物,這是一種固有的量子力學方法。儘管眾所周知,分子受量子力學規則的支配,但僅憑 QC 很難從頭創建一個新分子。儘管熒光分子具有簡單的 PES,但它們很難從第一原理設計,因為它們的多樣性使得熒光與分子結構的關聯變得非常困難。
然而,生成器處理了這種多樣性,並成功地從頭開始設計了熒光分子。基於 QC 的大量從頭計算需要大量並行計算(1024 核,5 天);儘管如此,生成器還是成功地產生了 3643 個候選分子。發生器產生吸收長波長光的分子,以類似於專業人士的方式控制分子的共軛長度;然而,它無法找到分子的熒光波長/強度與共軛長度/芳環數之間的明確相關性。這表明從頭設計熒光分子的困難。
研究人員根據可合成性和可見熒光標準,選擇了七種已知化合物進行驗證和一種候選化合物進行進一步研究。實驗驗證表明,DNMG 成功設計了 75%(八分之六)的熒光化合物。PC 的熒光(肉眼可見)證明了 DNMG 的創新潛力。
在設計 PC 時,生成器在香豆素中引入了一個不熟悉的基團吡唑並嘧啶;這種連接引起了高空間排斥,但仍導致 OS 增加。
普通化學家很難想出一種通過增加片段之間的空間排斥來增強熒光及其強度的方法。這說明生成器是一種可以超越專業知識或直覺的工具。DNMG 有可能引發分子設計的範式轉變。
雖然這項工作中合成的分子的熒光旨在通過肉眼檢測,但通過消除對原子類型的限制並延長設計時間,將產生更多有趣的分子。
此外,通過包括分子的光誘導動力學,可以實現更好的分子設計。通過進一步開發 QC,可以設計出更複雜的功能分子。
因此,具有大規模並行計算的生成器將能夠創建具有多樣化和有趣功能的複雜分子,可能導致非常複雜的合成路線,這將增加最近開發的基於 ML 的規劃逆合成路線的要求。
https://github.com/tsudalab/GaussianRunPack
https://github.com/tsudalab/FL_ChemTS
論文鏈接:https://www.science.org/doi/10.1126/sciadv.abj3906