新冠病毒致病機理兩開花,
計算生物學潛力凸顯
▲龔海鵬教授在微軟亞洲研究院做研究分享
大體系、全原子是指構建擁有百萬級原子的完整 S 蛋白,而不是只對10萬個或1萬個點進行抽象模擬,從而提升模擬精度。
長時間是指研究員們通過數十億步的計算,每步代表1飛秒(1秒的一千萬億分之一),模擬運行了20微秒。不能小看這個數字,20微秒相當於2*1011步,在分子動力學模擬中這屬於相當長的時間,以此可以更真實地模擬 NTD 和 RBD 之間的相對運動。

AI為生命科學研究開闢新方向,
開拓新產業
正如張林琦教授所言,AI、大數據等創新手段與生命科學的深度融合正在為生命科學研究開闢新的方向,甚至改變生命科學的研究範式。生命科學研究發展至今,經歷了不同的階段,從20世紀前的描述觀察,到20世紀的實驗分析,在科學家們的努力下,生命的密碼正在逐漸被破解。但這些傳統生物學研究方式依賴於不斷地試錯和積累,不僅耗資巨大,周期往往也很長。同時,基因組學等底層數據採集技術的發展以及藥物試驗中持續產生的數據等等,也讓生物數據呈現爆發式增長。雖然這為個性化的靶向藥物研發、精準醫療提供了可能,但海量數據也註定了單靠人力完成數據的整理、分析和挖掘已是不可能完成的任務。
如今,隨着算力的提升、機器學習等模型的精進,大數據使得計算生物學的研究條件越來越完善,在基礎科學研究中扮演着越來越重要的角色。對於 AI 與生命科學的結合,龔海鵬教授說道,「我們能不能從濕實驗得到的數據中發現規律?人的邏輯思維可以有一個大致的判斷,但還不夠細緻,AI 在這方面就能體現出它的優勢。」對此張林琦教授也表示認同,他認為生命科學不能只靠感覺,而是要朝定量化和精準化的方向發展,「濕實驗看到的結果往往是靜態的,但所有的生命過程都是動態的,分子結構變化更是瞬時反應,在自然條件下一閃而過,人的肉眼連看到的機會都沒有。在模擬分子動態變化以及定量評判方面,一些新的算法和技術能發揮非常大的作用,」張林琦教授說。
▲張林琦教授(左),劉鐵岩博士(右)
除了促進病毒、致病機理等基礎科學研究的發展,計算機科學與生命科學的結合也可能會創造一個全新的生物醫藥產業。早在2018年,埃森哲(Accenture)就曾在一份統計報告中指出,「到2026年,大數據與醫學和製藥領域的機器學習相結合將產生每年1500億美元的驚人價值」。
傳統的新藥研發極具風險和難度,周期長、費用高,過去十年藥物開發項目從1期臨床到獲得 FDA 批准上市的成功率僅為7.9%。對此張林琦教授深有感觸,不久前由他領銜研發的新冠「特效藥」——單克隆中和抗體安巴韋單抗/羅米司韋單抗聯合療法獲得中國藥品監督管理局(NMPA)的上市批准,有助於治療新型冠狀病毒陽性患者。他說,「AI 在新藥研發整個過程中的每個節點都可以發揮巨大的作用,比如為抗體的篩選、評估、預測、優化等提供支持,縮短研發時間,降低研發成本。另外,如果能在大數據分析的基礎上利用 AI 技術總結規律、進行預測,在病毒突變之前,設計出專門針對突變的抗體,那麼我們就能先下手為強,化被動為主動。」未來,從原始研究到臨床試驗,在生命科學產業的全鏈條上,通過跨界研究把干實驗和濕實驗無縫銜接,形成真實世界和理論數據的閉環,將為生命科學帶來更廣闊的發展前景。
跨領域、交叉學科協同合作,
打破次元壁的秘籍
儘管計算機科學與生命科學的跨界合作大有可為,但協作過程還需要更多的磨合。兩個領域的科學家所面對的是兩類不同的知識結構、語言體系,如何打破行業壁壘、共建合作生態是關鍵。微軟亞洲研究院與清華大學通過上述兩項合作研究,為跨學科交叉實踐積累了一定的經驗。
那麼不同背景的科學家協同合作的秘籍是什麼?
首先,明己之長,知己所短,優勢互補。張林琦教授長期專注於艾滋病等人類重大病毒性傳染病的致病機理、抗病毒藥物、抗體和疫苗的研究;王新泉教授的主要研究方向是結構生物學;龔海鵬教授則致力於把分子動力學模擬等新方法用於分析生物大分子的大尺度構象變化。他們及團隊在各自的領域都有着深厚的積澱和世界級的影響力。這些專家對生命科學專業、前沿的洞察為算法提供了實現基礎,可以幫助算法專家理解數據背後的科學意義。而微軟本身是以計算機技術為核心能力的平台公司,在人工智能、雲計算等領域能為其他學科提供強有力且最先進的計算機科學加持。
「微軟亞洲研究院在生物學、材料科學、物理和化學方面並不是專家,所以我們需要與真正的領域專家共同努力、密切合作。在這個過程中,雙方會互相影響,相互改變。AI 科學家可以提供基於數據的端到端解決問題的思路,提供比傳統科學計算更加高效的解決方案;自然科學領域的學者則可以提供獨到的領域知識,讓這些計算能力以一種符合科學規律的方式用到刀刃上,」微軟亞洲研究院副院長劉鐵岩表示。
其次,跨領域合作需要提出最具有前瞻性、挑戰性的科學問題。只有前沿課題才能發揮雙方實力,激勵科研人員克服困難,合理調配資源。劉鐵岩表示,「雖然人們認為 AI 能夠在任何領域發揮作用,但如何找到關鍵的科學問題才是關鍵所在,這需要領域專家與 AI 專家坐下來細緻地討論,不斷淬鍊出真正重要的問題。」合作伊始,微軟亞洲研究院的研究員們與清華大學的師生團隊也遇到了預期不匹配、溝通鴻溝等問題。通過隨後定期的會議與學術討論,雙方逐漸明確了彼此的優勢所在,找到了「最難啃的骨頭」。當實驗結果出現差異時,大家會從不同角度共同分析問題產生的原因,不斷磨合,增強了彼此的信任。
最後,是要有耐心與恆心。生命科學研究是一個漫長而枯燥的過程,很多基礎研究短時間內都無法帶來直接的收益。對此龔海鵬教授認為「做科研需要踏踏實實。解決生物學的實際問題,要以推動科學發展為目標,而不是以發論文為目標。微軟亞洲研究院在提供強大的計算資源、AI 算法的同時,在合作研究中也極具耐心,這是跨領域合作的基礎。」
在雙方的合作中,大家也加深了對彼此所在行業和機構的理解。在合作之前清華大學的老師們還有些疑慮,「在我們眼中,企業的研究部門更多的是以短期業績為導向的。但合作之後我們發現微軟亞洲研究院是一個真正的學術機構,尤其是『頂天立地』的價值取向和學術定位與清華大學的理念非常吻合。也只有這樣才能開展更具學術性的研究合作,」王新泉教授說。
▲王新泉教授在微軟亞洲研究院做研究分享
無論是用深度學習優化大氣污染排放量、把 Graphormer 用於催化劑設計、神經網絡用於新物理發現,還是近期 AI 領域頂會 NeurIPS 上火熱的科學相關主題演講,都昭示着 AI for Science 已經成為一種趨勢。計算機科學、人工智能與生命科學、生物醫藥、量子科學、天文學等一系列基礎科學研究交織碰撞,將為科學發展注入新的強勁動力。而在這一浪潮中,微軟亞洲研究院也將繼續與科學界合作,取得更加亮眼的成績。
推薦閱讀
