close

在對宇宙可能性的模擬中,研究人員發現神經網絡僅僅學習一個星系,就能推斷出整個宇宙物質的組成成分。圖片來源:Kaze Wong / CAMELS collaboration

本來只是給本科生正常布置了作業,天文學家卻從作業成果中發現了未曾設想的關聯。或許,這個宇宙真的是「一花一世界,一葉一菩提」,機器學習可以「一葉知秋」,從單個星系推測出整個宇宙的性質,比如宇宙的物質密度幾何。天文學家試圖在其中尋找解釋,但又不得不懷疑,機器學習是否在「偷懶」,只是找到了隱藏在模擬代碼背後的捷徑?天文學家正在尋找着答案。

撰文|Charlie Wood

翻譯|王昱

為了弄清楚宇宙的組成成分,宇宙學家通常會擴大觀測範圍,儘可能看到整個宇宙。但一組研究人員發現了一種機器學習算法,可以通過單個模擬星系的狀態預言整個數字宇宙的性質。這有點類似於在顯微鏡下隨便研究一粒沙子,就能計算出整個歐亞大陸的情況。這一機制似乎已經找到了這種不可思議的範式,或許有一天,天文學家可以只通過研究宇宙的基本組成成分,就能得出關於整個宇宙的全面結論。

「這是一個完全不同的想法,」紐約Flatiron Institute的天體物理學家弗朗西斯科·維拉斯庫薩-納瓦羅(Francisco Villaescusa-Navarro)說到,他是此項研究的第一作者。「相較於測量數百萬個星系,你其實只需要測量一個。這是這項工作最令人吃驚的地方。」

本科作業

事情本不該是這樣的。這個不太可能的發現源於維拉斯庫薩-納瓦羅給普林斯頓大學(Princeton University)本科生朱庇特·丁(Jupiter Ding)的一個練習:建立一個神經網絡,在知道星系屬性的情況下,可以估計幾個宇宙學屬性。這項作業本來只是想讓丁熟悉機器學習,然後他們注意到計算機正在測量物質的總密度。

「我一開始以為是學生搞錯了,」維拉斯庫薩-納瓦羅說,「實話說,這對我而言有些難以置信。」

隨後的調查結果在1月6日以預印本的形式公開。研究人員分析了2000個由宇宙學和天體物理學機器學習模擬項目(CAMELS)生成的數字宇宙。這些宇宙擁有不同的物質組成,其中物質占整個宇宙的比例從10%到50%不等,其餘部分則是讓宇宙膨脹越來越快的暗能量。(我們的宇宙大約由1/3的物質和2/3的暗能量組成。)模擬開始運行後,暗物質和普通物質糾纏在一起形成星系。模擬也包含超新星和超大質量黑洞噴流等這些複雜的事件。

丁的神經網絡項目研究在如此多彩的宇宙環境中研究了100萬個模擬星系。這個神經網絡從中知道了每個星系的大小、組成成分、質量和十餘個其他特徵,它試圖將這些數字與整個宇宙的物質密度聯繫起來。

它成功了。當這個模型檢測它從未見過的星系時,神經網絡能推斷出它所屬宇宙中的物質密度,誤差不到10%。「這與你選取哪個星系是無關的,」維拉斯庫薩-納瓦羅說,「所有人都認為這不可能。」

這個算法的表現讓馬克思·普朗克天體物理研究所的星系模擬演化專家沃爾克·斯普林格爾(Volker Springel)感到震驚,因為星系本身是非常混亂的天體。有的只是自己默默成長,有的則會不斷吞噬鄰近星系。大型星系通常能捕獲更多物質,而矮星系中的超新星和黑洞則可能噴射出很多物質。儘管如此,每個星系的細節似乎都和整個宇宙的密度息息相關。

它可靠嗎?

一種理解是「宇宙或星系比我們預想的要簡單得多,」西安大略大學的天文學家波琳·巴姆比(Pauline Barmby)說到。而另一種理解是這些模擬存在一些我們還沒注意到的瑕疵。

研究團隊花了半年時間想搞明白這個神經網絡為何如此智能。他們不斷檢查,想確保這個算法並沒有從模擬本身的代碼中找到規律。「神經網絡很強大,但也很懶惰。」維拉斯庫薩-納瓦羅說。

經過一系列的實驗後,研究人員開始漸漸理解這個算法是如何算出宇宙密度的了。通過反覆訓練神經網絡,系統性地模糊不同屬性,他們漸漸將注意力集中在幾個最重要的屬性上。

最重要的屬性是星系的旋轉速度,這和星系中心區域含有多少物質(不管是暗物質還是正常物質)密切相關。這一發現和斯普林格爾的物理直覺相符。在充滿暗物質的宇宙中,星系的成長、旋轉速度都會更快。所以將旋轉速度和宇宙整體的物質密度關聯起來也合乎情理,儘管這種關係太粗糙,我們並不能以此作出預測性的成果。

而神經網絡則找到了17個與宇宙物質密度相關的星系屬性,並且更精準、更複雜。不論是星系合併、恆星爆炸還是黑洞坍塌,都無法摧毀這種關係。「一旦屬性的數量超出2個,你就不能簡單畫個圖用肉眼去尋找趨勢了,但神經網絡可以。」新西蘭奧克蘭大學的宇宙學家肖恩·霍奇基斯(Shaun Hotchkiss)說到。

儘管這個算法的成功引出了一個問題——我們可以通過研究一個星系了解多少宇宙的屬性?但宇宙學家懷疑這種算法在真實世界裡會處處受限。當維拉斯庫薩-納瓦羅的團隊用其他屬性來檢測一些別的屬性時,常常一無所獲。斯普林格爾則將其解釋為諸如宇宙膨脹加速度之類的宇宙屬性,是和暗能量有關的,而暗能量在單個星系的尺度上影響很小。

研究確實佐證了這一點,理論上,對銀河系和鄰近幾個星系進行徹底的研究,可以極其精準的預言我們整個宇宙。維拉斯庫薩-納瓦羅表示,這樣的實驗可能為宇宙中其他重要的數字提供線索,比如宇宙中三種中微子的質量之和。

但在實踐中,這樣的技術還有一個關鍵的弱點需要克服。CAMELS合作組織用兩種不同的方法生成模擬宇宙。在一種方法下訓練的神經網絡在猜測另一種方法生成的宇宙密度時效果並不好。沒能通過交叉檢驗暗示着這種算法僅僅是從模擬宇宙生成算法本身中尋找捷徑。而對於由真實物理定律生成的銀河系,它肯定不知道從何下手。在這項技術推向真實世界之前,研究人員還需要讓他們的模擬更切合實際,嘗試更通用的機器學習技術——而這是一項艱巨的任務。

「我對這種可能性感到驚訝,但也大可不必太過震驚。」斯普林格爾說。

但維拉斯庫薩-納瓦羅則堅信神經網絡能找到兩種獨立模擬之間的關係。這樣的數字發現能增加我們通過「一葉知秋」方式了解整個宇宙的可能性。「這是一件非常美妙的是,」他補充道,「這建立了整個宇宙和單一一個星系之間的聯繫。」

原文鏈接:

https://www.quantamagazine.org/with-one-galaxy-ai-defines-a-whole-simulated-universe-20220120/

相關論文:

https://arxiv.org/abs/2201.02202


《環球科學》2月新刊銷售中

戳圖片或閱讀原文

立即購買

點擊【在看】,及時接收我們的內容更新
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()