close

來源:內容由半導體行業觀察(ID:icbank)編譯自makeuseof(MUO),謝謝。


2020年,蘋果做出了大膽的舉動;他們拋棄了英特爾,轉而使用他們專有的芯片來為他們的 MacBook 供電。儘管從 x86 設計語言轉向 ARM 架構引起了一些人的注意,但當由 Apple 硅驅動的 MacBook 提供了驚人的每瓦性能時,Apple 證明了所有人都錯了。

據多位專家稱,向 ARM 架構的轉變是提高性能/瓦特的一個重要原因。然而,新的統一內存架構在提升新一代 MacBook 的性能方面也發揮了至關重要的作用。

那麼,什麼是 Apple 的統一內存架構,它是如何工作的?好吧,讓我們來了解一下。

為什麼您的計算機需要內存?


在進入 Apple 的統一內存架構之前,必須首先了解為什麼需要像隨機存取內存 (RAM) 這樣的主存儲系統。

您會看到,傳統處理器在渦輪增壓期間以 4 GHz 的時鐘速度運行。在這個時鐘速度下,處理器可以在四分之一納秒內完成任務。但是,存儲驅動器(如 SSD 和 HDD)只能每 10 毫秒向 CPU 提供數據,即 1000 萬納秒。這意味着在 CPU 完成處理它正在處理的數據和接收下一批信息之間的時間裡,它處於空閒狀態。

這清楚地表明存儲驅動器無法跟上處理器的速度。計算機通過使用 RAM 等主存儲系統來解決這個問題。儘管該內存系統無法永久存儲數據,但與 SSD 相比,它的速度要快得多——它可以在短短 8.8 納秒內發送數據:比目前最快的 SSD 快得多。


這種較短的訪問時間使 CPU 能夠更快地接收數據,使其能夠不斷地處理信息,而不是等待 SSD 發送另一批數據進行處理。

由於這種設計架構,存儲驅動器中的程序被移動到 RAM 中,然後由 CPU 通過 CPU 寄存器訪問。因此,更快的主存儲系統可以提高計算機的性能,而這正是 Apple 正在使用其統一內存架構所做的事情。

了解傳統內存系統的工作原理


現在我們知道為什麼需要 RAM,我們需要了解 GPU 和 CPU 如何使用它。儘管 GPU 和 CPU 都是為數據處理而設計的,但 CPU 是為執行通用計算而設計的。相反,GPU 旨在在不同的內核上執行相同的任務。由於設計上的這種差異,GPU 在圖像處理和渲染方面的效率很高。

儘管 CPU 和 GPU 具有不同的架構,但它們都依賴於主存儲系統來獲取數據。在具有專用 GPU 的傳統系統上,有兩種類型的隨機存取存儲器。這是 VRAM 和系統 RAM。VRAM 也稱為 Video RAM,VRAM 負責將數據發送到 GPU,系統 RAM 將數據傳輸到 CPU。


但是為了更好地理解內存管理系統,讓我們看一個你玩遊戲的真實例子。

當您打開遊戲時,CPU 進入畫面,遊戲的程序數據被移動到系統 RAM。之後,CPU 處理數據並將其發送到 VRAM。然後 GPU 處理這些數據並將其發送回 RAM 供 CPU 在屏幕上顯示信息。在集成 GPU 系統的情況下,兩個計算設備共享相同的 RAM,但訪問內存中的不同空間。

這種傳統方法涉及大量數據移動,使系統效率低下。

為了解決這個問題,Apple 使用了統一內存架構。

Apple Silicon 上的統一內存架構如何工作?

在內存系統方面,Apple 做了幾件不同的事情。

在通用系統的情況下,RAM 使用主板上的插槽連接到 CPU。此連接限制了發送到 CPU 的數據量。

另一方面,Apple 芯片使用相同的基板來安裝 RAM 和 SoC。儘管在這種架構中 RAM 不是 SoC 的一部分,但 Apple 使用中介層基板 (Fabric) 將 RAM 連接到 SoC。中介層只不過是 SOC 和 RAM 之間的一層硅。

與依靠電線傳輸數據的傳統插座相比,內插器允許 RAM 使用硅通孔連接到芯片組。這意味着 Apple 硅驅動的 MacBook 將其 RAM 直接烘焙到封裝中,從而更快地在內存和處理器之間傳輸數據。RAM 在物理上也更靠近需要數據的位置(處理器),從而允許數據更快地到達需要的位置。

由於將 RAM 連接到芯片組的這種差異,它可以訪問高數據帶寬。

圖片來源:蘋果

除了上面提到的不同,蘋果還改變了 CPU 和 GPU 訪問內存系統的方式。

如前所述,GPU 和 CPU 在傳統設置中具有不同的內存池。相反,Apple 允許 GPU、CPU 和神經引擎訪問同一個內存池。因此,數據不需要從一個內存系統傳輸到另一個內存系統,進一步提高了系統的效率。

由於內存架構的所有這些差異,統一內存系統為 SoC 提供了高數據帶寬。事實上,M1 Ultra 提供了 800 GB/s 的帶寬。與提供 512 GB/s 帶寬的AMD Radeon RX 6800 和 6800XT等高性能 GPU 相比,此帶寬要高得多。

這種高帶寬使 CPU、GPU 和神經引擎能夠在納秒內訪問龐大的數據池。此外,Apple 在 M2 系列中使用主頻為 6400 MHz 的 LPDDR5 RAM 模塊以驚人的速度提供數據。

您需要多少統一內存?


現在我們對統一內存架構有了基本的了解,我們可以看看你需要多少。

儘管統一內存架構提供了一些優點,但它仍然存在一些缺陷。首先,RAM 連接到 SoC,因此用戶無法升級其系統上的 RAM。此外,CPU、GPU 和神經引擎訪問同一個內存池。因此,系統所需的內存量急劇增加。

因此,如果您是在網上衝浪並使用大量文字處理器的人,那麼 8 GB 的內存對您來說就足夠了。但是,如果您經常使用 Adobe Creative Cloud 程序,那麼獲得 16 GB 版本是一個更好的選擇,因為您將擁有更流暢的在機器上編輯照片、視頻和圖形的體驗。

如果您正在訓練許多深度學習模型或處理具有大量圖層和 4K 素材的視頻時間線,您還應該考慮配備 128 GB RAM 的 M1 Ultra。

統一內存架構是否都是好事?

Apple 芯片上的統一內存架構對計算機上的內存系統進行了多項更改。從改變 RAM 與計算單元的連接方式到重新定義內存架構,Apple 正在改變內存系統的設計方式,以提高其系統的效率。

也就是說,新架構在 CPU、GPU 和神經引擎之間創造了競爭條件,從而增加了系統所需的 RAM 量。


*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點讚同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

今天是《半導體行業觀察》為您分享的第3150內容,歡迎關注。

推薦閱讀

★「風口浪尖」的Chiplet,有人瘋狂湧入,有人劃清界限

★有望成為「最佳半導體」的材料

★汽車芯片巨頭的新競賽

半導體行業觀察


『半導體第一垂直媒體』

實時 專業 原創 深度

識別二維碼,回復下方關鍵詞,閱讀更多

晶圓|集成電路|設備|汽車芯片|存儲|台積電|AI|封裝

回復 投稿,看《如何成為「半導體行業觀察」的一員 》

回復 搜索,還能輕鬆找到其他你感興趣的文章!

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()