
來源:內容由半導體行業觀察(ID:icbank)編譯自nextplatform,謝謝。
在過去的十年裡,英偉達一直在將自己從一個組件供應商轉變為一個完整的平台供應商。這樣的舉動是沒有必要的,但這與流行的想法是一致的,因為摩爾定律正在放慢,因此我們需要為堆棧的每個部分進行共同設計和共同優化,以發揮系統的最大性能。沒有計算、網絡和存儲在一起的系統是不存在的——這是一種高度依賴的三位一體。因此,任何平台玩家都不可避免地最終想要控制他們構建的系統的所有三個方面,並在越來越深的層面上控制它們。任何平台構建者都不可避免地想要控制那些密切關注計算、網絡和存儲的控制器。Nvidia 聯合創始人兼首席執行官Jensen Huang 也非常清楚這一點,這也是他將 GPU 製造商視為一家平台公司的原因。並在 2020 年 4 月收購 Mellanox Technologies 後接受我們採訪時,他也表示了同樣的觀點。在業已宣告失敗的Arm收購上同樣如此。Nvidia 不需要 Arm 來充當一個更廣泛計算的角色,它只需要一個 CPU,因此我們有理由相信明年推出的基於 Arm 的「Grace」CPU 將像Nvidia 的 GPU 計算引擎一樣具有創新性。在控制方面,英偉達在 AI Enterprise 下開發了自己的 Base Command 數據準備和機器學習訓練運行管理軟件,這是一個進行機器學習訓練然後創建推理模型的工作流程;它還創建了 Fleet Command 編排和系統管理工具,用於在邊緣運行 AI 的Enterprise。今年早些時候,英偉達支付了一筆未公開的金額來獲得 BrightComputing,以便將其 Bright Cluster Manager 編入英偉達堆棧。我們當時表示,如果 Nvidia 選擇了 GigaIO 或 Liqid 等可組合和分解互連結構的幾家製造商之一,我們不會感到驚訝,坦率地說,我們認為 Nvidia 將從那裡開始,因為以靈活的方式分配 GPU 是一種對於很多客戶來說,真正的問題是,提高這些昂貴的計算設備的效率也是如此。NVM-Express 閃存也是如此,它正在被分解和動態組合以提高效率和性能,但方式略有不同。這可能確實是 Nvidia 計劃的一部分,但是昨日,隨着 Excelero 的收購,Excelero 是過去幾年一直在推動可分解和可組合存儲的幾家 NVM-Express 閃存初創公司之一,它開始看起來像 Nvidia 想要的那樣。控制其自己的用於 HPC 和 AI 應用程序的塊存儲,並將組成它以在其以太網和可能的 InfiniBand 網絡上運行,並且很可能使用基於 Connect-X NIC、BlueField 多核 Arm 處理器和 Nvidia GPU 組合的 DPU,並且可能在原始 BlueField CPU 充當存儲節點控制器,而不是 X86 處理器。後一點是我們看到 Mellanox 在 2019 年的開放計算峰會上玩弄的東西,它的 SNAP 是Software-definedNetwork Accelerated Processing的縮寫。為了向 Nvidia 堆棧添加存儲,Nvidia 可以在 Twitter 收購DriveScale之前收購它,甚至可以收購Lightbits Labs,這是另一個使用 NVM-Express over Fabrics 來集群存儲的有趣供應商。但相反,Nvidia 選擇了收購 Excelero。Excelero 於 2014 年在以色列特拉維夫成立,隨後將其總部遷至聖何塞,靠近英偉達、英特爾和其他IT 巨頭。Lior Gal 多年來一直在 DataDirect Networks 負責其內容和媒體業務的銷售,他是公司聯合創始人,並擔任了多年的首席執行官。Yaniv Romem 曾任服務器管理程序製造商 ScaleMP 研發副總裁,是該公司原首席技術官,並繼 Gal 之後擔任 CEO。OferOshri 也是 ScaleMP 的核心團隊負責人,他仍然是研發副總裁,而 Omri Mann 仍然是首席科學家,他顯然創建了世界上第一個防病毒軟件並曾在ScaleMP 任職。在 EMC 斥資 4.3 億美元收購閃存創新者XtremIO 之前,KirillShoiket領導了 XtremIO 的最終架構,然後被 Excelero 聘為首席技術官。Excelero 在退出隱身之前和之後不久籌集了四輪資金,並在 2018 年 8 月之前籌集了3500 萬美元。Battery Ventures、SquarePeg Capital、Qualcomm Ventures 和Western Digital Ventures 以及一些個人投資者都投入了資金。Mellanox 以及現在的 Nvidia 也是Excelero 的投資者。考慮到過去四年裡有很多現金四處遊蕩,這金額其實並不算高。NVMesh 的有趣之處在於,雖然它是分布式塊存儲,可以運行文件並行系統,如 Lustre、SpectrumScale (GPFS) 或 BeeGFS,用作傳統 HPC 仿真和建模應用程序的暫存器存儲,但對於非結構化和使用機器學習訓練神經網絡所需的半結構化數據,可以通過讓集群中的本地節點從節點上運行的任何文件系統(通常是 XFS)安裝 NVMesh 來避免並行文件系統的這種開銷,給人一種並行文件系統的感覺,沒有任何麻煩。NVMesh 可以在許多不同的協議和結構上運行——普通的 TCP/IP、NVM-Express over Fabrics、InfiniBand 或帶有 RoCE v2 的以太網——以訪問網絡上的閃存存儲並使所有內容看起來對集群中的所有節點都是本地的。Excelero提出的秘訣稱為遠程直接驅動器訪問 (RDDA:Remote Direct Drive Access) 協議,它是一種直接與節點中的NVM-Express 閃存設備通信而無需訪問 CPU 上的驅動程序的方法。就像 InfiniBand RDMA 和以太網 RoCE 允許兩個網卡相互聊天並訪問 CPU 或 GPU 主內存,而無需通過CPU 驅動程序堆棧,或者 NVM-Express 允許CPU 訪問閃存而無需通過 PCI-Express 驅動程序並使用訪問閃存的 SCSI 協議。RDDA 協議已獲得專利,與在節點中本地訪問相比,通過網絡訪問遠程閃存僅增加 5 微秒的延遲開銷。NVMesh 存儲軟件可以在帶有閃存的標準服務器上運行,也可以在基於閃存的實例上的公共雲上運行,以創建虛擬閃存陣列。而且,對於 Nvidia 來說重要的是,Excelero 堆棧已經過調整,可以與 Nvidia 的 Magnum IO 存儲加速軟件層一起工作。您可能會認為,鑑於驅動機器學習訓練的非結構化數據量,系統上的對象存儲量與塊存儲量相比會大得多。但是如果你看一下研究超級計算機 (RSC) 系統的 760 節點第一階段,Pure Storage 提供了175 PB 的 FlashArray 塊存儲,但只有 10PB 的 FlashBlade 對象存儲;還有一個 46 PB的「緩存集群」位於架構中的某個位置,我們強烈懷疑這是基於磁盤的數據集存檔,而不是生產存儲。主存儲的容量將增長到超過 1 艾字節,而 Nvidia 無疑看到了這筆交易中 Pure Storage 的收入——富國銀行分析師 Aaron Rakers 估計 RSC 的存儲將為 Pure Storage 的金庫貢獻 3000 萬美元.當我們寫這篇文章時,我們還沒有意識到Nvidia 上周晚些時候收購了 SwiftStack,並在此評論說,如果 Nvidia 決定它也需要對象存儲來完成 AI 和 HPC 的存儲軟件集,我們不會感到驚訝。我們建議 MinIO 是一個顯而易見的選擇,Ceph 由 Red Hat 控制,因此由 IBM 控制。當然,Ceph 也是一種選擇,還有許多其他對象存儲選擇(包括實際收購的 SwiftStack)。Mellanox 還持有 WekaIO 的股份,如果 Nvidia 認為它需要一個並行文件系統,該系統對 HPC 和 AI 工作負載非常有效,那麼收購這家公司也可能大放異彩。這將在很大程度上完善數據中心的存儲版圖,也將是最後一塊。Nvidia 收購 Excelero 不僅是為了賺錢,也是為了更好地共同設計完整的 Nvidia HPC 和 AI 堆棧。Nvidia硬件和軟件與 Excelero NVMesh 的很多集成已經完成,您可以在此處看到:正如我們之前指出的,每個存儲節點上的存儲控制器沒有理由必須是 X86 服務器。只要有足夠的 PCI-Express 通道連接到 NVM-Express 閃存,BlueField 驅動的 DPU 就可以解決問題。在最長的運行中,Nvidia 可以使用 Grace Arm 服務器 CPU 作為存儲節點控制器,如果它需要更多的功能。關鍵是 Nvidia 擁有更多的堆棧,並增加其代工合作夥伴蝕刻的芯片的數量。★ 點擊文末【閱讀原文】,可查看本文原文鏈接!
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點讚同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。
今天是《半導體行業觀察》為您分享的第2974內容,歡迎關注。
★模擬芯片巨頭的殊途同歸
★從三個緯度看懂半導體
★異構計算,要全面爆發了?
『半導體第一垂直媒體』
實時 專業 原創 深度
識別二維碼,回復下方關鍵詞,閱讀更多
晶圓|集成電路|設備|汽車芯片|存儲|台積電|AI|封裝
回復 投稿,看《如何成為「半導體行業觀察」的一員 》
回復 搜索,還能輕鬆找到其他你感興趣的文章!