來源:內容由半導體行業觀察(ID:icbank)轉載自公眾號軟硬件融合,謝謝。
編者按
北京時間,9月21凌晨,NVIDIA GTC 2022秋季發布會上,CEO黃仁勛發布了其2024年將推出的自動駕駛芯片。因為其2000TFLOPS的性能過於強大,英偉達索性直接把它全新命名為Thor,代替了之前1000TOPS的Altan。
Thor的發布,代表着在汽車領域,已經由分布式的ECU、DCU轉向了完全集中的功能融合型的單芯片。也預示着一個殘酷的現實:「許多做DCU級別的ADAS芯片公司,產品還在設計,就已經落後」。
雲和邊緣計算的數據中心,以及自動駕駛等超級終端領域,都是典型的複雜計算場景,這類場景的計算平台都是典型的大算力芯片。
大芯片的發展趨勢已經越來越明顯的從GPU、DSA的分離趨勢走向DPU、超級終端的再融合,未來會進一步融合成超異構計算宏系統芯片(Macro-SOC)。
1 NVIDIA自動駕駛芯片Thor1.1 自動駕駛汽車芯片的發展趨勢上圖是BOSCH給出的汽車電氣架構演進示意圖。從模塊級的ECU到集中相關功能的域控制器,再到完全集中的車載計算機。每個階段還分了兩個子階段,例如完全集中的車載計算機還包括了本地計算和雲端協同兩種方式。
上圖是NVIDIA Altan的芯片架構示意圖(Thor剛出來,沒有找類似的圖),從此圖可以看出:Altan&Thor的設計思路是完全的「終局思維」,相比BOSCH給出的一步步的演進還要更近一層,跨越集中式的車載計算機和雲端協同的車載計算機,直接到雲端融合的車載計算機。雲端融合的意思是服務可以動態的、自適應的運行在雲或端,方便雲端的資源動態調節。Altan&Thor採用的是跟雲端完全一致的計算架構:Grace-next CPU、Ampere-next GPU以及Bluefield DPU,硬件上可以做到雲端融合。
1.2 Intel Mobileye、高通和NVIDIA芯片算力比較我們可以看到,Mobileye計劃2023年發布的用於L4/L5的最高算力的EyeQ Ultra芯片只有176 TOPS。
從上圖我們可以看到,高通計劃的L4/L5自動駕駛芯片是700+TOPS,並且是通過兩顆AP和兩個專用加速器共四顆芯片組成。
再對照NVIDIA Altan,之前計劃的用於L4/L5自動駕駛芯片Altan是1000TOPS算力。
NVIDIA的王炸!推翻了之前的Altan,直接給了一個全新的命名Thor(雷神索爾),其算力達到了驚人的2000TOPS。
NVIDIA Thor發布之後,高通「快速」的發布了自己的4芯片2000TOPS算力的解決方案。
1.3 單芯片實現通常5顆以上芯片的多域計算NVIDIA Thor提供2000TFLOPS的算力(相比較Atlan提供的2000TOPS)。
Thor SoC能夠實現多域計算,它可以為自動駕駛和車載娛樂劃分任務。通常,這些各種類型的功能由分布在車輛各處的數十個控制單元控制。製造商可以利用Thor實現所有功能的融合,來整合整個車輛,而不是依賴這些分布式的ECU/DCU。
這種多計算域隔離使得並發的時間敏感的進程可以不間斷地運行。通過虛擬化機制,在一台計算機上,可以同時運行Linux、QNX和Android等。
參考文獻https://mp.weixin.qq.com/s/KKJ0hsxvOoIhBgMPMgcEgQ,英偉達發布最強汽車芯!算力2000TOPS,車內計算全包了,車東西
https://mp.weixin.qq.com/s/lA8h9jTtgsPIjYAX3p5cvg,英偉達「史詩級」自動駕駛芯片亮相!算力2000TOPS,兼容座艙娛樂功能,新智駕
2 自動駕駛SOC和手機SOC的本質區別這裡我們給出一個概念:複雜計算。複雜計算指的是,在傳統AP/OS系統之上,還需要支持虛擬化、服務化,實現單設備多系統共存和跨設備多系統協同。因此,如果把AP級別的系統看做一個系統的話,那麼複雜計算是很多個系統組成的宏系統。
手機、平板、個人電腦等傳統AP上部署好操作系統之後,我們在上面運行各種應用軟件。整個系統是一個整體,各個具體的進程/線程會存在性能干擾的問題。
但在支持完全硬件虛擬化(包括CPU、內存、I/O、各種加速器等的完全硬件虛擬化)的平台下,不僅僅是要把宏系統切分成多個獨立的系統,並且各個系統之間是需要做到應用、數據、性能等方面的物理隔離。
自動駕駛汽車,通常需要支持五個主要的功能域,包括動力域、車身域、自動駕駛域、底盤域、信息娛樂域。因此,集中式的自動駕駛汽車超級終端芯片,必須要實現完全的硬件虛擬化,必須要支持各個功能域的完全隔離(相互不干擾)。
我們把這一類虛擬化和多系統的計算場景稱為複雜計算,支持複雜計算的芯片才能算是「大」芯片。這類場景目前主要包括:雲計算、超算、邊緣計算、5G/6G核心網的數據中心,以及自動駕駛、元宇宙等場景的超級終端。
3 絕對的算力優勢面前,定製ASIC/SOC沒有意義隨着雲計算的發展,隨着雲網邊端不斷的協同甚至融合,隨着系統的規模越來越龐大,ASIC和傳統基於ASIC的SOC的發展道路越來越走向了「死胡同」。越簡單的系統,變化越少;越複雜的系統,變化越多。複雜宏系統,必然是快速迭代,並且各個不同的用戶有非常多差異性的,傳統ASIC的方式在複雜計算場景,必然遇到非常大的困境。
在自動駕駛領域,在不採用加速引擎的情況下,傳統的SOC可以把AI算力做到10 TOPS左右;很多公司通過定製加速引擎的方式,快速的提升算力,可以把AI算力提升到100甚至200 TOPS。然而,傳統SOC的實現方式有很多問題:
自動駕駛的智能算法以及各類上層應用,一直在快速的演進升級中。定製ASIC的生命周期會很短,因為功能確定,車輛難以更新更先進的系統升級包,這樣導致ASIC無法很好的支持車輛全生命周期的功能升級。
整個行業在快速演進,如果未來發展到L4/L5階段,目前的所有工作就都沒有了意義:包括芯片架構、定製ASIC引擎,以及基於此的整個軟件堆棧及框架等,都需要推倒重來。
越來越體會到,在大芯片上,做定製ASIC是噩夢;現實的情況,需要是某種程度上軟硬件解耦之後的實現通用芯片。只有軟硬件解耦之後:硬件人員才能放開手腳,拼命的堆算力;軟件人員才能更加專心於自己的算法優化和業務創新,而不需要關心底層硬件細節。
在同樣的資源代價下,通用芯片為了實現通用,在性能上存在一定程度的損失。因此,做通用大芯片,也需要創新:
需要創新的架構,實現足夠通用的同時,最極致的性能以及性能數量級的提升;
需要實現架構的向前兼容,支持平台化和生態化設計;
需要站在更宏觀的視角,實現雲網邊端架構的統一,才能更好的構建雲網邊端融合和算力等資源的充分利用。
在絕對的算力優勢面前,一切定製芯片方案都沒有意義。
4 大芯片的發展趨勢:從分離到融合計算機體系結構在從GPU和DSA的分離向融合轉變:
第一階段,CPU單一通用計算平台;
第二階段,從合到分,CPU+GPU/DSA的異構計算平台;
第三階段,從分到合的起點,以DPU為中心的異構計算平台;
第四階段,從分到合,眾多異構整合重構的、更高效的超異構融合計算平台。
自動駕駛領域已經是Thor這樣的功能融合的獨立單芯片了,在邊緣計算和雲計算場景,獨立單芯片還會遠嗎?
在邊緣計算等輕量級場景,可以通過功能融合的獨立單芯片覆蓋;在雲計算業務主機等重量級場景,可以通過Chiplet的方式實現功能融合的單芯片。
5 各領域大芯片發展趨勢開門見山,簡而言之。大芯片的發展趨勢就是:功能融合的、超異構計算架構的單芯片MSoC。
上圖為基於CPU+GPU的異構計算節點的天河1A超級計算機架構圖。
E級的天河三依然是異構計算架構。
最新TOP500第一名的Frontier,也選擇的是基於AMD處理器的異構計算架構(每個節點配備一個 AMD Milan 「Trento」 7A53 Epyc CPU 和 四個AMD Instinct MI250X GPU,GPU核心總數達到了37,632)。
日本的富岳超算所採用的ARM A64FX處理器,是在常規的ARMv8.2-A指令集的基礎上擴展了512Bit的SIMD指令,也可以看做是某種形態上的異構計算。
總結一下,在超算領域,千萬億次、百億億次(E級)超算使得異構計算成為主流。下一代超算,是十萬億億次(Z級),幾乎所有的目光都投向了超異構計算。
自動駕駛領域,NVIDIA Drive Thor提供2000TOPS的算力(目前,主流自動駕駛芯片AI算力為100TOPS),Thor之所以能有如此高的算力,跟其內部GPU集成的Tensor Core有很大的關係。Thor是功能融合的單芯片,其架構由集成的CPU、GPU和DPU組成,可以看做是超異構SOC。
在雲和邊緣服務器側,CPU、GPU和DSAs融合的趨勢也越來越明顯,預計未來3年左右,服務器端獨立單MSoC芯片(或者說超異構計算芯片)會出現。
6 大芯片需要考慮計算資源的協同和融合大芯片,擔負着宏觀算力提升的「重任」。
如果計算資源是一個個孤島,那就沒有宏觀算力的說法。宏觀算力勢必需要各個計算節點芯片的協同甚至融合。這就需要考慮計算的跨雲網邊端。
異質的引擎架構越來越多,計算資源池化的難度也越來越高。在超異構計算時代,要想把異質的資源池化,計算需要做到:
維度一:跨同類型處理器架構。如軟件可以跨x86、ARM和RISC-v CPU運行。
維度二:跨不同類型處理器架構。軟件需要跨CPU、GPU、FPGA和DSA等處理器運行。
維度三:跨不同的芯片平台。如軟件可以在Intel、AMD和NVIDIA等不同公司的芯片上運行。
維度四:跨雲網邊端不同的位置。計算可以根據各種因素的變化,自適應的運行在雲網邊端最合適的位置。
維度五:跨不同的雲網邊服務供應商、不同的終端用戶、不同的終端設備類型。
(全文完)
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點讚同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。
今天是《半導體行業觀察》為您分享的第3175內容,歡迎關注。
推薦閱讀
★13年來首次下滑,CIS廠商求變!
★6G帶來的芯片機會
★美國實現0.7nm芯片?繞開EUV光刻機?
半導體行業觀察

『半導體第一垂直媒體』
實時 專業 原創 深度
識別二維碼,回復下方關鍵詞,閱讀更多
晶圓|集成電路|設備|汽車芯片|存儲|台積電|AI|封裝
回復 投稿,看《如何成為「半導體行業觀察」的一員 》
回復 搜索,還能輕鬆找到其他你感興趣的文章!
