

中科創星投資企業「億鑄科技」是目前國內唯一能夠自主設計並量產基於ReRAM全數字存算一體的大算力AI芯片公司。本篇文章將帶您了解AI芯片面臨的挑戰與機遇以及「億鑄科技」的最新資訊。
文章來源 :創業邦

熊大鵬
億鑄科技創始人兼CEO
AI大算力芯片是當前創業者最聚焦的領域之一,算法模型的發展、芯片架構的迭代、工藝進程的演進以及各項產業政策的出台,都在告訴世界這個領域蘊藏着巨大的產業能量和革新機會。
1988年,熊大鵬在華中科技大學當老師,為了能夠去美國讀博,他必須申請到目標學校的全額獎學金。當時中美之間的技術交流有一道巨大的鴻溝,即便只是跨越地理阻礙,飛到了舊金山上空,也足夠讓他覺得振奮。
在德克薩斯大學奧斯汀分校的那幾年,是他芯片設計生涯的開端,為後來能率先抓住全數字存算一體架構的實現路徑埋下了伏筆。
嚴格來說,芯片最開始不是SoC(片上系統級芯片),而是主要用於電路設計板的獨立功能芯片和器件。隨着密度需求越來越大,行業開始慢慢升級,將電路板上的電路、器件和功能芯片,集成和微縮成專用的SoC系統芯片。
在美國的這段學習期間,熊大鵬開始從之前的電路板設計進入到芯片設計領域,見證了從最原始的電路板設計、功能芯片設計,到現在大算力SoC芯片的整個行業發展進程。
在美國工作近10年後,熊大鵬決定回國創業。那時的項目是一些偏簡單的鼠標芯片、通訊芯片以及GPGPU、CGRA、DPU等不同架構AI芯片,近幾年國內半導體芯片更新速度加快,行業格局每隔幾年就會產生劇變。而這一次,他的「對手」是經典的馮·諾依曼架構。

PART 01
三道牆
在AI大算力芯片領域,能效比的提升極度依賴工藝製程的演進,各類算法的應用部署高度依賴既有的GPU的軟件生態。
而目前在這兩個維度上,英偉達兼具壓倒性優勢,在AI大算力公開市場的占有率近90%。
拋開芯片國產替代這一層意義,一家獨大的產業格局對於眾多下游應用場景客戶來說,是一座想離開卻無法離開的城池,下游應用客戶的供應鏈選擇和議價權受限,彼此間的業務差距難以拉開。而對眾多在AI算力芯片賽道的創業者來說則是一片充滿挑戰的藍海。
作為向藍海挺進的一員,熊大鵬清楚地知道,沿英偉達的技術發展路徑繼續努力,理論上是有可能與其比肩的。但GPU似乎已不是AI大算力發展的技術架構路徑,而所謂「充沛的時間和資源」,對於一家初創企業來說至少是10年的時間成本和數以萬計的技術人才投入。
盤了一遍不同的計算機架構後,他認為雖然當前的技術方案已將AI計算推進到了產業化和應用階段,但都在馮·諾依曼架構的範疇,要追求更高的性能,擺在眼前的三個問題亟待解決:能耗牆、存儲牆、編譯牆。
首先是能耗牆問題。占AI大算力芯片高地的英偉達GPU芯片,工藝製程從之前的7nm提升到了4nm,單位面積性能隨之提升約2倍左右,但能效比可能只提升不到一倍;同時還要做巨大的軟件調優投入,以實現對各主流算法的適配和部署。
考慮到工藝本身已接近物理極限,通過提升工藝去拔高性能和能效比的方式已漸趨飽和。且當前AI對算力的需求每三到四個月就要往上翻一倍,芯片開發動輒數億美金,投入巨大。
在成本、能耗以及工藝製程演進滯緩等多重壓力下,能耗牆越來越成為AI向更多應用場景普及的技術瓶頸之一。
但能耗牆問題只是表象,更深層次的原因在於導致能耗牆問題出現的存儲牆。熊大鵬告訴創業邦,存儲牆的問題是AI芯片設計工程師面臨的最具挑戰的問題之一。
原因在於這些芯片目前採用的均是從1946年被沿用至今的馮·諾依曼架構,其架構原理是將計算與存儲分離。早期,馮·諾依曼架構是很好的存在,算是算、存是存,存算分離的架構,讓指令集ISO設計和CPU設計變得更簡潔,但AI大量數據所需要的並行計算成了它繼續維持「完美架構」的「絆腳石」。
然而一次並行處理需要同時啟動幾千個計算核,幾千組數據全部到位後才能開始並行計算。在存算分離的架構下,數據需要在計算和存儲單元之間不停地搬運,直至所有數據全部被搬運到位,才開始計算。
所以在大規模的AI數據計算中,只要有一個數據被卡住,就會導致成千上萬個計算核同時怠工,產生大量計算之外的能耗。據統計,用於數據搬運的能耗已占整體能耗的70%-90%,而數據搬運效率決定了計算效率。
為提升數據搬運的效率和計算能效比,業內將存儲設計分成一級緩存、二級緩存、三級緩存等,通過分層級管理的複雜架構來優化數據的卡殼問題,讓數據離計算單元更近、帶寬更大、讓必須搬運的數據量更少。
但這種思路使當前的存儲架構變得更複雜,增加了數據存算資源分配、數據搬運和管理的複雜性,編譯難度驟增, 導致第三道牆——編譯牆(生態牆)出現。
由於存儲牆內這些數據是實時動態、流向未知的,且是多級動態管理的,可能被卡住的地方也是未知的,必須依賴各類工具來手動調優解決數據卡頓的問題。
但在實際操作中,局部的調優往往會影響其他地方的數據流動,問題一生二、二生三,彼此掣肘,常常需要幾十個人花幾個月甚至更久的時間才能將數據資源的調用路徑調整到相對高效的狀態。
有痛點的地方,就有機遇,「如果能解決別人解決不了的問題,那麼問題反而成了最大的競爭護城河所在。」熊大鵬說道,英偉達就是通過上萬軟件工程師基於自有通用並行計算架構CUDA(Compute Unified Device Architecture)開展了大量手動和自動調優工作,歷經十幾年的積累,為自己構建了一道很高很厚的軟件生態牆。
後來者如果沿着英偉達的技術路線設計AI大算力芯片,除了需要在芯片設計及工藝製程上與其競爭之外,更需要在軟件生態建設上做大量投入和積累,而這對於創業者來說是一座必須翻越的「珠穆朗瑪」。

PART 02
用革命性的技術趕超巨頭
同樣,要在AI大算力賽道追趕國際芯片巨頭,除了正面翻越「珠穆朗瑪」這條路外,還可以找到另一條從A到B的路。
存算一體是當下被業界關注的全新架構之一。隨着新型憶阻器ReRAM(即RRAM)的成熟,將其應用於AI算力芯片這一思路越來越被業界認為是破局當前技術僵局的最佳路徑之一。
熊大鵬在2017年接觸到存算一體的計算架構,並越來越堅信這是一條真正能打破馮·諾依曼架構的革命性技術路線。
2021年10月,熊大鵬在上海成立了「億鑄科技」,目前已經是一家基於ReRAM設計和落地全數字存算一體AI大算力芯片的行業領頭羊企業。「億鑄」擁有一支頂級的研發、工程和顧問團隊,致力於將ReRAM這種憶阻器以全數字的技術路線應用於存算一體AI大算力芯片領域。
「存算一體」,顧名思義,存儲和計算不再隔開,存儲牆被徹底消滅,大大減少了數據搬運量。
在ReRAM存算一體的架構下,只需要把諸如圖像、語音等數據輸入芯片,芯片根據已存儲的計算參數進行運算,輸出結果。好比人的眼睛,看到圖像後輸入到大腦,大腦做「存算一體」的並行處理,輸出視覺判斷結果。
數據調度和傳輸變得更加簡單,更容易通過編譯器實現執行程序自動優化,這對扭轉高度依賴既有軟件生態的現狀提供了質的突破。
此外,ReRAM本身的計算單元可以通過阻變器件的存儲記憶特性,利用基礎物理定律和原理完成海量AI計算。所以ReRAM存算一體架構芯片的能效比可以做到傳統馮·諾依曼架構芯片的幾十倍甚至百倍以上。
即便目前是存算一體技術落地的起始階段,能效比已經可以在傳統架構能效比基礎之上再提升10倍,未來潛力巨大。所以,把ReRAM存算一體架構的AI大算力芯片比作AI算力界的一匹「黑馬」不為過。
目前,「億鑄科技」第一代算力芯片採用的工藝為28nm,儘管和當前主流的AI芯片存在兩、三代的工藝差(12nm和7nm),但「億鑄科技」第一代算力板卡的能效比仍然可以實現目前主流算力板卡的10倍以上。
「億鑄」通過創新的技術路線,實現了AI大算力芯片能效比的數量級提升。支持客戶在不增加物理空間、能耗的前提下,提升了算力密度,同時也符合了國家號召的優化能耗結構、支持雙碳目標達成的政策指向。
2021年底,「億鑄科技」完成過億元天使輪融資,該輪投資由中科創星、聯想之星和匯芯投資(國家5G創新中心)聯合領投。

PART 03
選擇「模擬計算」,還是「全數字計算」?
要知道,「億鑄」並不是第一家投身於存算一體芯片的公司,國內外已經有幾家同樣做存算一體架構芯片的公司。
儘管如此,賽道中,各家由於選擇的存儲介質不同,實現的技術方式不同,目標市場自然就拉開了差異。
當前存算一體賽道中,初創公司主要集中於低精度、小算力的應用場景,這是由他們所選擇的憶阻器特點和模擬計算決定的。
除了模擬計算這一方式外,還有沒有其他可以將存算一體計算架構成功應用於AI大算力芯片的方式呢?
對這一問題,「億鑄」提出了切實可行的解決方案——全數字化設計,滿足該領域高精度、大算力、高能效比的要求。由於「億鑄」選擇的存儲介質是ReRAM,其本身特性非常適合全數字化設計的要求。
「億鑄」還擁有從ReRAM器件、全數字存算一體計算架構、AI芯片設計、編譯器、算子庫、應用開發平台等全鏈條的人才儲備,為實現全數字化設計奠定了堅實的團隊基礎。
因此,「億鑄」基於對AI大算力賽道現有痛點的深度解析,巧妙地將ReRAM這種存儲介質的屬性優勢和全數字化的路徑優勢進行深度整合,切實將存算一體這一先進的計算架構在AI大算力芯片賽道落地,向業界提供大算力、高精度、高能效比、易部署的AI大算力芯片產品。
此外,「億鑄科技」已和國內先進的ReRAM IP及產能供應商昕原半導體達成緊密合作,實現雙方共研聯調,確保「億鑄」ReRAM全數字存算一體AI大算力芯片的成功量產。

PART 04
未來,如何去贏?
毋庸置疑,「億鑄」ReRAM全數字存算一體大算力芯片的出現將給業界帶來全新的AI大算力解決方案,而它算力大、精度高、能效比高、部署容易的特點也將會對AI大算力的既有技術格局帶來一定的衝擊。
但是熊大鵬也清醒地認識到,在技術的汪洋大海里,沒有「放之四海皆是最佳」的解決方案,只有滿足不同領域、不同特點和要求的、更具比較優勢的解決方案,不同的技術路徑會在各自的演進過程中找到與自己最匹配的應用場景。
在AI大算力這一賽道,他認為「億鑄」的ReRAM全數字存算一體大算力芯片是解決該賽道存儲牆、能耗牆、編譯牆(生態牆)等問題的最優路徑。
面對未來可能進入這一技術賽道的其他參與者,熊大鵬表示,AI計算是一個非常巨大的市場,未來的發展更是不可估量,因此更多的資源進入這個賽道會促進存算一體計算生態的進一步發展。
在ReRAM全數字存算一體芯片這一創新性、原創新極高的研發征途中,一邊是海闊天空,一邊是荊棘叢生,但熊大鵬表示,創業需要幾個核心要素:一個有巨大社會價值和商業價值的目標、一條清晰明確的實現路徑、一支團結專業的奮鬥團隊、一群志同道合彼此合作的產業夥伴。如果這些都具備了,那麼創業者只要手握鐮刀、咬定青山不放鬆,披荊斬棘就是到達終點的最佳路徑。
中科創星
Portfolio
推薦閱讀
Recommend