close


在AI芯片領域,國內企業已經陸續實現從0到1,接下來從1到100,考驗的是關鍵的落地廝殺環節。所以一款AI芯片能否做的出來似乎已經不足以博取眾人的眼球了,因為AI場景的落地情況,才是直接關係着一家企業能否存活下去的必要因素。

AI場景落地是一場硬仗

數字經濟下,算力已成為新的關鍵生產力,人工智能產業的蓬勃發展,促進了數據量爆發式增長和數據形態日益多樣化,對於算力多樣化的需求也不斷演進,尤其是智能算力需求迅速增長,數據中心正在朝着異構計算的方向前進。在數據中心這個場景下,算力需求由2年翻一倍轉變為3.4個月翻一倍,單一模型並行訓練無法滿足,需要結合流水、張量以及數據並行進一步加速。

燧原科技創始人、董事長、CEO趙立東表示,「高性能計算芯片是支撐人工智能算力最核心的技術,也是目前的短板。燧原科技選擇了自己的發展戰略,堅持原始創新而非簡單仿製跟進的技術路線,建立長期核心競爭力」。作為數據中心基礎設施提供商,燧原科技自研的GCU(General Compute Unit)創新架構,正是面向計算而生。

燧原科技創始人、董事長、CEO趙立東

基於GCU架構,燧原科技於2019年發布了第一代訓練產品「雲燧T10」,2020年發布第一代推理產品「雲燧i10」,2021年發布了第二代訓練產品「雲燧T20/T21」和推理產品「雲燧i20」,以及配套的「馭算」軟件平台,燧原科技成為國內第一家雲端訓練和推理產品迭代到第二代的科技企業。目前,燧原科技的第一代和第二代「邃思」芯片均已實際應用於大規模AI集群工程中,支撐融媒體生成、城市智能感知等多樣化場景。

但不得不說,AI場景的落地是一場硬仗。在實際落地的過程中,燧原科技發現,人工智能數據中心的軟件運維紛繁複雜,不僅面臨着方案選型難和廠商產品兼容的痛點,還存在部署交付周期長、溝通成本高、項目管理周期長的難題。

趙立東還指出,要算盡其用,真正實現價值的創造,以價值創造驅動算力中心建設,而非一堆板卡、算力的簡單硬件堆砌。

因此,結合燧原科技雲燧訓練和推理產品在行業落地的實踐經驗,在2022年世界人工智能大會「算盡其用·定義AI算力中心新實踐」雲端算力產業應用論壇上,燧原科技正式發布雲燧智算機(CloudBlazer POD)。燧原科技推出了針對大規模、集約化人工智能算力應用場景推出的高性能人工智能加速集群產品雲燧智算機(CloudBlazer POD)。

兩代芯片、多項實踐的產物:雲燧智算機

雲燧智算機是燧原科技基於兩代芯片研發與多個大規模人工智能算力中心工程實踐,面向大規模、集約化、綠色低碳數據中心建設而推出的智算集群。

雲燧智算機

雲燧智算機採用一體化設計,集計算、存儲、管理、軟硬協同於一體,以全局優化為目標,做到了開箱即用,為用戶實現AI算力中心從交付部署到後期上線及運維管理全生命周期中的優異總擁有成本(TCO)。

基於計算、存儲、管理網絡分離,全互聯無阻塞的網絡架構,結合高效的多級存儲方式,雲燧智算機實現了千卡級大規模集群高速互聯。其計算節點內基於GCU-LARE2.0多芯互聯技術提供近1TB/s的互聯帶寬,跨節點互聯能力高達600Gb/s。

雲燧智算機整體設計

在強大的「邃思」芯片與CPU的異構算力支撐下,雲燧智算機能夠提供卓越的AI性能。依託於「邃思」芯片核心能力,在典型配置下,雲燧智算機每單元可達到8PFLOPS的TF32浮點算力,並且支持按需橫向擴容,可支持數千卡規模集群,突破E級算力。

而且值得一提的是,現在雙碳和綠色環保理念下,數據中心作為重要的對象有着明確的指標性要求。通過採用一體化冷板式液冷技術,雲燧智算機可實現單節點8顆高性能人工智能芯片液冷散熱,通過液冷板等高效熱傳導部件將被冷卻對象的熱量傳遞到自然冷媒中,採用先進流量控制系統,大幅提高流量變化範圍、降低能耗,擁有架構簡約、系統可靠、智能監控等特性,PUE可降至1.1及以下。

燧池軟件平台,釋放集群生產力價值

軟硬件協同概念自1990年出現,在這個算力需求旺盛,系統構成複雜,XPU架構相互協作的數據中心領域,軟件正變得更加重要起來。

燧原科技創始人兼COO張亞林講到:「系統和軟件是算力服務應用的關鍵,真正的用戶界面是系統和軟件。在系統方面,表現為模型巨量化、場景多樣化、算力規模化、IDC集約化;在這樣的背景下,軟件就需要易用性、遷移性、泛化性、編程性。軟件的作用是對上層用戶屏蔽底層算力異構性、賦能用戶高效開發與部署上線AI應用,真正釋放集群作為生產力工具的價值。」

燧原科技創始人兼COO張亞林

燧原科技發布的燧池智算平台(CloudBlazer Station)是全棧式人工智能開發服務平台和通用的大規模算力管理平台,基於「燧池」智算平台,雲燧智算機能夠根據處理任務的特性將CPU、內存、存儲、Al加速卡等硬件資源進行統一管理與調度。

燧池智算平台(CloudBlazer Station)

雲燧智算機通過一站式預集成人工智能加速硬件、一體化開發與管理平台及配套人工智能應用軟件與服務,可廣泛應用於數字政府、科研院所、科創平台等企事業單位。

國內XPU異構生態聯盟興起

要解決數據中心和智算產業快速發展帶來日益增長的多樣化算力的需求,生態的搭建至關重要。在本論壇上,燧原科技、雲豹智能、此芯科技、超摩科技、礪算科技、芯礪智能、篆芯半導體、奎芯科技、澎峰科技和貝式計算發起成立「數據中心XPU異構生態聯盟」,共同打造智算中心異構融合算力底座,響應國家綠色集約雙碳目標。

「數據中心XPU異構生態聯盟」正式成立

具體來看各聯盟成員的專職,此芯科技是Arm架構通用智能CPU企業,澎峰科技是異構計算軟件棧開發公司,超摩科技專注於Chiplet架構的CPU,()雲豹智能是DPU芯片廠商,()礪算科技是GPU廠商,奎芯科技是IP廠商,篆芯半導體是以太網交換機芯片公司,貝式計算主要為工科研究、工業計算提供開箱可用的異構計算系統,芯礪智能主要聚焦嵌入式高性能計算平台(eHPC)。XPU異構生態聯盟將利用成員多樣化的算力能力,進行資源整合、優勢互補、統一編程,來構建完整的XPU生態鏈,共同打造領先的智算中心集群。


結語


從零開始,燧原科技在兩年半完成了大芯片、軟件全棧、系統集群從產品定義、設計驗證、流片到產品的最終商業落地。本次一體化雲燧智算機的發布,將進一步完善燧原科技人工智能產品線,深化賦能豐富的人工智能應用場景。據張亞林揭露的POD產品路線圖,目前燧原科技已落地超千卡規模液冷AI集群的。此次發布了E級算力的雲燧智算機,下一步,燧原科技將推出訓推一體的10倍算力的泛AI智算中心系統升級產品。

至此,燧原科技已經逐步完善版圖,不再僅僅是一家芯片企業,而是做到了板卡、服務器、集群全方位的產品布局。

*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點讚同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

今天是《半導體行業觀察》為您分享的第3157期內容,歡迎關注。

推薦閱讀

★火爆的激光雷達市場,股價跌至不足1美元!

★英特爾,三年後重返巔峰?

★阜時科技實現國內零突破,激光雷達接收芯片獲車規認證!

半導體行業觀察


『半導體第一垂直媒體』

實時 專業 原創 深度

識別二維碼,回復下方關鍵詞,閱讀更多

晶圓|集成電路|設備|汽車芯片|存儲|台積電|AI|封裝

回復 投稿,看《如何成為「半導體行業觀察」的一員 》

回復 搜索,還能輕鬆找到其他你感興趣的文章!

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()