
來源:內容由半導體行業觀察(ID:icbank)編譯自protocol.,謝謝。 大約七年前,Partha Ranganathan 意識到摩爾定律已死。這對谷歌工程副總裁來說是一個相當大的問題:他開始期望芯片性能每 18 個月翻一番而不會增加成本,並幫助制定了谷歌每年在計算基礎設施上花費的數百億美元的採購計劃。 但現在 Ranganathan 每四年獲得兩倍的芯片,而且看起來這種差距在不久的將來會進一步擴大。 所以他和谷歌決定做點什麼。該公司已經投入數億美元來設計自己的人工智能定製芯片,稱為張量處理單元或 TPU。谷歌現在已經推出了四代以上的 TPU,這項技術使該公司的人工智能努力領先於競爭對手。 但在谷歌開發 TPU 時,該公司發現人工智能並不是唯一可以改進的計算類型。當 Ranganathan 和其他工程師退後一步,研究其數據中心中計算最密集的應用程序時,他們很快就清楚他們接下來應該處理什麼:視頻。 「我是從『我們想要研究的下一個大殺手級應用是什麼?』的角度來看的,」Ranganathan 說。「然後我們查看了陣容,我們發現轉碼占用了我們計算周期的很大一部分。」 YouTube 是 Google 迄今為止最大的視頻相關計算消費者,但它用於在其平台上攝取、轉換和播放數十億視頻的芯片類型並不是特別擅長。轉換部分特別棘手,需要強大的芯片才能有效地完成。 因此,將視頻轉換或轉碼為最終將播放它們的數千台設備的正確格式讓 Ranganathan 覺得這是一個需要花一些時間解決的好問題。轉碼是非常計算密集型的,但同時,任務本身也很簡單,可以設計所謂的專用集成電路或 ASIC 來完成工作。 芯片行業分析師 Mike Feibus 表示:「對於像轉碼這樣的非常具體、高強度的工作負載,他們可以從中獲得巨大的收益。」 為了讓管理層在 2016 年批准該項目,Ranganathan 的同事 Danner Stodolsky 向負責監督該公司龐大基礎設施的 YouTube 副總裁 Scott Silver 發送了即時消息。Silver說,他要求約 40 名員工和數百萬美元來實現這一目標。 「這非常、非常快,因為從經濟性和工作量以及我們正在做的事情來看,這很有意義,」Silver說。 在希臘神話中的多眼怪物之後被稱為 Argos,YouTube去年在一篇技術論文中首次向公眾披露了該芯片,該論文吹噓新設計在轉碼計算性能方面實現了 20 到 33 倍的提升。如今,谷歌已經將第二代 Argos 芯片部署到全球數千台服務器上,並且未來還有兩次迭代正在進行中。 DIY SoC 谷歌自建的 YouTube 芯片是科技巨頭中日益增長的趨勢的一部分。亞馬遜已經構建了它的 Graviton服務器處理器,微軟正在開發基於 Arm 的服務器處理器,Facebook 有一個芯片設計部門——不勝枚舉。 一個普遍的假設是,大型科技公司正在進入芯片領域,因為這是一種明顯的省錢方式。大多數芯片公司的毛利率都在 50% 以上,因此通過將芯片設計流程轉移到內部,科技公司理論上可以節省大量資金。 但根據 D2D 諮詢公司負責人 Jay Goldberg 的說法,情況並非如此。一方面,經濟學沒有意義——為了節省幾美元的利潤而付出巨大的努力聘請和培養芯片設計師是不值得的。一個新的先進芯片可能要花費數億美元來簡單地構建一個原型,然後再花費數千萬美元來完善它。 「我們的重點並不是真正的省錢,」Silver說。「我們喜歡省錢,但我們真正想做的是為觀眾提供同樣好的——如果不是更好的話——質量體驗。」 動機其實很簡單:大型科技公司正在設計自己的芯片以創造戰略優勢。 「通常這意味着你有一些軟件想要綁定到芯片上,你會獲得很大的性能提升,」Goldberg 說。最早和最著名的例子之一是谷歌的 TPU,它開發它是為了解決其數據中心的人工智能任務。 對於某些工作負載,「TPU 將他們必須建立的數據中心的數量減少了 50%,」Goldberg 說。「以每人 10 億美元的價格計算,可以節省很多錢。」 在節省數據中心建設資金的同時,它還為谷歌雲提供了微軟 Azure 和 AWS 當時所沒有的東西。 但定製芯片設計背後的另一部分動機可以追溯到過去 20 年芯片行業的重大整合。大約 20 年前,有數十家公司爭相製造大型科技公司想要的芯片,激烈的競爭導致許多競爭設計可供選擇。 如今,大多數類別中只有一兩家大型芯片製造商——尤其是數據中心處理器——這意味着雲巨頭無法獲得他們想要的定製芯片。相反,他們使用英特爾和英偉達等公司製造的通用處理器,這些處理器還不錯,但相對同質。 「這裡真正危在旦夕的是控制半導體公司的產品路線圖,」Goldberg 說。「所以他們建立了自己的路線圖,他們控制了路線圖,並通過這種方式獲得了戰略優勢。」 只需按下「播放」 YouTube 將 Argos 芯片稱為視頻編碼單元或 VCU,它的主要工作是將每分鐘上傳到網站的 500 小時視頻轉換為在用於觀看 YouTube 的眾多設備,從智能手機到電視再到筆記本電腦,有時這意味着每個視頻有多達 15 種變體。 儘管芯片的目的很簡單,而且 Ranganathan 和工程師團隊清楚地知道他們希望它完成什麼,但發明一塊芯片並不是一件小事。僅 YouTube 運營所需的規模就帶來了巨大的挑戰,迫使團隊從芯片本身開始思考設計,一直到 YouTube 如何布置芯片所連接的電路板,以及數據中心機架的設計以及它如何配置每個集群。 「如果加速器降落在艦隊中而沒有人使用它,它真的落地了嗎?」 Ranganathan說。「你可以製造出驚人的硬件。但如果你不以我們的軟件同事可以使用它的方式構建它,它實際上可以工作——還有編譯和工具、調試和部署等等。」 對 Ranganathan 來說,創建硬件只是任務的一部分:「它只是冰山一角,」他說。深入研究如何將 Argos 芯片集成到公司的數據中心並以 YouTube 的規模運行它們需要軟件和硬件工程師之間的密切合作。 因此,Argos 是由軟件定義的硬件,這意味着從事芯片工作的工程師可以使用所謂的高級綜合技術更快地迭代設計。谷歌開發了自己版本的高級合成軟件 Taffel,用於幫助製造 TPU 和 Argos 處理器。 「[T] 他使用以軟件為中心的方法來設計硬件的想法是我們在 Argos 中非常努力地推動的東西,」Ranganathan 說。 Ranganathan 引用的其他密切硬件-軟件協作的例子之一是工程師如何解決在現場出現故障的 VCU 單元以及一個稱為「黑洞」的問題,即在芯片失敗後浪費資源。從本質上講,該團隊想出了一種檢測故障和重新路由流量的方法。 Argos 芯片的第一個版本只是旨在利用 YouTube 正在轉碼的現有視頻工作負載並以更便宜的方式完成它。這些節省讓 YouTube 可以開始將更多視頻轉碼為使用更少數據但提供相同圖像質量的優質視頻編碼格式。較小的文件帶來了巨大的好處:它們的存儲和服務成本更低,它們允許運營商使用更少的帶寬,並且它們為消費者提供更快的加載時間。 「我們真正想做的事情是將所有上傳到 YouTube 的視頻,並將它們轉碼為各種可能的格式,並獲得最佳體驗,」Silver 說。「這個問題很棘手。這樣做的結果是,它咬掉了那個蘋果。」 與大多數用於為數據中心賦能的芯片類似,Argos 芯片的存在將完全不會被數億觀看 YouTube 或使用谷歌其他視頻產品的人所注意到。Silver 表示,該公司沒有觀察到對在 YouTube 在全球運營的任何市場中引入 VCU 的反應。 但這不完全是重點。YouTube 顯然更好,因為它使用谷歌的定製芯片來實現對於最早在互聯網上運營的公司來說完全無法想象的事情。 儘管如此,谷歌製造的一代 VCU 可以與英偉達、AMD 或英特爾製造的芯片競爭,這還不夠。谷歌需要領先半導體巨頭數年才能開始讓定製芯片的提議變得有意義。否則,等待其中一個人這樣做更有意義。 但對於 YouTube 來說,設計一塊真正適合某個目的的芯片,而將更複雜、更不明確的問題留給可以處理任何類型計算的昂貴芯片則更有意義。 「如果你考慮機器學習訓練或推理——這些就像非常大、非常大和有趣的工作負載,CPU 不能很好地服務,或者肯定不能很好地服務,」Silver 說。「你可能會爭辯說,GPU 可以很好地為它們提供服務……但如果你的大多數計算機都在對視頻進行轉碼,而你每年為此付出數千萬或數億美元的費用,那將變得很明顯你有空間 [投資] ASIC 來做到這一點。」 ★ 點擊文末【閱讀原文】,可查看本文原文鏈接! *免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點讚同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。 今天是《半導體行業觀察》為您分享的第3140內容,歡迎關注。 推薦閱讀 ★成就台積電霸主地位的六個人 ★一種極具創新的AI芯片 ★為了提升密度,閃存廠商們拼了 半導體行業觀察 『半導體第一垂直媒體』 實時 專業 原創 深度 識別二維碼,回復下方關鍵詞,閱讀更多 晶圓|集成電路|設備|汽車芯片|存儲|台積電|AI|封裝 回復 投稿,看《如何成為「半導體行業觀察」的一員 》 回復 搜索,還能輕鬆找到其他你感興趣的文章!