當前位置: 華文天下 > 辟謠

下一代AI「超級芯片」呼之欲出

2024-03-15辟謠

界面新聞記者 | 彭新

界面新聞編輯 | 文姝琪

AI芯片巨頭輝達最備受關註的GTC開發者大會即將召開,全球AI算力走向備受關註。

隨著英國芯片架構企業Arm繼續發力伺服器市場,並在近期更新了其伺服器處理器Arm Neoverse系列的產品路線圖後,推出兩款基於全新第三代Neoverse IP構建的新的Arm Neoverse計算子系統(CSS)。外界也將初窺下一代整合CPU與GPU的AI「超級芯片」部份面貌,輝達是否跟進也將備受關註。

Neoverse是Arm於2018年推出、針對數據中心市場的伺服器處理器品牌,在Arm規劃下,Neoverse旗下N系列、V系列和E系列各有定位,如V系列即強調效能優先,用於高端伺服器市場,上一代Neoverse V2就被用於輝達的AI芯片設計中。

去年3月,輝達推出首款將CPU和GPU封裝到一起的「Grace Hopper」Gp00超級芯片。其中「Grace」就是輝達在2021年4月釋出的數據中心Arm CPU系列,「Hopper」即輝達最新架構GPU量產型號p00。

一位芯片行業投資人告訴界面新聞記者,輝達的Grace Hopper芯片就是將CPU與頂級AI訓練產品(GPU)一起,打造出「超級芯片」,共同構建了AI完整解決方案。

Gp00可用於AI訓練和推理,輝達透過將一塊CPU與一塊p00 GPU封裝成一整塊芯片,大幅提高了CPU、GPU間數據傳輸效率。在同年11月,輝達再將Gp00升級,將Gp00中GPU配備的96GB容量HBM3記憶體,升級為144GB的HBM3e,再次大幅提高數據傳輸效率。

Arm高級副總裁兼基礎設施事業部總經理Mohamed Awad向界面新聞記者解釋,輝達之前推出的Grace Hopper超級芯片重新設計了系統架構,過去數據中心使用一顆CPU管理多個GPU的設計,而Grace Hopper芯片轉變為一顆CPU只對應一個GPU。「更多的CPU意味著記憶體一致性,最終會大大提高GPU的利用率。」

Arm稱,隨著行業對AI算力的需求逐漸由訓練向推理轉型,CPU推理將是生成式AI計算套用的關鍵組成。

但並非所有AI處理都將在CPU上進行。Arm基礎設施事業部產品解決方案副總裁Dermot O'Driscoll以Grace Hopper為例稱,輝達對該芯片的一項重要創新在於記憶體容量和共享記憶體模式,此類緊耦合CPU設計加上配置AI加速器,對當前流行的大參數大語言模型和其他AI套用非常有益。

為了使得客製芯片變得更迅速且降低設計難度,Arm於去年推出了Arm Neoverse CSS。在Neoverse CSS中,由Arm配置、最佳化和驗證完整的計算子系統,並針對各類計算用例進行配置,合作夥伴則專註於軟體調優、客製加速等工作,還能能加速產品上市時間、降低工程成本。

Dermot O'Driscoll指出,Neoverse CSS是專為幫助客戶在Arm CPU平台上,快速打造通用計算芯粒而推出的產品。它能提供客戶所需的所有介面,以便選擇耦合自身的加速器。這種方法既可以在需要CPU時提供CPU,又可以在需要AI加速器時提供AI加速器,做到兩全其美。

一直以來,對於自研Arm架構的Grace CPU,輝達極力淡化與英特爾、AMD的競爭色彩。

黃仁勛曾在2021年向界面新聞記者表示,絕大多數數據中心仍將繼續使用現有x86 CPU,Grace則主要用於計算領域大型數據密集型細分市場,不會對現有CPU廠商帶來「改變遊戲規則」般的影響。

不過,市場格局已經發生了改變。在數據中心市場,Arm正逐漸站穩腳跟,對英特爾、AMD兩巨頭形成挑戰。

根據市場研究機構Counterpoint報告,Arm架構伺服器2022年首次在數據中心市場獲得超10億美元收入,其中AWS自研芯片占該市場3.16%份額,Ampere占1.52%。隨著微軟在2023年部署其自研的Arm芯片,以及Grace Hopper的出貨,預計Arm在伺服器市場份額還將繼續上升。