當前位置: 華文天下 > 辟謠

高效能GPU芯片如何實作自主可控?上海打造多源GPU智算中心

2024-07-09辟謠

中國科協近日釋出十大產業技術問題,在集成電路產業領域,兩個問題上榜,分別是「自主可控高效能GPU芯片開發」和「高端芯片制程受限背景下實作高速大容量光傳輸技術可持續發展的路徑」。

什麽是高效能GPU芯片和高速大容量光傳輸技術?攻關這兩大產業技術問題對中國集成電路產業有什麽意義?解放日報·上觀新聞記者采訪了上海矽知識產權交易中心總經理、上海市集成電路行業協會監事長徐步陸博士。

國產GPU已實作相對自主可控

GPU的中文意思是圖形處理器,在個人電腦裏屬於標配,俗稱「顯卡」。與電腦裏的CPU(中央處理器)相比,GPU的序列計算能力不強,但可以有強大的平行計算能力,即能夠在同一時間做大量比較簡單的運算。

看到GPU的這個差異化效能特點後,輝達公司走出了一條與英特爾不同的發展道路,研發出可用於人工智能領域的GP-GPU(通用圖形處理單元)。這類芯片是GPU的升級版,即中國科協十大產業技術問題提到的高效能GPU,其功能不再局限於處理圖形,而是主要用於人工智能系統的訓練和推理。隨著人工智能大模型的興起,GP-GPU的市場需求量大幅增長,讓輝達一躍成為全球市值最高的企業。

今年3月18日,輝達CEO黃仁勛釋出了人工智能芯片B200。(新華社/法新)

由於輝達的高端芯片被禁止出口到中國大陸,「自主可控高效能GPU芯片開發」就成為一個重要問題。令人欣慰的是,近年來國產高效能GPU芯片發展很快,華為昇騰、天數智芯、沐曦、摩爾執行緒等多個國產GPU已經問世,並投入套用。「在產業生態方面,國產GPU在油氣探查、天氣預報等一些行業套用領域實作了相對自主可控。」徐步陸說,「同時,在與國際主流GPU相容這條發展路線上,國產GPU也占據了一定的智算市場份額。」

上海在建大模型國產算力集群

上周末閉幕的2024世界人工智能大會上,上海儀電釋出的訊息印證了徐步陸的判斷:根據市政府的部署,儀電智算中心(一期)專案正在全力推進,已建成14000P以上的算力集群,其算力相當於2萬卡以上輝達A100芯片。這個專案將實作國產和進口GPU混合使用,除了輝達算力集群,還在建設華為昇騰算力集群和滬產算力集群。目前,已完成天數智芯、沐曦、壁仞三款滬產算力芯片與70B、130B參數大模型的適配測試。

為了讓國產和進口GPU協同工作,提高算力利用率,無問芯穹在世界人工智能大會上釋出了業內首個千卡規模異構芯片混訓平台。這家上海企業與清華大學、上海交通大學科研團隊合作,完成了華為昇騰、天數智芯、輝達等6種品牌芯片的交叉混合訓練,將為國內大模型訓練提供更多的有效算力。

2024世界人工智能大會上,無問芯穹釋出了業內首個千卡規模異構芯片混訓平台。

展望未來技術突破方向,徐步陸認為,國內GPU企業要貼近使用者需求,對使用者任務的數據類別和計算資源進行預估把控;在芯片架構、制造工藝、三維封裝等方面,要與國內產業鏈展開協同創新;在程式語言、函數庫、算子庫等工具鏈環節,要加強技術創新與開源共享。談及近期GPU硬件設計的突破點,他認為通訊是一個瓶頸,可攻關的前沿問題包括GPU片上核間互聯、「GPU+CPU套片」的高速片間網絡互聯和立體封裝物理互聯、GPU板卡以及集群間互聯。

以「傳輸之長」補「芯片之短」

另一個產業技術問題「高端芯片制程受限背景下實作高速大容量光傳輸技術可持續發展的路徑」也與算力息息相關。徐步陸介紹,算力是集資訊計算力、網絡運載力、數據儲存力於一體的新型生產力,計算、儲存、傳輸是算力服務的三大環節,其中高效能GPU是計算環節的核心部件,高速大容量光傳輸則是傳輸環節的核心技術。

在計算環節,國產GPU與國際頂尖水平尚有差距,然而在傳輸環節,中國的光網絡和5G通訊技術已達到國際領先水平。因此,中國可采取「以傳補算、以網統籌」的策略,打造新型算力基礎設施,以「傳輸之長」補「芯片之短」,在「東數西算」工程中推動高速大容量光傳輸技術和產品更快發展。

與電傳輸相比,用光傳輸大數據有顯著優勢。大量電子在高密度電路裏運動時,會使器件發熱,並產生電磁損耗,這就會影響數據傳輸的速度。光的運動要「輕盈」得多——速度是全宇宙最快,運動時幾乎不產生熱量,而且多路光線能在同一個時空裏運動並保持各自的獨立性,從而大幅節省訊號傳輸通道。

如何在光傳輸領域取得更多的技術突破?華為公司提出的全光品質運力網絡F5G(第五代固定網絡)值得關註,這項計劃的目標是在「東數西算」場景下,構建運力網絡的全光底座,實作大頻寬、低時延、高可靠的數據傳輸。F5G的技術突破點包括:400G光傳輸網絡、全光OXC(光交叉連線)交換、城域波分池化、一跳入算入雲和「算力+運力」排程一體化。「只有網絡傳得快、傳得穩,才能確保使用者一點接入,算力觸手可及。」華為光產品線負責人說。

【相關連結】十大產業技術問題

透過精準化學實作藥物和功能材料的綠色制造

采用清潔能源實作低成本低碳煉鐵

雲網融合技術在衛星互聯網中的套用

基於數碼技術的碳排放監測方法研究

自主可控高效能GPU芯片開發

飼料原料豆粕玉米替代的產業化關鍵技術突破

構建珍稀瀕危中藥材的繁育技術體系及其可持續開發利用

高端芯片制程受限背景下實作高速大容量光傳輸技術可持續發展的路徑

套用AI眼底血管健康技術促進相關代謝疾病分級診療

基於CTCS的市域鐵路移動閉塞系統的突破

欄目主編:黃海華 題圖來源:上觀AI

來源:作者:俞陶然