3月22日,英偉達發(fā)布了一款數(shù)據(jù)中心專屬CPU——“Grace CPU超級芯片”。該芯片由兩顆CPU芯片組成,其間通過NVLink-C2C技術進行互連。而NVLink-C2C則與近日英特爾與臺積電、三星等多家科技廠商發(fā)起的UCIe標準有著異曲同工之妙,也是一種新型的高速、低延遲、芯片到芯片的互連技術,可支持定制裸片與GPU、CPU、DPU、NIC、SOC實現(xiàn)互連。
當前,新型數(shù)據(jù)中對算力需求日漸持續(xù)攀升,僅靠單一類型的架構和處理器無法處理更復雜的海量數(shù)據(jù),“異構”正在成為解決算力瓶頸關鍵技術方向。chiplet(“芯?!保┘夹g被視為“異構”技術的集納。3月初,英特爾發(fā)起的UCIe 標準將為chiplet(“芯粒”)技術提供統(tǒng)一接口和技術標準,臺積電、三星、日月光、AMD、等廠商加入,但英偉達卻按兵不動。
專家指出,這表明英偉達并沒有想要游離在UCIe聯(lián)盟之外,但也同時展現(xiàn)出了英偉達對NVLink-C2C的絕對信心,未來也許會組建自己的聯(lián)盟。在全球異構計算領域,雖然AMD也占有一席,但從其加入了UCIe 標準聯(lián)盟來看,AMD在“異構”上已經(jīng)偏向英特爾這邊,未來異構芯片之戰(zhàn)主要在英特爾和英偉達之間進行,業(yè)界稱之為“雙英之戰(zhàn)”。
英特爾的“芯粒聯(lián)盟”
UCIe的魅力在于可以將各個企業(yè)的Chiplet規(guī)定在統(tǒng)一的標準之下,這樣不同廠商、工藝、架構、功能的芯片就可以進行混搭,從而輕而易舉地達到互通,并且還能實現(xiàn)高帶寬、低延遲、低能耗、低成本。芯謀研究高級分析師張彬磊向《中國電子報》記者表示,“小芯片”chiplet技術的發(fā)展有望推動異構計算的發(fā)展,chiplet技術提供統(tǒng)一接口和技術標準,解決異質(zhì)封裝的連接和傳輸效率問題(速率、能效上會有小幅損失)。UCIe標準將促進chiplet相關技術的發(fā)展,有望在性能和功耗方面達到平衡和商業(yè)化價值。
英特爾曾提出六大技術支柱,對XPU的實現(xiàn)起到了關鍵作用,包括制程、架構、內(nèi)存、互連、安全和軟件。異構計算雖然看似一個硬件層級的內(nèi)容,但要釋放其能力,需要芯片、系統(tǒng)、軟件三層一體化考慮,才能夠發(fā)揮作用。一是芯片層,指在芯片封裝內(nèi)的異構,和“小芯片”概念緊密相聯(lián);二是系統(tǒng)層,指多功能多架構的計算架構進行整合;三是軟件層,統(tǒng)一的跨架構編程模型oneAPI,可以通過一套軟件接口、一套功能庫為開發(fā)者提供在不同架構上編程的便利性。在統(tǒng)一的UCIe標準下,異構的難度就會直線下降,并且效果更好。
目前,UCIe聯(lián)盟已經(jīng)囊括了半導體、封裝、IP供應商、晶圓代工廠和云端服務提供廠商等上下游全產(chǎn)業(yè)鏈。AMD執(zhí)行副總裁兼首席技術官Mark Papermaster表示:“UCIe標準將成為利用異構計算引擎和加速器來推動系統(tǒng)創(chuàng)新的關鍵因素,從而催生性能、成本和能效已得到優(yōu)化的一流解決方案。”
臺積電科技院士、設計暨技術平臺副總經(jīng)理魯立忠說:“該全行業(yè)聯(lián)盟立志擴大封裝級集成生態(tài)系統(tǒng),臺積電很高興能加入其中。臺積電提供各種硅技術和封裝技術,為異構UCIe器件打造多種實現(xiàn)方案?!?/p>
日月光半導體工程與技術營銷總監(jiān)Lihong Cao博士指出:“業(yè)界普遍認為,異構集成有助于將基于小芯片的設計推向市場?!?/p>
英偉達或“另起爐灶”
然而,人們在關注UCIe聯(lián)盟之余也發(fā)現(xiàn),在UCIe聯(lián)盟當中并沒有英偉達與蘋果這兩大異構集成公司的身影。其中的原因,可以從英偉達CEO黃仁勛在近日召開的GTC 2022春季開發(fā)者大會上探知部分。
英偉達發(fā)布了NVIDIA NVLink-C2C互連技術,其鏈路的能效最多可比NVIDIA芯片上的PCIe Gen 5高出25倍,面積效率高出90倍,可實現(xiàn)每秒900GB乃至更高的一致互聯(lián)帶寬。也就是說,在異構集成的小芯片互連方面,英偉達也在做與英特爾類似的事情。
“除NVLink-C2C外,英偉達將支持UCIe標準。與NVIDIA芯片的定制芯片集成既可以使用UCIe標準,也可以使用 NVLink-C2C?!?黃仁勛說。
對此有專家指出,這表明英偉達并沒有想要游離在UCIe聯(lián)盟之外,但也同時展現(xiàn)出了英偉達對NVLink-C2C的絕對信心,未來也許會組建自己的聯(lián)盟。
賽迪顧問集成電路中心高級咨詢顧問池憲念向《中國電子報》記者表示,英偉達自身擁有的NVIDIA NVLink-C2C 依托于 NVIDIA 世界一流的 SERDES 和 LINK 設計技術,可從 PCB 級集成和多芯片模組擴展到硅插入器和晶圓級連接。這可提供極高的帶寬,同時優(yōu)化能效和裸片面積效率。相較于UCIe標準,NVLink-C2C經(jīng)過優(yōu)化,延遲更低、帶寬更高、能效更高。
蘋果或許與英偉達有著同樣的考慮。本月初,“跨界選手”蘋果攜地球最強桌面芯片M1 Ultra搶別人“飯碗”,產(chǎn)品性能超越一眾CPU與GPU的專業(yè)選手。
芯謀研究分析師張先揚向記者表示,2022年3月9日蘋果公布的自研芯片M1 Ultra是基于Chiplet工藝,該技術提供了2.5TB/s的超高帶寬,遠遠領先于目前公布的UCIe1.0標準。也就是說,蘋果的Chiplet產(chǎn)品路線通過與臺積電的合作就可以完成,且領跑于當前UCIe標準,因此對蘋果來說,加入該聯(lián)盟不是必選項。
“異構”格局撲朔迷離
此前,全球異構計算領域一直維持在互相制衡的三國殺格局。但UCIe聯(lián)盟的出現(xiàn)打破了原有的平衡,英特爾和AMD的親密互動,英偉達的似離非離,讓整個形勢變得撲朔迷離。盡管合縱連橫是上上之策,但打鐵還需自身硬,想要在異構計算的壁壘中率先突圍,實力才是硬道理,所以三巨頭都在各自擅長的領域內(nèi)大動干戈。
“三巨頭”分別都有自己主導的異構計算體系。池憲念介紹道,英特爾主導的異構計算體系主要為其自身系列產(chǎn)品和服務使用,在PC與高性能移動計算領域具有優(yōu)勢;以IBM、谷歌、英偉達為主的OpenPower聯(lián)盟則以IBM Power芯片架構技術為基礎,主要面向高性能計算領域應用;以AMD、高通、ARM、三星、北京華夏芯等為主體的HSA(heterogeneous system architecture,異構計算系統(tǒng))聯(lián)盟,是完全開放的異構計算聯(lián)盟,ARM、高通、三星等巨頭參與其中,在高性能移動計算領域具有優(yōu)勢。
CPU龍頭英特爾作為業(yè)界唯一擁有CPU、獨立GPU、IPU、ASIC、FPGA、各種加速器的企業(yè)。在最近的投資者會議中提出了一個新架構-Falcon Shores,計劃于2024年完成,這是一款將X86和Xe GPU 整合到一個Xeon插槽中的新架構。
英特爾中國研究院院長宋繼強向《中國電子報》記者表示,將X86的主芯片加上GPU的性能整合在一起,這是一個創(chuàng)新。在性能上,F(xiàn)alcon Shores將提供超過5倍的每瓦性能、超過5倍的計算密度以及超過5倍的內(nèi)存容量和帶寬。
在記者問到英特爾與其他幾家相比有哪些優(yōu)勢時,宋繼強指出,一是技術基礎穩(wěn)固且強大;二是英特爾能有架構和多種不同加速器去處理合適的應用負載;三是英特爾提出了“軟件優(yōu)先”。這對開發(fā)者來說尤為重要。
GPU龍頭英偉達在去年的GTC2021上公布了其專為人工智能和超算使用需求打造的Grace CPU系列產(chǎn)品,并且打造了全新的芯片路線“GPU+DPU+CPU”。而在今年的GTC2022上,英偉達宣布推出首款面向AI基礎設施和高性能計算的基于Arm Neoverse的數(shù)據(jù)中心專屬CPU-“Grace CPU 超級芯片”。
Grace CPU 超級芯片是專為AI、HPC、云計算和超大規(guī)模應用而設計,由兩個CPU芯片組成,兩者通過NVLink-C2C進行互連。并且能夠在單個插座(socket)中容納 144 個 Arm 核心,在 SPECrate 2017_int_base 基準測試中的模擬性能達到業(yè)界領先的 740 分。根據(jù) NVIDIA 實驗室使用同類編譯器估算,這一結果較當前的DGX A100要高1.5倍以上。
黃仁勛對其偏愛有加,贊揚道:“Garce的一切都令人驚嘆,我們預計Grace超級芯片屆時將是最強大的CPU,是尚未發(fā)布的第5代頂級CPU的2到3倍。”
對于英偉達來說,Grace CPU的出現(xiàn)使英偉達的CPU產(chǎn)品不再受英特爾和AMD的限制,英偉達雖然是全球GPU霸主,但GPU只負責運算加速,需要依靠CPU下達指令才能執(zhí)行,所以GPU和CPU的溝通就顯得格外重要。
盡管此前鬧得沸沸揚揚的ARM收購案雖然以失敗告終,但這也是英偉達向外界傳遞的信號,對于增強自身在異構方面的決心展露無遺。
新晉FPGA龍頭AMD在合并賽靈思完成后,擺脫各個行業(yè)只能第二的處境,AMD就此成為繼英特爾后又一家兼具CPU、GPU、FPGA三大產(chǎn)品線的半導體廠商,未來AMD的CPU將與賽靈思的FPGA結合為CPU+FPGA的異構模式。賽靈思深耕的FPGA產(chǎn)品,2020年在FPGA市場,賽靈思全球和中國境內(nèi)市場份額均達到50%~55%。對于賽靈思的收購,AMD總裁兼首席執(zhí)行官蘇姿豐表示,AMD通過有效整合賽靈思在FPGA方面的優(yōu)勢,能夠提供具有更廣泛高性能的計算產(chǎn)品組合,提供從CPU到GPU、ASIC、FPGA系統(tǒng)級解決方案。同時,借助賽靈思在5G、通信、自動駕駛和行業(yè)領域的資源,AMD能夠?qū)⒏咝阅苡嬎隳芰敫囝I域,擴展到更廣泛的客戶群體中。而且AMD未來可實現(xiàn)FPGA在現(xiàn)成CPU 上運行編程語言,并研發(fā)出用于實現(xiàn)某些功能或軟件堆棧的定制ASIC產(chǎn)品。
AMD全球高級副總裁、大中華區(qū)總裁潘曉明曾在2021世界半導體大會上表示:“今天和未來的工作負載需要強大的計算能力,異構計算是關鍵的未來趨勢。AMD未來在計算、圖形和解決方案的三個方面聚焦高性能計算,在持續(xù)發(fā)展的行業(yè)中保持高性能計算領導力?!?br>『本文轉(zhuǎn)載自網(wǎng)絡,版權歸原作者所有,如有侵權請聯(lián)系刪除』

