這兩天,曙光scaleX640超節(jié)點(diǎn)以單機(jī)柜算力密度20倍提升,引起算力市場(chǎng)廣泛關(guān)注。業(yè)內(nèi)以昇騰384為參照,從不同角度對(duì)比了兩大超節(jié)點(diǎn)異同??傮w來(lái)看,scaleX640除了在總體性能指標(biāo)上取得階段性領(lǐng)*,雙方在架構(gòu)理念上各有側(cè)重,均為國(guó)產(chǎn)計(jì)算集群發(fā)展提供了良好的落地參考。
先來(lái)看根本路線上的差異:昇騰384主要圍繞華為全棧技術(shù)閉環(huán),構(gòu)建出業(yè)界大規(guī)模高速總線互聯(lián)超節(jié)點(diǎn),打破了AI算力互聯(lián)瓶頸;曙光scaleX640則是基于AI計(jì)算開(kāi)放架構(gòu),拉通產(chǎn)業(yè)跨層協(xié)作,定位于開(kāi)放普惠的計(jì)算集群。
明顯的區(qū)別就是,前者僅支持昇騰加速卡,并圍繞CANN展開(kāi)生態(tài)建設(shè),封閉性較強(qiáng);后者支持不同類(lèi)型的國(guó)產(chǎn)加速卡,并兼容主流AI計(jì)算生態(tài),開(kāi)發(fā)性特征明顯。兩者完全可以類(lèi)比“蘋(píng)果模式”與“安卓模式”的差異。
再?gòu)闹饕阅苤笜?biāo)來(lái)看,總算力輸出上,昇騰384單機(jī)柜32卡算力約達(dá)25PF,該方案配備12個(gè)機(jī)柜,總算力可達(dá)300PF;scaleX640則將單機(jī)柜配置做到了640卡,采用“一拖二”高密架構(gòu)組成1280卡計(jì)算單元,總算力規(guī)模達(dá)到了630 PFlops,是前者的2.1倍。
網(wǎng)絡(luò)性能方面,384超節(jié)點(diǎn)HBM總帶寬達(dá)1229 TB/s,片間互連總帶寬 573 TB/s,是此前突破Decode時(shí)延15ms的方案;曙光scaleX640則采用層次化高速互連網(wǎng)絡(luò),HBM總帶寬突破至2304 TB/s,片間互連總帶寬 573 TB/s,兩項(xiàng)指標(biāo)均為前者的1.9倍。
此外,在能源使用效率上,昇騰384超節(jié)點(diǎn)的PUE值基本徘徊在1.1-1.15區(qū)間,已經(jīng)處于相對(duì)領(lǐng)*水平;曙光scaleX640則更進(jìn)一步通過(guò)液冷技術(shù),將PUE降至1.04,據(jù)說(shuō)這一數(shù)據(jù)已經(jīng)趕超NVL576預(yù)計(jì)的2027年能效水平。
現(xiàn)階段來(lái)看,scaleX640綜合性能指標(biāo)領(lǐng)*優(yōu)勢(shì)較為明顯。并且,業(yè)內(nèi)人士認(rèn)為,相比單一企業(yè)主導(dǎo)的封閉生態(tài),開(kāi)放的生態(tài)系統(tǒng)更加復(fù)雜,跨廠商技術(shù)對(duì)齊和產(chǎn)業(yè)協(xié)作難度大,而且國(guó)產(chǎn)算力產(chǎn)業(yè)還面臨行業(yè)統(tǒng)一標(biāo)準(zhǔn)欠缺、自主軟硬件生態(tài)不成熟等問(wèn)題。
曙光scaleX640能在此背景下取得明顯突破,對(duì)于開(kāi)放式計(jì)算路線是一次極大的信心提振。目前英偉達(dá)GPU已逐漸淡出中國(guó)市場(chǎng),期待兩大超節(jié)點(diǎn)路線繼續(xù)保持趕超腳步,加速驅(qū)動(dòng)國(guó)產(chǎn)計(jì)算集群協(xié)同向上。
來(lái)源:互聯(lián)網(wǎng)的一些事公眾號(hào)
沙共和信息科技有限公司/202406/202406070902367510.png)
沙共和信息科技有限公司/202312/202312081712509188.jpg)
沙共和信息科技有限公司/202506/202506031129315159.jpg)
沙共和信息科技有限公司/202506/202506031128495410.jpg)
沙共和信息科技有限公司/201911/201911051718468397.jpg)