首發(fā)“花港”新架構(gòu)!摩爾線程華山GPU芯片發(fā)布:部分性能超越英偉達(dá)Blackwell
12月20日消息,花港摩爾線程華山GPU芯片正式發(fā)布,首發(fā)山首發(fā)采用“花港”新架構(gòu)。新架芯片性
定位AI訓(xùn)推一體、構(gòu)摩超智融合,爾線同時配套發(fā)布超十萬卡級AI工廠技術(shù)與新一代高性能張量計(jì)算系統(tǒng)。程華超
華山以“花港”架構(gòu)為基礎(chǔ),發(fā)布聚焦AI訓(xùn)練與推理場景的部分一體化能力,在系統(tǒng)級支撐技術(shù)方面,英偉配備超十萬卡級AI工廠技術(shù)?;ǜ?/p>
新一代Scale-up系統(tǒng):搭載MTLink 4.0+多種類以太協(xié)議,首發(fā)山片間互聯(lián)速度達(dá)134.5Gb/s,新架芯片性支持?jǐn)U展至1024 GPUs規(guī)模,構(gòu)摩適配多種Scale-up,爾線支持SHARP技術(shù);
RAS 2.0:新增SRAM奇偶校驗(yàn)及ECC能力,程華超強(qiáng)化錯誤檢測、上報與隔離功能,同時全面提升debuggability能力;
ACE2.0新一代異步通信引擎:通過架構(gòu)優(yōu)化實(shí)現(xiàn)更高效的通信調(diào)度,支撐大規(guī)模集群的協(xié)同運(yùn)算。
采用新一代高性能張量計(jì)算系統(tǒng),全精度MMA:支持TF32/FP16等;實(shí)現(xiàn)端到端加速的混合低精度計(jì)算,適配大語言模型等AI場景需求。
性能指標(biāo)方面,“華山”GPU在浮點(diǎn)算力、訪存帶寬、訪存容量、高速互聯(lián)帶寬等性能上大幅超過英偉達(dá)hopper,部分性能媲美甚至超越英偉達(dá)Blackwell架構(gòu)產(chǎn)品,進(jìn)一步強(qiáng)化了在AI大模型訓(xùn)推場景的技術(shù)競爭力。
本文地址:http://www.ssc849.cn/html/17c44399539.html
版權(quán)聲明
本文僅代表作者觀點(diǎn),不代表本站立場。
本文系作者授權(quán)發(fā)表,未經(jīng)許可,不得轉(zhuǎn)載。