|
12月20日消息,花港摩爾線程華山GPU芯片正式發(fā)布,首發(fā)山首發(fā)采用“花港”新架構(gòu)。新架芯片性 定位AI訓(xùn)推一體、構(gòu)摩超智融合,爾線同時(shí)配套發(fā)布超十萬卡級(jí)AI工廠技術(shù)與新一代高性能張量計(jì)算系統(tǒng)。程華超 華山以“花港”架構(gòu)為基礎(chǔ),發(fā)布聚焦AI訓(xùn)練與推理場(chǎng)景的部分一體化能力,在系統(tǒng)級(jí)支撐技術(shù)方面,英偉配備超十萬卡級(jí)AI工廠技術(shù)?;ǜ?/p> 新一代Scale-up系統(tǒng):搭載MTLink 4.0+多種類以太協(xié)議,首發(fā)山片間互聯(lián)速度達(dá)134.5Gb/s,新架芯片性支持?jǐn)U展至1024 GPUs規(guī)模,構(gòu)摩適配多種Scale-up,爾線支持SHARP技術(shù); RAS 2.0:新增SRAM奇偶校驗(yàn)及ECC能力,程華超強(qiáng)化錯(cuò)誤檢測(cè)、上報(bào)與隔離功能,同時(shí)全面提升debuggability能力; ACE2.0新一代異步通信引擎:通過架構(gòu)優(yōu)化實(shí)現(xiàn)更高效的通信調(diào)度,支撐大規(guī)模集群的協(xié)同運(yùn)算。 采用新一代高性能張量計(jì)算系統(tǒng),全精度MMA:支持TF32/FP16等;實(shí)現(xiàn)端到端加速的混合低精度計(jì)算,適配大語(yǔ)言模型等AI場(chǎng)景需求。 性能指標(biāo)方面,“華山”GPU在浮點(diǎn)算力、訪存帶寬、訪存容量、高速互聯(lián)帶寬等性能上大幅超過英偉達(dá)hopper,部分性能媲美甚至超越英偉達(dá)Blackwell架構(gòu)產(chǎn)品,進(jìn)一步強(qiáng)化了在AI大模型訓(xùn)推場(chǎng)景的技術(shù)競(jìng)爭(zhēng)力。 |
