|
12月20日消息,線程新代性在今天的架構(gòu)集群首屆MUSA開發(fā)者大會上,摩爾線程正式發(fā)布了新一代GPU架構(gòu)“花港”,支持并帶來了首款基于“花港”的線程新代性云端AI加速GPU“華山”。 “華山”芯片可應(yīng)用于超十萬卡級的架構(gòu)集群AI工廠,其搭載新一代Scale-up系統(tǒng),支持兼容MTLink 4.0和多種以太協(xié)議,線程新代性適配多種Scale-up switch,架構(gòu)集群支持SHARP,支持片間互聯(lián)速率可達(dá)1314GB/s。線程新代性 據(jù)介紹,架構(gòu)集群KUAE萬卡群浮點(diǎn)運(yùn)算能力可達(dá)10 Exa - FLOPS,支持精度模型效果優(yōu)于國際主流,線程新代性大模型MFU可達(dá)60%。架構(gòu)集群 此外,支持集群有效訓(xùn)練時長達(dá)到90%,零中斷技術(shù)理論可達(dá)99%,萬卡集群訓(xùn)練線性度達(dá)到了95%,性價比更是達(dá)到HXX(H20)的1.5倍。 根據(jù)官方數(shù)據(jù),在DeepSeek R1全量模型分布式推理性能方面,MTT S5000的PD分離-分布式集群, DeepSeek Prefill Only性能單卡吞吐達(dá)到H20的2.5倍,DeepSeek Decode單卡吞吐達(dá)到1.3倍。 |
