您的當(dāng)前位置:首頁(yè) > 探索 > 國(guó)產(chǎn)萬(wàn)卡訓(xùn)練!推理性能突破!摩爾線(xiàn)程新架構(gòu)“花港”與路線(xiàn)圖亮相 正文
時(shí)間:2025-12-29 11:52:08 來(lái)源:網(wǎng)絡(luò)整理 編輯:探索
2025年12月20日,北京——摩爾線(xiàn)程首屆MUSA開(kāi)發(fā)者大會(huì)簡(jiǎn)稱(chēng):MDC 2025)在北京中關(guān)村國(guó)際創(chuàng)新中心正式開(kāi)幕。作為國(guó)內(nèi)首個(gè)聚焦全功能GPU的開(kāi)發(fā)者技術(shù)盛會(huì),大會(huì)系統(tǒng)展示了摩爾線(xiàn)程以自主MUS
2025年12月20日,花港北京——摩爾線(xiàn)程首屆MUSA開(kāi)發(fā)者大會(huì)(簡(jiǎn)稱(chēng):MDC 2025)在北京中關(guān)村國(guó)際創(chuàng)新中心正式開(kāi)幕。國(guó)產(chǎn)構(gòu)路作為國(guó)內(nèi)首個(gè)聚焦全功能GPU的訓(xùn)練性能線(xiàn)程新架線(xiàn)圖開(kāi)發(fā)者技術(shù)盛會(huì),大會(huì)系統(tǒng)展示了摩爾線(xiàn)程以自主MUSA統(tǒng)一架構(gòu)為核心的推理突破全棧技術(shù)成果,全面展現(xiàn)公司在高端全功能GPU領(lǐng)域的亮相關(guān)鍵突破與前瞻布局。
本次發(fā)布的花港核心成果包括:
1、新架構(gòu)“花港”亮相:全功能GPU架構(gòu)“花港”,國(guó)產(chǎn)構(gòu)路支持FP4到FP64的訓(xùn)練性能線(xiàn)程新架線(xiàn)圖全精度計(jì)算,算力密度提升50%,推理突破效能提升10倍。亮相未來(lái)并將基于該架構(gòu)推出高性能AI訓(xùn)推一體“華山”芯片與專(zhuān)攻高性能圖形渲染的花港“廬山”芯片。
2、國(guó)產(chǎn)構(gòu)路“夸娥萬(wàn)卡”高效訓(xùn)練:發(fā)布夸娥萬(wàn)卡智算集群,訓(xùn)練性能線(xiàn)程新架線(xiàn)圖展示了其支撐萬(wàn)億參數(shù)模型訓(xùn)練的推理突破工程化能力與可靠性,在多項(xiàng)關(guān)鍵精度指標(biāo)上達(dá)到國(guó)際主流水平。亮相
3、推理性能實(shí)現(xiàn)跨越:摩爾線(xiàn)程聯(lián)合硅基流動(dòng),在DeepSeek R1 671B全量模型上實(shí)現(xiàn)性能突破,MTT S5000單卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,樹(shù)立國(guó)產(chǎn)推理性能新標(biāo)桿。
4、超節(jié)點(diǎn)架構(gòu)前瞻:分享面向下一代超大規(guī)模智算中心的MTT C256超節(jié)點(diǎn)架構(gòu),著眼高密硬件架構(gòu),實(shí)現(xiàn)極致智算性能。
5、全新個(gè)人智算平臺(tái):正式發(fā)布搭載智能SoC芯片“長(zhǎng)江”的AI算力本MTT AIBOOK,賦能“摩爾學(xué)院”20萬(wàn)開(kāi)發(fā)者與學(xué)習(xí)者。
6、圖形進(jìn)化與前沿探索:揭曉硬件級(jí)光線(xiàn)追蹤加速與自研AI生成式渲染技術(shù),具身智能、科學(xué)智能(AI4S)、AI for 6G等前沿領(lǐng)域的深度布局,進(jìn)一步印證了全功能GPU技術(shù)路線(xiàn)的廣度與面向未來(lái)的可擴(kuò)展性。
這一系列成果的發(fā)布,標(biāo)志著摩爾線(xiàn)程已成功構(gòu)建起一套以自主統(tǒng)一架構(gòu)為根基、貫穿“芯-邊-端-云”的完整技術(shù)棧,實(shí)現(xiàn)了從底層硬件到上層應(yīng)用的系統(tǒng)化閉環(huán)。該體系為國(guó)產(chǎn)智能計(jì)算生態(tài)的持續(xù)演進(jìn)與產(chǎn)業(yè)融合,提供了堅(jiān)實(shí)、開(kāi)放且可持續(xù)的平臺(tái)級(jí)支撐。
戰(zhàn)略基石:MUSA統(tǒng)一架構(gòu)的進(jìn)化與開(kāi)放
MUSA(Meta-computing Unified System Architecture)是摩爾線(xiàn)程自主研發(fā)的元計(jì)算統(tǒng)一計(jì)算架構(gòu),覆蓋從芯片架構(gòu)、指令集、編程模型到軟件運(yùn)行庫(kù)及驅(qū)動(dòng)程序框架等的全棧技術(shù)體系。
MUSA不僅完整定義了從芯片設(shè)計(jì)到軟件生態(tài)的統(tǒng)一技術(shù)標(biāo)準(zhǔn),更代表了公司堅(jiān)持底層創(chuàng)新、踐行長(zhǎng)期主義的戰(zhàn)略核心,并為全功能GPU奠定了堅(jiān)實(shí)的技術(shù)根基,可高效支持AI計(jì)算、圖形渲染、物理仿真和科學(xué)計(jì)算、超高清視頻編解碼等全場(chǎng)景高性能計(jì)算。
歷經(jīng)五年深度研發(fā)與持續(xù)迭代,MUSA實(shí)現(xiàn)了軟件性能的指數(shù)級(jí)跨越。全新升級(jí)的MUSA 5.0標(biāo)志著架構(gòu)步入成熟新階段,在全棧統(tǒng)一性、極致效能與生態(tài)開(kāi)放性上取得關(guān)鍵突破。
編程生態(tài)全面升級(jí):原生MUSA C,深度兼容 TileLang、Triton 等編程語(yǔ)言,為開(kāi)發(fā)者提供靈活高效的全棧開(kāi)發(fā)體驗(yàn)。計(jì)算效能極致優(yōu)化:核心計(jì)算庫(kù)muDNN實(shí)現(xiàn)GEMM/FlashAttention效率超98%,通信效率達(dá)97%,編譯器性能提升3倍,并集成高性能算子庫(kù),顯著加速訓(xùn)練與推理全流程。開(kāi)源生態(tài)持續(xù)擴(kuò)大:計(jì)劃逐步開(kāi)源計(jì)算加速庫(kù)、通信庫(kù)及系統(tǒng)管理框架在內(nèi)的核心組件,向開(kāi)發(fā)者社區(qū)開(kāi)放深度優(yōu)化的底層能力。前沿特性拓展邊界:即將推出兼容跨代GPU指令架構(gòu)的中間語(yǔ)言MTX、面向渲染+AI融合計(jì)算的編程語(yǔ)言muLang、量子計(jì)算融合框架MUSA-Q,以及計(jì)算光刻庫(kù)muLitho,持續(xù)拓展全功能GPU的算力邊界。硬件核心:“花港”新架構(gòu)與技術(shù)路線(xiàn)圖
基于MUSA統(tǒng)一體系,摩爾線(xiàn)程揭曉新一代全功能GPU架構(gòu)“花港”,該架構(gòu)在計(jì)算密度、能效、精度支持、互聯(lián)能力及圖形技術(shù)等方面實(shí)現(xiàn)全面突破,其核心特性包括:
計(jì)算性能顯著提升:基于新一代指令集,算力密度提升50%,能效大幅優(yōu)化;支持從FP4到FP64的全精度端到端計(jì)算,新增MTFP6/MTFP4及混合低精度支持。異步編程與超大規(guī)?;ヂ?lián):集成新一代異步編程模型,優(yōu)化任務(wù)調(diào)度與并行機(jī)制;通過(guò)自研MTLink高速互聯(lián)技術(shù),支持十萬(wàn)卡以上規(guī)模智算集群擴(kuò)展。圖形與AI深度融合:內(nèi)置AI生成式渲染架構(gòu),增強(qiáng)硬件光線(xiàn)追蹤加速引擎,完整支持DirectX 12 Ultimate,實(shí)現(xiàn)圖形渲染與智能計(jì)算的高度協(xié)同。全棧自研與安全可信:架構(gòu)基于全棧自主研發(fā),擁有扎實(shí)的專(zhuān)利壁壘(截至2025年6月30日,公司累計(jì)授權(quán)專(zhuān)利514項(xiàng),其中發(fā)明專(zhuān)利468項(xiàng)),具備全棧自研與自主可控的核心能力。通過(guò)四層硬件安全架構(gòu),提供從芯片到系統(tǒng)的可驗(yàn)證安全守護(hù)。基于“花港”架構(gòu),摩爾線(xiàn)程公布了未來(lái)將發(fā)布的兩款芯片技術(shù)路線(xiàn):
“華山”專(zhuān)注AI訓(xùn)推一體與超大規(guī)模智能計(jì)算。集成新一代異步編程與全精度張量計(jì)算單元,支持從FP4至FP64的全精度計(jì)算,為萬(wàn)卡級(jí)智算集群提供穩(wěn)定高效的算力支撐,是構(gòu)建下一代“AI工廠”的堅(jiān)實(shí)底座。“廬山”專(zhuān)攻高性能圖形渲染。其圖形性能實(shí)現(xiàn)全面跨越:AI計(jì)算性能提升64倍,幾何處理性能提升16倍,光線(xiàn)追蹤性能提升50倍,并顯著增強(qiáng)紋理填充、原子訪存能力及顯存容量。集成AI生成式渲染、UniTE統(tǒng)一渲染架構(gòu)及全新硬件光追引擎,為3A游戲、高端圖形創(chuàng)作提供強(qiáng)大算力支持。基礎(chǔ)設(shè)施:夸娥萬(wàn)卡集群,樹(shù)立國(guó)產(chǎn)智算效率標(biāo)桿
本次大會(huì)正式發(fā)布了夸娥萬(wàn)卡智算集群。該集群具備全精度、全功能通用計(jì)算能力,在萬(wàn)卡規(guī)模下實(shí)現(xiàn)高效穩(wěn)定的AI訓(xùn)練與推理。其核心突破包括:浮點(diǎn)運(yùn)算能力達(dá)到10Exa-Flops,訓(xùn)練算力利用率(MFU)在Dense大模型上達(dá)60%,MOE大模型上達(dá)40%,有效訓(xùn)練時(shí)間占比超過(guò)90%,訓(xùn)練線(xiàn)性擴(kuò)展效率達(dá)95%,與國(guó)際主流生態(tài)高度兼容,并在多項(xiàng)指標(biāo)上具備顯著能效優(yōu)勢(shì)。
在訓(xùn)練側(cè),基于原生FP8能力完整復(fù)現(xiàn)頂尖大模型訓(xùn)練流程,并在多項(xiàng)關(guān)鍵精度指標(biāo)上達(dá)到國(guó)際主流水平。技術(shù)層面實(shí)現(xiàn)關(guān)鍵優(yōu)化:Flash Attention算力利用率超95%,并突破FP8累加精度等關(guān)鍵技術(shù)瓶頸,充分釋放國(guó)產(chǎn)GPU在大模型訓(xùn)練中的性能潛力。在推理側(cè),摩爾線(xiàn)程聯(lián)合硅基流動(dòng),經(jīng)過(guò)系統(tǒng)級(jí)工程優(yōu)化與FP8精度加速,在DeepSeek R1 671B全量模型上實(shí)現(xiàn)性能突破:MTT S5000單卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,樹(shù)立國(guó)產(chǎn)推理性能新標(biāo)桿。面向未來(lái),發(fā)布了MTT C256超節(jié)點(diǎn)的架構(gòu)規(guī)劃。該產(chǎn)品采用計(jì)算與交換一體化的高密設(shè)計(jì),旨在系統(tǒng)性提升萬(wàn)卡集群的訓(xùn)練效能與推理能力,為下一代超大規(guī)模智算中心構(gòu)建兼具超高密度與極致能效的硬件基石。邁向物理AI:圖形技術(shù)持續(xù)進(jìn)化,前瞻布局未來(lái)計(jì)算
在圖形計(jì)算領(lǐng)域,摩爾線(xiàn)程持續(xù)推動(dòng)國(guó)產(chǎn)GPU向兼容性更廣、技術(shù)更深的方向發(fā)展。其產(chǎn)品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流圖形與計(jì)算API,并與國(guó)產(chǎn)主流CPU及操作系統(tǒng)完成了全棧適配,持續(xù)擴(kuò)展游戲及專(zhuān)業(yè)應(yīng)用的兼容覆蓋。公司同時(shí)宣布,即將完整支持DirectX 12 Ultimate,進(jìn)一步接軌行業(yè)頂級(jí)圖形標(biāo)準(zhǔn)。
在核心渲染技術(shù)上,摩爾線(xiàn)程率先擁抱“圖形+AI”范式革命,實(shí)現(xiàn)兩項(xiàng)關(guān)鍵突破:
邁入實(shí)時(shí)光追時(shí)代:基于“花港”架構(gòu)的硬件光線(xiàn)追蹤加速引擎,可實(shí)現(xiàn)對(duì)DirectX Raytracing (DXR)的支持,使實(shí)時(shí)、逼真的光影效果在國(guó)產(chǎn)GPU上成為可能。定義AI生成式渲染(AGR):推出全自研MTAGR 1.0技術(shù),推動(dòng)渲染技術(shù)范式從“計(jì)算”走向“生成”,為下一代數(shù)字內(nèi)容創(chuàng)作及數(shù)字孿生等場(chǎng)景構(gòu)建國(guó)產(chǎn)技術(shù)基座。面向更廣闊的未來(lái)計(jì)算場(chǎng)景,摩爾線(xiàn)程已展開(kāi)前瞻性布局:
具身智能全棧賦能:發(fā)布了MT Lambda具身智能仿真訓(xùn)練平臺(tái),深度融合物理、渲染與AI三大引擎,構(gòu)建了開(kāi)發(fā)、仿真、訓(xùn)練的高效統(tǒng)一環(huán)境。推出基于智能SoC芯片“長(zhǎng)江”、AI模組MTT E300和夸娥智算集群“端云結(jié)合”的MT Robot具身智能解決方案,并宣布將于2026年第一季度開(kāi)源關(guān)鍵仿真加速組件Mujoco-warp-MUSA,以開(kāi)放協(xié)作助力機(jī)器人產(chǎn)業(yè)研發(fā)效率提升。前沿融合計(jì)算探索:MUSA生態(tài)已與合作伙伴在科學(xué)智能(AI for Science)、量子科技、AI for 6G等前沿交叉領(lǐng)域展開(kāi)探索工作,持續(xù)拓展全功能GPU作為通用算力底座的技術(shù)邊界與應(yīng)用價(jià)值。生態(tài)加速:全面賦能開(kāi)發(fā)者,發(fā)布個(gè)人AI算力平臺(tái)
生態(tài)建設(shè)是GPU行業(yè)的核心壁壘與價(jià)值所在,摩爾線(xiàn)程構(gòu)建了從硬件工具、算力支撐到人才培養(yǎng)的賦能體系。
深化人才培養(yǎng),建設(shè)MUSA生態(tài)樞紐:以摩爾學(xué)院為平臺(tái),摩爾線(xiàn)程已構(gòu)建起產(chǎn)教融合的開(kāi)發(fā)者成長(zhǎng)體系,該平臺(tái)匯聚近20萬(wàn)名開(kāi)發(fā)者與學(xué)習(xí)者,并通過(guò)“國(guó)產(chǎn)計(jì)算生態(tài)與AI教育共建行動(dòng)”將前沿技術(shù)與產(chǎn)業(yè)實(shí)踐帶入全國(guó) 200多所高校,吸引超10萬(wàn)名學(xué)子參與。本次大會(huì)宣布建設(shè)MUSA生態(tài)中心,同時(shí)發(fā)布MUSA開(kāi)發(fā)者計(jì)劃,旨在為從AI學(xué)習(xí)探索到科研創(chuàng)新的各階段創(chuàng)新者,提供算力支持與技術(shù)賦能。發(fā)布AI算力本,提供“開(kāi)箱即用”的開(kāi)發(fā)體驗(yàn):作為連接開(kāi)發(fā)者與MUSA生態(tài)的核心入口,MTT AIBOOK搭載自研“長(zhǎng)江”智能SoC,提供高達(dá)50TOPS的端側(cè)AI算力,首次實(shí)現(xiàn)從芯片、驅(qū)動(dòng)到開(kāi)發(fā)環(huán)境的全棧整合,不僅實(shí)現(xiàn)了專(zhuān)業(yè)AI開(kāi)發(fā)的“開(kāi)箱即用”,更創(chuàng)新地打破Linux開(kāi)發(fā)、Windows辦公與Android應(yīng)用之間場(chǎng)景壁壘,將強(qiáng)大的AI能力轉(zhuǎn)化為人人可及的生產(chǎn)力,賦能開(kāi)發(fā)者在AI時(shí)代成為“超級(jí)個(gè)體”。大會(huì)同時(shí)預(yù)告了基于“長(zhǎng)江”SoC打造的迷你型計(jì)算設(shè)備MTT AICube,進(jìn)一步豐富端側(cè)計(jì)算產(chǎn)品形態(tài)。
結(jié)語(yǔ):構(gòu)筑自主基座,共赴智能未來(lái)
MDC 2025展示了從統(tǒng)一架構(gòu)到核心芯片,從超大規(guī)?;A(chǔ)設(shè)施到開(kāi)發(fā)者終端的技術(shù)全景,這不僅是一次全功能GPU技術(shù)路線(xiàn)的系統(tǒng)呈現(xiàn),更是摩爾線(xiàn)程對(duì)自主計(jì)算未來(lái)的堅(jiān)定承諾。
展望未來(lái),摩爾線(xiàn)程將以MUSA為核心,堅(jiān)持開(kāi)放生態(tài),與全球開(kāi)發(fā)者及伙伴攜手,共同構(gòu)建下一代的智能計(jì)算體系,賦能千行百業(yè),邁向智能新紀(jì)元。
+++
關(guān)于摩爾線(xiàn)程
摩爾線(xiàn)程以全功能GPU為核心,致力于向全球提供加速計(jì)算的基礎(chǔ)設(shè)施和一站式解決方案,為各行各業(yè)的數(shù)智化轉(zhuǎn)型提供強(qiáng)大的AI計(jì)算支持。我們的目標(biāo)是成為具備國(guó)際競(jìng)爭(zhēng)力的GPU領(lǐng)軍企業(yè),為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進(jìn)的加速計(jì)算平臺(tái)。我們的愿景是為美好世界加速。
*更多關(guān)于MUSA架構(gòu)、技術(shù)細(xì)節(jié)等深度解讀,請(qǐng)關(guān)注摩爾線(xiàn)程官網(wǎng)及后續(xù)發(fā)布。
優(yōu)必選新中標(biāo)超1.2億元項(xiàng)目 2026年產(chǎn)能將達(dá)萬(wàn)臺(tái)規(guī)模2025-12-29 11:48
體育有新知丨運(yùn)動(dòng)員身上五顏六色“膠布”有何作用?2025-12-29 11:39
雷軍:小米汽車(chē)下一步將抓安全、抓交付 今年將交付40萬(wàn)輛2025-12-29 11:30
2025年金搖桿獎(jiǎng)揭曉!《光與影:33號(hào)遠(yuǎn)征隊(duì)》年度最佳游戲 《GTA6》最受期待2025-12-29 11:29
美國(guó)NASA局長(zhǎng):將在總統(tǒng)任期內(nèi)登月 可開(kāi)采氦2025-12-29 10:30
雷軍:小米汽車(chē)下一步將抓安全、抓交付 今年將交付40萬(wàn)輛2025-12-29 10:26
用自己照片被告侵權(quán)還被索賠8萬(wàn)!攝影師起訴視覺(jué)中國(guó)勝訴 獲賠1.5萬(wàn)元2025-12-29 10:10
一圖看懂小米廣州車(chē)展發(fā)布會(huì):“HAD增強(qiáng)版”即將陸續(xù)推送2025-12-29 09:59
熱浪侵襲巴西 “涼寵”商品走俏2025-12-29 09:48
新研究:OpenAI算力需求持續(xù)激增 2028年支出將達(dá)1100億美元2025-12-29 09:06
全國(guó)花樣滑冰錦標(biāo)賽開(kāi)賽 130名頂尖選手齊聚冰城2025-12-29 11:28
谷歌Nano Banana Pro亮相:打工人的“圖像生成神器”來(lái)了2025-12-29 11:26
(粵港澳全運(yùn)會(huì))十五運(yùn)會(huì)男子10000米決賽蔣發(fā)坤成績(jī)被取消 唐浩然遞補(bǔ)成為冠軍2025-12-29 10:51
這個(gè)機(jī)場(chǎng)居然和鄰國(guó)一樣大!堪比10萬(wàn)個(gè)足球場(chǎng)2025-12-29 10:42
變速箱設(shè)計(jì)有缺陷:豐田被集體訴訟!2025-12-29 10:40
余承東:我們的車(chē)電池、駕控、主動(dòng)、被動(dòng)都安全!2025-12-29 09:59
余承東放言超越所有旗艦!智界認(rèn)領(lǐng)鴻蒙智行首款MPV2025-12-29 09:30
華為重磅官宣!艙內(nèi)激光ADS Pro支持城區(qū)NCA輔助駕駛2025-12-29 09:21
追劇最佳拍檔 怡濃64%黑巧麥麗素520g:38元再發(fā)車(chē)2025-12-29 09:11
(粵港澳全運(yùn)會(huì))十五運(yùn)會(huì)男子10000米決賽蔣發(fā)坤成績(jī)被取消 唐浩然遞補(bǔ)成為冠軍2025-12-29 09:06