99久久婷婷国产综合精品电影,高潮了还继续啃花蒂,中 ,黄色一级免费大片_亚洲视频91_理论毛片_热久久精品免费

會員登錄 - 用戶注冊 - 設(shè)為首頁 - 加入收藏 - 網(wǎng)站地圖 不止端側(cè) 云天勵飛押注云端推理:GPNPU 架構(gòu)瞄準 AI 算力新范式!

不止端側(cè) 云天勵飛押注云端推理:GPNPU 架構(gòu)瞄準 AI 算力新范式

時間:2025-12-29 14:04:38 來源:企業(yè)錄(www.ssc849.cn)-公司信息發(fā)布,網(wǎng)上買賣交易門戶 作者:綜合 閱讀:742次

隨著生成式 AI 和智能體應(yīng)用加速落地,不止AI 算力需求正發(fā)生結(jié)構(gòu)性變化。端側(cè)云天勵飛董事長兼 CEO 陳寧在接受媒體采訪時表示,云天押注云端AI 產(chǎn)業(yè)正從“以訓(xùn)練為中心”逐步走向“以推理規(guī)?;癁楹诵?rdquo;的勵飛力新新階段,2025 年有望成為算力范式變化的推理重要分水嶺。

過去十多年,構(gòu)瞄AI 產(chǎn)業(yè)的范式核心敘事圍繞訓(xùn)練展開:更大的模型、更強的不止算力、更復(fù)雜的端側(cè)互聯(lián)體系,推動模型能力不斷突破。云天押注云端但隨著 AIGC 從能力展示走向高頻使用,勵飛力新算力需求的推理重心開始遷移。“訓(xùn)練解決的構(gòu)瞄是模型能不能變聰明,推理解決的范式是應(yīng)用能不能跑得起。”陳寧指出,不止當 AI 進入面向大眾、面向業(yè)務(wù)流程的階段,推理調(diào)用量呈現(xiàn)指數(shù)級增長,算力系統(tǒng)必須同時滿足低成本、高并發(fā)、低時延和可持續(xù)運行等多重約束。

在這一背景下,推理不再只是訓(xùn)練的附屬功能,而正在演變?yōu)橐粋€獨立的算力賽道。尤其當智能體開始承擔更復(fù)雜的任務(wù)鏈路——從長上下文理解到工具調(diào)用、從多模態(tài)輸入到連續(xù)交互——推理側(cè)的系統(tǒng)壓力會從“單點算力”轉(zhuǎn)向“系統(tǒng)吞吐與成本結(jié)構(gòu)”。這也意味著,如果繼續(xù)用以訓(xùn)練為核心設(shè)計的通用 GPU 體系承接海量推理需求,資本開支和運營成本都可能被迅速放大,商業(yè)模型的可持續(xù)性將面臨挑戰(zhàn)。

推理新需求下,GPNPU 試圖用“架構(gòu)取舍”換取規(guī)?;?jīng)濟性

在中美算力競爭格局中,陳寧坦言,訓(xùn)練賽道對先進制程、互聯(lián)帶寬和生態(tài)成熟度要求極高,在先進制造工藝受限的背景下,差距客觀存在且需要長期投入。但在推理賽道,情況有所不同:推理更像一個“在真實負載約束下做系統(tǒng)最優(yōu)化”的新命題。

隨著應(yīng)用規(guī)模化,推理計算內(nèi)部已出現(xiàn)明顯結(jié)構(gòu)分化,例如 prefill 與 decode 在算力密集度、帶寬需求和訪存模式上存在顯著差異:前者更偏算力密集,后者更偏帶寬與訪存效率密集。陳寧據(jù)此判斷,圍繞訓(xùn)練優(yōu)化的通用 GPU 架構(gòu),在推理規(guī)模化場景下更容易面臨效率與成本壓力,也因此為面向推理的架構(gòu)與系統(tǒng)工程創(chuàng)新提供了空間。

在這一判斷下,云天勵飛提出并持續(xù)推進 GPNPU 架構(gòu)。從采訪表述看,GPNPU 的關(guān)鍵不在于“堆算力”,而在于圍繞推理負載做軟硬協(xié)同的系統(tǒng)取舍,核心目標可以概括為三點——

生態(tài)遷移友好:盡可能貼近主流訓(xùn)練生態(tài)與模型工程習(xí)慣,降低模型從訓(xùn)練到推理部署的門檻,減少客戶在工程側(cè)的“遷移成本”。

面向推理的算子與數(shù)據(jù)流優(yōu)化:推理階段的性能瓶頸往往不是峰值算力,而是算子組合、并發(fā)調(diào)度、緩存與訪存效率;架構(gòu)需要對推理常見計算圖更“對口”。

以單位成本支撐更大并發(fā):推理商業(yè)化的核心變量是單位成本與單位能效,最終比拼的是在可控成本下能承載多大規(guī)模的并發(fā)請求、能做到怎樣的時延穩(wěn)定性。

“推理階段真正的挑戰(zhàn),不在于單點算力峰值,而在于單位成本下能支撐多大規(guī)模的并發(fā)推理。”陳寧強調(diào),GPNPU 試圖在滿足推理負載特性的前提下,構(gòu)建更具經(jīng)濟性的算力形態(tài),為大規(guī)模 AI 應(yīng)用提供可持續(xù)的算力底座。

從端側(cè)到云端:云天勵飛的推理芯片積累與中長期布局

長期以來,云天勵飛被外界視為一家“端側(cè) AI 芯片公司”。對此,陳寧強調(diào),端側(cè)只是公司早期階段的切入點,而非長期邊界。他回顧稱,在 2018 年之前,AI 仍處于智能感知階段,端側(cè)、小算力芯片是更現(xiàn)實的落地形態(tài);但從 2018 年開始,公司已系統(tǒng)性進入邊緣計算方向,并隨著 AI 應(yīng)用復(fù)雜度提升,逐步向更高算力層級演進。

從“積累”角度看,云天勵飛在推理芯片上的能力沉淀,更像是一條從場景到架構(gòu)的反向路徑:一方面,端側(cè)與邊緣階段的長期落地經(jīng)驗,讓公司更早面對推理真實約束——成本、功耗、時延、穩(wěn)定性、部署與運維,而不是只在理想條件下追求峰值指標;另一方面,隨著 Transformer 與智能體應(yīng)用興起,推理負載快速復(fù)雜化,企業(yè)需要把對推理計算結(jié)構(gòu)(例如 prefill/decode 分化、并發(fā)調(diào)度特性、訪存/帶寬瓶頸等)的理解,固化為芯片架構(gòu)與系統(tǒng)軟件的協(xié)同設(shè)計能力。

“做云端推理不是轉(zhuǎn)型,而是順著應(yīng)用形態(tài)和算力結(jié)構(gòu)演進做的自然外延。”陳寧表示,目前云天勵飛已形成端側(cè)、邊緣、云端并行推進的技術(shù)布局。隨著智能體、AI 原生應(yīng)用和行業(yè)級智能系統(tǒng)不斷涌現(xiàn),單一層級算力難以承載完整需求:端側(cè)負責就近交互與隱私敏感任務(wù),邊緣承接區(qū)域級低時延推理,云端則負責高吞吐、高并發(fā)的大規(guī)模推理服務(wù)。云端推理由此成為不可或缺的一環(huán),也是公司下一階段的重要投入方向。

在政策層面,陳寧注意到國家已釋放出清晰信號。近期發(fā)布的“AI+”相關(guān)指導(dǎo)文件提出,到 2027 年,AI 應(yīng)用和智能體在重點領(lǐng)域的滲透率要超過 70%;到 2030 年,將接近 90%。

這意味著,在補齊基礎(chǔ)能力的同時,中國正將應(yīng)用落地與推理規(guī)?;鳛橹匾l(fā)展路徑。陳寧表示,真正決定一場產(chǎn)業(yè)革命的,不是模型在實驗室里能跑多快,而是能不能以足夠低的成本、足夠高的效率跑進現(xiàn)實世界——而這正是云端推理算力與推理芯片的價值所在。

(責任編輯:時尚)

相關(guān)內(nèi)容
  • 《彩虹六號:圍攻》被黑:無數(shù)賬號充值數(shù)十億游戲幣!育碧緊急關(guān)服回檔
  • 谷歌AI超級大餅:同成本下1000倍性能提升、每半年翻倍
  • 中外學(xué)者:傳統(tǒng)文化在全球南方現(xiàn)代化中發(fā)揮多重作用
  • 全球首款2nm手機芯片!三星Exynos 2600采購價比高通驍龍8E5還便宜
  • 日本開始限購顯卡!16GB+大顯存馬上就買不到了
  • 標準引領(lǐng)算力基石——CDCC 2025 中國數(shù)據(jù)中心標準大會盛大開幕
  • 因為一口吃的 美國野生浣熊逐漸“寵物”化
  • (粵港澳全運會)四川隊獲得十五運會男子4×400米金牌
推薦內(nèi)容
  • 零跑首款MPV D99亮相:增程、純電雙動力 續(xù)航全球同級最長
  • 小米最強機皇快來了!小米17 Ultra看點匯總
  • 全球首款驍龍8 Gen5主動散熱手機!OPPO新品蓄勢待發(fā)
  • 國鐵集團鄭州局開行6列“球迷專列”
  • 行業(yè)第一!海爾入選2025中國出海品牌百強TOP3
  • 澳大利亞將禁止機艙內(nèi)使用充電寶:不會給予任何豁免!