11月21日消息,騰訊今日,混元騰訊混元大模型團(tuán)隊(duì)宣布開源最新視頻生成模型HunyuanVideo 1.5,發(fā)布費(fèi)級(jí)這是全新一款基于Diffusion Transformer(DiT)架構(gòu)、參數(shù)為8.3B的視頻生成生成輕量級(jí)視頻生成模型,支持生成5-10秒的模型高清視頻。
該模型已經(jīng)搶先在“元寶”上線,消顯普通用戶可以直接體驗(yàn),流暢可通過(guò)兩種方式:一是運(yùn)行輸入文字描述(Prompt),直接實(shí)現(xiàn)“文生視頻”;二是騰訊上傳圖片配合Prompt,輕松將靜態(tài)圖片轉(zhuǎn)化為動(dòng)態(tài)視頻。混元
據(jù)介紹,發(fā)布費(fèi)級(jí)HunyuanVideo 1.5模型能力全面,全新支持中英文輸入的視頻生成生成文生視頻與圖生視頻。
其中,模型圖生視頻能力展現(xiàn)出圖像與視頻的高度一致性,生成的視頻在色調(diào)、光影、場(chǎng)景、主體和細(xì)節(jié)等方面都能與原圖較好匹配。
模型還具備強(qiáng)指令理解與遵循能力,能夠精準(zhǔn)地實(shí)現(xiàn)多樣化場(chǎng)景,包括運(yùn)鏡、流暢運(yùn)動(dòng)、真實(shí)的物理規(guī)律遵循、寫實(shí)人物和人物情緒表情等多種指令。
在元寶中可以通過(guò)文字和圖片生成視頻同時(shí),HunyuanVideo 1.5支持寫實(shí)、動(dòng)畫、積木等多種風(fēng)格,并可在視頻中生成中英文文字,滿足多樣化內(nèi)容創(chuàng)作需求。
在畫質(zhì)方面,模型可原生生成480p和720p高清視頻,并可通過(guò)超分模型提升至1080p電影級(jí)畫質(zhì)。
此前,視頻生成領(lǐng)域的開源SOTA旗艦?zāi)P椭辽儆?0B,需要超過(guò)50GB顯卡方可部署。
HunyuanVideo 1.5定位為“開源小鋼炮”,顯著降低了使用門檻可在14G顯存的消費(fèi)級(jí)顯卡上流暢運(yùn)行,真正讓每一位開發(fā)者和創(chuàng)作者都能“玩起來(lái)”。
HunyuanVideo1.5通過(guò)多層次的技術(shù)創(chuàng)新,實(shí)現(xiàn)了生成效果、性能與尺寸上的平衡。
HunyuanVideo 1.5創(chuàng)新的SSTA稀疏注意力機(jī)制(全稱Selective and Sliding Tile Attention,選擇性滑動(dòng)分塊注意力)在保證高質(zhì)量生成的同時(shí)顯著提升推理效率,配合多階段漸進(jìn)式訓(xùn)練策略,在運(yùn)動(dòng)連貫性、語(yǔ)義遵循等關(guān)鍵維度均達(dá)到商用水平。
頂: 3踩: 98
騰訊混元發(fā)布全新視頻生成模型:14G消費(fèi)級(jí)顯卡流暢運(yùn)行 生成5
人參與 | 時(shí)間:2025-12-29 18:14:57
評(píng)論專區(qū)
相關(guān)文章
- 12GB內(nèi)存從200暴漲至500元!蘋果吃不消:iPhone 17/18不降價(jià)大漲價(jià)也不意外
- AI也會(huì)被DDL逼瘋!正經(jīng)研究發(fā)現(xiàn):壓力越大 AI越危險(xiǎn)
- 存儲(chǔ)漲價(jià)消費(fèi)者來(lái)承擔(dān)!明年P(guān)C要漲價(jià)至少20% 否則產(chǎn)品線停產(chǎn)
- 谷飼不膻肉香翻倍:艾克拜爾原切羔羊排4斤85元順豐冷鏈(京東149元)
- 零跑朱江明:我作為一個(gè)財(cái)富自由的工程師 造車肯定不是為賺錢
- 抖音副總裁李亮:豆包手機(jī)助手不存在“入侵”“越權(quán)”等行為
- 顧客用AI圖片退款掉包退貨 賣家二次申訴被拒后直接報(bào)警
- 黃仁勛:未來(lái)兩三年90%的新知識(shí)由AI合成
- 美國(guó)2架直升機(jī)空中相撞 已致1死1重傷!事發(fā)視頻公布
- 外賣小哥的競(jìng)爭(zhēng)對(duì)手來(lái)了!全球首款自動(dòng)送貨自行車現(xiàn)身硅谷





