99久久婷婷国产综合精品电影,高潮了还继续啃花蒂,中 ,黄色一级免费大片_亚洲视频91_理论毛片_热久久精品免费

設(shè)為首頁 - 加入收藏   
您的當(dāng)前位置:首頁 > 焦點 > 節(jié)省近50%GPU計算!通義百聆開源新一代語音交互模型 正文

節(jié)省近50%GPU計算!通義百聆開源新一代語音交互模型

來源:企業(yè)錄(www.ssc849.cn)-公司信息發(fā)布,網(wǎng)上買賣交易門戶 編輯:焦點 時間:2025-12-29 14:05:57

12月24日消息,節(jié)省近G計算交互阿里通義百聆家族近日開源新一代語音交互模型Fun-Audio-Chat-8B。通義

新模型兼具高智商和高情商,百聆具備出色的開源共情能力,與之對話,新代仿佛與懂你的語音人聊天。

在OpenAudioBench、模型VoiceBench、節(jié)省近G計算交互UltraEval-Audio、通義MMAU、百聆MMSU、開源SpeechFunctionCall等權(quán)威基準(zhǔn)測評中,新代Fun-Audio-Chat-8B斬獲SOTA,語音超過同量級開源模型。模型

目前,節(jié)省近G計算交互百聆家族成員包括“會說話”的語音轉(zhuǎn)文字模型Fun-ASR、“聽得懂”的文字轉(zhuǎn)語音模型Fun-CosyVoice3。

最新開源的模型Fun-Audio-Chat-8B主打語音對語音功能——“能聽會說”。

用戶可與模型音頻對話,適用于語音聊天、情感陪伴、智能設(shè)備和語音客服等多種場景。

無任何情緒標(biāo)簽或提示詞情況下,它能通過語義、語氣、語速、停頓、重音等細(xì)微信號,感知對方的情緒狀態(tài),并給出恰到好處的關(guān)切、安慰或鼓勵式回應(yīng)。

此外,用戶可嘗試角色扮演,量身定制語音的情緒、說話風(fēng)格、語速、高低音和音量等。

而模型能保持“原有智商”,主要得益于兩個創(chuàng)新的音頻模型訓(xùn)練模式。

一是采用 Core-Cocktail兩階段訓(xùn)練策略,先快速學(xué)新本事,再把“新本事”和“老底子”融合起來,為了避免學(xué)新東西把原來的能力忘掉(災(zāi)難性遺忘),第一階段訓(xùn)練得到的模型和原始的純文本大模型參數(shù)合并后,再進(jìn)行微調(diào)。

二是與人類偏好對齊。通過多階段和多任務(wù)的后訓(xùn)練設(shè)計,模型在真實對話場景中能更好地理解用戶語音內(nèi)容與情緒線索,作出更自然、更符合人類期望的回應(yīng)。

值得注意的是,新模型通過壓縮-自回歸-解壓縮的雙分辨率端到端設(shè)計,音頻幀率降到業(yè)界最低的5Hz,在保證語音質(zhì)量的同時節(jié)省近50% GPU計算。

目前,用戶可在魔搭社區(qū)、HuggingFace和GitHub下載模型自行體驗。

熱門文章

0.1309s , 10372.828125 kb

Copyright © 2025 Powered by 節(jié)省近50%GPU計算!通義百聆開源新一代語音交互模型,企業(yè)錄(www.ssc849.cn)-公司信息發(fā)布,網(wǎng)上買賣交易門戶  

sitemap

Top