豆包語(yǔ)音識(shí)別模型2.0發(fā)布:能聽(tīng)懂字看懂圖 支持13種外語(yǔ)
時(shí)間:2025-12-29 11:36:52 出處:綜合閱讀(143)
12月5日消息,豆包懂字今日,語(yǔ)音火山引擎發(fā)布豆包語(yǔ)音識(shí)別模型2.0(Doubao-Seed-ASR-2.0),識(shí)別依托Seed混合專家大語(yǔ)言模型架構(gòu)構(gòu)建。模型
據(jù)介紹,發(fā)布2.0版本模型推理能力提升,看懂可以通過(guò)深度理解上下文完成精準(zhǔn)識(shí)別,圖支上下文整體關(guān)鍵詞召回率提升20%。持種
同時(shí)支持多模態(tài)視覺(jué)識(shí)別,外語(yǔ)不僅“聽(tīng)懂字”還能“看懂圖”,豆包懂字通過(guò)單圖和多圖等視覺(jué)信息輸入讓文字識(shí)別更精準(zhǔn)。語(yǔ)音
此外,識(shí)別2.0版本還支持日語(yǔ)、模型韓語(yǔ)、發(fā)布德語(yǔ)、看懂法語(yǔ)等 13 種海外語(yǔ)種的精準(zhǔn)識(shí)別。
并且重點(diǎn)針對(duì)專有名詞、人名、地名、品牌名稱及易混淆多音字等復(fù)雜場(chǎng)景進(jìn)行了升級(jí)。
以歷史人物生平討論場(chǎng)景為例,當(dāng)用戶提及蘇轍貶謫地“筠(yún)州”時(shí),如果模型缺乏推理能力會(huì)易將其誤識(shí)別為同音的“云州”“鄆州”等。
而豆包語(yǔ)音識(shí)別模型2.0可依托“當(dāng)前討論蘇軾、蘇轍”這一背景,即便上下文從沒(méi)出現(xiàn)過(guò)“筠州”,也能通過(guò)邏輯推理鎖定用戶所指的特定地名,最終實(shí)現(xiàn)對(duì)多音字地名的精準(zhǔn)識(shí)別。
目前,豆包語(yǔ)音識(shí)別模型2.0已上線火山方舟體驗(yàn)中心并對(duì)外提供API服務(wù)。
猜你喜歡
- 北京市機(jī)關(guān)事務(wù)管理局原黨組成員、副局長(zhǎng)楊文勝接受審查調(diào)查
- 聯(lián)發(fā)科天璣9500s來(lái)了:OPPO K15 Turbo全球首發(fā)
- 麗江旅拍協(xié)會(huì)回應(yīng)文旅局喊話小紅書(shū):此前曾與平臺(tái)溝通 現(xiàn)已放棄 計(jì)劃起訴
- 小米17 Ultra徠卡版來(lái)了!盧偉冰:徠卡深度參與 共同設(shè)計(jì)
- 硬件工具HWMonitor更新:支持Medusa Point、9850X3D及Arrow Lake Refresh
- 水洗標(biāo)寫(xiě)的100%羊毛其實(shí)不是羊毛 怎么這年頭要這么騙我
- 提前7天 比亞迪方程豹完成2025年銷(xiāo)量目標(biāo)!
- 鴻蒙最強(qiáng)影像旗艦已在路上!華為Pura 90全系回歸直屏:尺寸變大了
- 瑪莎拉蒂車(chē)主換小米YU7:感謝雷軍 打破我堅(jiān)定的油車(chē)主義