超越英偉達、谷歌!騰訊KaLM
11月12日消息,英偉今日,達谷“騰訊開源”微信公眾號宣布,歌騰來自騰訊微信團隊的英偉KaLM-Embedding開源模型再創(chuàng)全球新紀錄。
在最新發(fā)布的達谷MTEB多語言通用Embedding模型權威評測中,新一代通用Embedding模型KaLM-Embedding-Gemma3-12B-2511綜合成績?nèi)虻谝?。歌騰
據(jù)介紹,英偉在涵蓋全球1038種語言、達谷共計131項任務的歌騰權威多語言評測體系MTEB中,KaLM-Embedding-Gemma3-12B-2511綜合得分分別達到 72.32(Mean Task)與62.51(Mean TaskType),英偉斬獲全球第一。達谷
超越包括英偉達nvidia/llama-embed-nemotron-8b、歌騰阿里Qwen/Qwen3-Embedding-8B、英偉谷歌Google/gemini-embedding-001等國內(nèi)外主流開源與閉源競品。達谷
KaLM-Embedding-Gemma3-12B-2511核心亮點解析
模型規(guī)模:參數(shù)量提升至120億(12B),歌騰是當前MTEB榜單上最大規(guī)模的Embedding模型之一,顯著增強了模型的表示能力與泛化性能。
跨語言能力:在多語言語義對齊方面實現(xiàn)顯著優(yōu)化,支持更精準的跨語種語義理解與檢索任務。
數(shù)據(jù)質(zhì)量:基于經(jīng)過深度清洗與篩選的大規(guī)模高質(zhì)量語料進行訓練,有效提升語義表示的一致性與可靠性。
訓練策略:采用多階段對比學習、Embedding蒸餾和模型參數(shù)融合等技術,進一步提升模型多維度能力表現(xiàn)與綜合性能。
維度嵌套:支持多種向量維度選擇,涵蓋3840、2048、1024、512、256、128及64等多個層級,滿足不同場景下的高效應用需求。
相關文章:
- 醫(yī)保按病種付費3.0版將發(fā)布 實現(xiàn)醫(yī)保基金高效使用
- 央視:福建艦只有拔罐能用明火 廚房都不行!
- 涉案逾1200萬元!“防水一哥”沒防住電詐:支付工程款時郵箱被入侵
- 比特幣今年慘遭滑鐵盧 樂觀者預測:明年或逆襲成“年度最佳”
- 行業(yè)第一!海爾入選2025中國出海品牌百強TOP3
- 華為完成全球首個極簡基站商用部署:功耗降35%、信號提升50%
- 四川一景區(qū)月薪5萬急招185腹肌帥哥:競爭激烈
- 1499元 華為FreeBuds Pro 5馬年典藏版發(fā)布:馬上有財專屬彈窗、可愛小金馬
- 央視馬年春晚獨家AI云合作伙伴!火山引擎正式官宣
- 小米17 Ultra徠卡版或定價過萬 博主:真的不意外
相關推薦:
- 超級罕見的“三體黑洞”!如此模樣 人類第一次見
- 豆包上車了!深度融入DiLink系統(tǒng):覆蓋比亞迪旗下五大品牌車型
- 無錫市追加1億元購車補貼:不限購車人戶籍 最高1萬元/臺
- 精選牛前腿肉:海底撈潮汕牛肉丸77元2.7斤大促
- 日本開始限購顯卡!16GB+大顯存馬上就買不到了
- Steam Deck的CPU調(diào)度器太優(yōu)秀!Meta大型數(shù)據(jù)中心都在用
- 最高時速120km/h!廣汽L3自動駕駛進入實證測試
- 加速商業(yè)化!OpenAI考慮在ChatGPT內(nèi)投放廣告
- 媽媽看孩子作業(yè)氣得呼吸性堿中毒 醫(yī)生:可以戴個口罩
- 南極現(xiàn)在比北京還暖和!阿維塔回應南極
