您現(xiàn)在的位置是:企業(yè)錄(www.ssc849.cn)-公司信息發(fā)布,網(wǎng)上買賣交易門戶 > 百科
Kimi最強(qiáng)開源思考模型 Kimi K2 Thinking發(fā)布:推理等超越GPT
企業(yè)錄(www.ssc849.cn)-公司信息發(fā)布,網(wǎng)上買賣交易門戶2025-12-30 01:18:36【百科】4人已圍觀
簡(jiǎn)介11月7日消息,日前,月之暗面宣布發(fā)布Kimi K2Thinking,這是Kimi 迄今能力最強(qiáng)的開源思考模型。目前,該模型已上線kimi.com和最新版Kimi手機(jī)應(yīng)用的常規(guī)對(duì)話模式。據(jù)了解,Kim
11月7日消息,最強(qiáng)日前,開源月之暗面宣布發(fā)布Kimi K2 Thinking,思考這是模型Kimi 迄今能力最強(qiáng)的開源思考模型。
目前,布推該模型已上線kimi.com和最新版Kimi手機(jī)應(yīng)用的最強(qiáng)常規(guī)對(duì)話模式。
據(jù)了解,開源Kimi K2 Thinking原生掌握“邊思考,思考邊使用工具”的模型能力,在人類最后的布推考試(Humanity's Last Exam)、自主網(wǎng)絡(luò)瀏覽能力(BrowseComp)、最強(qiáng)復(fù)雜信息收集推理(SEAL-0)等多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)達(dá)到SOTA水平,開源超越GPT-5。思考
在Agentic搜索、模型Agentic編程、布推寫作和綜合推理能力等方面也取得全面提升。
據(jù)介紹,該模型無需人類干預(yù),即可自主實(shí)現(xiàn)高達(dá)300輪的工具調(diào)用和持續(xù)穩(wěn)定的多輪思考能力,從而幫助用戶解決更復(fù)雜的問題。
人類最后的考試是一項(xiàng)涵蓋100多個(gè)專業(yè)領(lǐng)域的終極封閉式學(xué)術(shù)測(cè)試。
在允許使用工具——搜索、Python、網(wǎng)絡(luò)瀏覽工具的同等情況下,Kimi K2 Thinking在這項(xiàng)基準(zhǔn)評(píng)測(cè)中取得了44.9%的SOTA成績(jī)。
根據(jù)官方示例顯示,Kimi K2 Thinking經(jīng)過5輪搜索和推理,結(jié)合每輪搜索到的新信息,層層深入,最終推理出了答案:
此外,在復(fù)雜搜索和瀏覽場(chǎng)景中,Kimi K2 Thinking模型也表現(xiàn)出色。
BrowseComp是由OpenAI發(fā)布的一個(gè)專門評(píng)估AI Agent網(wǎng)絡(luò)瀏覽能力的基準(zhǔn)測(cè)試,這項(xiàng)測(cè)試的初衷是衡量AI Agent在信息過載環(huán)境中展現(xiàn)出的堅(jiān)持性與創(chuàng)造力,即能否像人類研究員一樣“刨根問底”。
在這項(xiàng)極具挑戰(zhàn)的任務(wù)上,人類平均只能達(dá)到29.2%的成績(jī)。
Kimi K2 Thinking在這項(xiàng)基準(zhǔn)測(cè)試中展現(xiàn)出極強(qiáng)的鉆研能力,以60.2%的成績(jī)成為新的SOTA模型。
在長(zhǎng)程規(guī)劃和自主搜索能力的驅(qū)動(dòng)下,Kimi K2 Thinking可借助多達(dá)上百輪的“思考→搜索→瀏覽網(wǎng)頁→思考→編程”動(dòng)態(tài)循環(huán),持續(xù)地提出并完善假設(shè)、驗(yàn)證證據(jù)、進(jìn)行推理,并構(gòu)建出邏輯一致的答案。
這種邊主動(dòng)搜索邊持續(xù)思考的能力,使Kimi K2 Thinking能夠?qū)⒛:议_放式的問題分解為清晰、可執(zhí)行的子任務(wù)。
在官方示例中,Kimi K2 Thinking經(jīng)過兩輪搜索和思考,先根據(jù)股票回購的已知信息找到了這家制造快速的公司,然后在美國(guó)證券交易委員會(huì)(SEC)的官網(wǎng)上找到了股票回購公告信息,得出了準(zhǔn)確的答案:
很贊哦!(63562)
相關(guān)文章
- 比亞迪海豚降維打擊!進(jìn)軍韓國(guó)市場(chǎng)定價(jià)僅10萬元左右
- 中國(guó)手機(jī)在巴西推進(jìn)本土化生產(chǎn):平均每22.5秒就能下線一部
- 62歲李連杰脫上衣辟謠換心臟:年輕和心態(tài)有很大關(guān)系
- 大疆全景相機(jī)爆賣:三季度出貨量29萬臺(tái)、銷售額8.6億元
- 艾邁斯歐司朗推出以人眼安全為核心設(shè)計(jì)準(zhǔn)則的LED驅(qū)動(dòng)芯片方案
- 新突破!全球首款人工神經(jīng)元1M1T1R問世
- 10.99—14.99萬元!長(zhǎng)安啟源A06定價(jià)權(quán)益正式公布:六款純電、兩款增程
- 十五運(yùn)今日開幕!一起回顧全運(yùn)66載難忘瞬間
- 普京視察俄聯(lián)合部隊(duì)集群一指揮所聽取戰(zhàn)事報(bào)告
- 全運(yùn)會(huì)的魅力,藏在這些“不一樣”里
熱門文章
站長(zhǎng)推薦

強(qiáng)鎮(zhèn)觀察:“產(chǎn)城人”融合如何擦亮國(guó)字號(hào)“金名片”?

純白外觀設(shè)計(jì)!微星X870E TOMAHAWK MAX WIFI PZ背插主板首發(fā)3299元

999元 特斯拉磁懸浮Cybertruck車模上架中國(guó)官網(wǎng):1:24精準(zhǔn)還原

千萬別再用了!央視實(shí)測(cè):電線捆扎一團(tuán)更易起火

震蕩前行:2025年十大國(guó)際軍情動(dòng)向

仰望U9平替!騰勢(shì)Z紐北測(cè)試諜照曝光 還有軟頂敞篷版

美光退出中國(guó)數(shù)據(jù)中心市場(chǎng)!一紙禁令 收入歸零

同心筑夢(mèng) 灣區(qū)煥彩 十五運(yùn)會(huì)開幕式三大亮點(diǎn)提前看