11月19日消息,夜封谷歌最新一代推理模型Gemini 3.0 Pro正式發(fā)布,神谷斯克并同步在Google AI Studio推出預(yù)覽版,發(fā)布開放API接口。即屠該模型即將陸續(xù)登陸谷歌旗下各類產(chǎn)品。榜馬
值得玩味的奧特是,OpenAI聯(lián)合創(chuàng)始人兼CEO薩姆·阿爾特曼與xAI創(chuàng)始人埃隆·馬斯克先后向谷歌發(fā)來“賀電”。曼祝阿爾特曼在推特上評價“Gemini 3看起來很不錯”,賀點(diǎn)谷歌CEO桑達(dá)爾·皮查伊僅以一個表情包輕松回應(yīng)。夜封
一經(jīng)發(fā)布,神谷斯克Gemini 3 Pro幾乎橫掃各大評測榜單,發(fā)布在LMArena大模型競技場中以1501的即屠Elo得分高居榜首。
根據(jù)谷歌公布的榜馬測試數(shù)據(jù),Gemini 3 Pro毫無爭議地成為當(dāng)前全球數(shù)學(xué)能力最強(qiáng)的奧特AI。在被譽(yù)為“地獄難度”的曼祝數(shù)學(xué)競賽基準(zhǔn)MathArena中,當(dāng)GPT-5.1等其他大模型仍在1%左右徘徊時,Gemini 3 Pro一舉達(dá)到23.4%,遙遙領(lǐng)先。
編程能力方面,盡管在SWE-Bench上未取得SOTA成績,但仍穩(wěn)居第一梯隊(duì)。其在Live Code Bench的Elo得分突破2400分,并在工具調(diào)用與終端操作基準(zhǔn)測試中排名第一。
更令人震撼的是其視覺理解能力:對屏幕截圖的理解準(zhǔn)確率高達(dá)72.7%,達(dá)到現(xiàn)有最先進(jìn)水平的兩倍。這意味著AI Agent將不再是“視覺障礙者”,有望徹底重塑AI操作計(jì)算機(jī)的交互模式。
此外,谷歌還同期發(fā)布了自家的Agentic編程平臺——Google Antigravity,再添一枚“技術(shù)砝碼”。
根據(jù)Model Card披露,Gemini 3 Pro在推理、多模態(tài)、Agent工具使用等關(guān)鍵基準(zhǔn)測試中實(shí)現(xiàn)了全面領(lǐng)先。
在硬件層面,Gemini 3 Pro基于谷歌自研的張量處理單元(TPU)訓(xùn)練。相比CPU,TPU在處理大語言模型所需的大規(guī)模計(jì)算時速度更快,其配備的大容量高帶寬內(nèi)存也使其能夠高效運(yùn)行超大模型與批量數(shù)據(jù)。
在實(shí)際應(yīng)用上,最新發(fā)布的Gemini Agent實(shí)驗(yàn)功能已能自主執(zhí)行多步驟復(fù)雜流程。例如,用戶只需提出“整理一下我的收件箱”,它即可自動優(yōu)先安排待辦事項(xiàng),并起草郵件回復(fù)供用戶確認(rèn)。
目前,Gemini 3預(yù)覽版正逐步開放:所有用戶可通過Gemini應(yīng)用使用;Google AI Pro與Ultra訂閱用戶可在搜索的AI模式中體驗(yàn);開發(fā)者可通過Gemini API、Google Antigravity及Gemini CLI訪問;企業(yè)用戶則通過Vertex AI與Gemini Enterprise獲取服務(wù)。