一夜封神!谷歌Gemini 3.0 Pro發(fā)布即屠榜 馬斯克奧特曼祝賀點贊
時間:2025-12-30 12:38:31 出處:百科閱讀(143)
11月19日消息,夜封谷歌最新一代推理模型Gemini 3.0 Pro正式發(fā)布,神谷斯克并同步在Google AI Studio推出預覽版,發(fā)布開放API接口。即屠該模型即將陸續(xù)登陸谷歌旗下各類產品。榜馬
值得玩味的奧特是,OpenAI聯合創(chuàng)始人兼CEO薩姆·阿爾特曼與xAI創(chuàng)始人埃隆·馬斯克先后向谷歌發(fā)來“賀電”。曼祝阿爾特曼在推特上評價“Gemini 3看起來很不錯”,賀點谷歌CEO桑達爾·皮查伊僅以一個表情包輕松回應。夜封
一經發(fā)布,神谷斯克Gemini 3 Pro幾乎橫掃各大評測榜單,發(fā)布在LMArena大模型競技場中以1501的即屠Elo得分高居榜首。
根據谷歌公布的榜馬測試數據,Gemini 3 Pro毫無爭議地成為當前全球數學能力最強的奧特AI。在被譽為“地獄難度”的曼祝數學競賽基準MathArena中,當GPT-5.1等其他大模型仍在1%左右徘徊時,Gemini 3 Pro一舉達到23.4%,遙遙領先。
編程能力方面,盡管在SWE-Bench上未取得SOTA成績,但仍穩(wěn)居第一梯隊。其在Live Code Bench的Elo得分突破2400分,并在工具調用與終端操作基準測試中排名第一。
更令人震撼的是其視覺理解能力:對屏幕截圖的理解準確率高達72.7%,達到現有最先進水平的兩倍。這意味著AI Agent將不再是“視覺障礙者”,有望徹底重塑AI操作計算機的交互模式。
此外,谷歌還同期發(fā)布了自家的Agentic編程平臺——Google Antigravity,再添一枚“技術砝碼”。
根據Model Card披露,Gemini 3 Pro在推理、多模態(tài)、Agent工具使用等關鍵基準測試中實現了全面領先。
在硬件層面,Gemini 3 Pro基于谷歌自研的張量處理單元(TPU)訓練。相比CPU,TPU在處理大語言模型所需的大規(guī)模計算時速度更快,其配備的大容量高帶寬內存也使其能夠高效運行超大模型與批量數據。
在實際應用上,最新發(fā)布的Gemini Agent實驗功能已能自主執(zhí)行多步驟復雜流程。例如,用戶只需提出“整理一下我的收件箱”,它即可自動優(yōu)先安排待辦事項,并起草郵件回復供用戶確認。
目前,Gemini 3預覽版正逐步開放:所有用戶可通過Gemini應用使用;Google AI Pro與Ultra訂閱用戶可在搜索的AI模式中體驗;開發(fā)者可通過Gemini API、Google Antigravity及Gemini CLI訪問;企業(yè)用戶則通過Vertex AI與Gemini Enterprise獲取服務。
猜你喜歡
- 硬件工具HWMonitor更新:支持Medusa Point、9850X3D及Arrow Lake Refresh
- 封面新聞接入伙伴開源的鴻蒙RdbStore數據庫組件 提效鴻蒙應用開發(fā)
- 轉發(fā)周知:熬夜后多吃3類食物補救
- 比純凈水還便宜!北方神樺白樺樹汁0.86元/瓶清倉
- Mozilla宣布Firefox瀏覽器全面AI化!開發(fā)社群直接翻臉
- 首款2nm芯片三星Exynos 2600沒有集成5G基帶:需要單獨外掛
- 包攬亞馬遜歐亞 10 國銷冠 VITURE 穩(wěn)居三季度美國 AR 市場冠軍
- 手機一晃就被迫看廣告!App廣告亂跳轉亟待治理
- 微信簡直弱爆了!傳文件還得看QQ:10GB秒傳