谷歌Gemini 3发布:表现全面超越上一代模型

谷歌Gemini 3发布:表现全面超越上一代模型 1

谷歌Gemini 3发布:表现全面超越上一代模型

已经近一年没有大手笔更新的谷歌 AI Gemini ,今天终于正式发布了 Gemini 3 系列!

谷歌首席执行官桑达尔·皮查伊将其定义为“行业顶尖”,而谷歌DeepMind的首席执行官戴密斯·哈萨比斯更称其为“世界上最好的多模态理解模型”。

与前代产品相比,Gemini 3 Pro在推理、多模态能力和代理工作流方面实现了代际级的飞跃,宣称在几乎所有主流AI基准测试中都全面超越了此前发布的2.5 Pro。

Gemini 3 Pro的发布并非一次简单的升级,而是一次性能的全面跃升,这在多项前沿基准测试中得到了清晰的体现。

谷歌Gemini 3发布:表现全面超越上一代模型 2

在新模型的能力展示中,谷歌强调其在推理和多模态理解上实现了“前所未有的深度与细腻度”,能够更精确地把握问题的深层语境和细微差别,这意味着用户可以更少地依赖反复提示,从而获得更精确和更具洞察力的结果。

在人工智能模型的相对实力盲测榜单LMArena上,Gemini 3 Pro以突破性的1501 Elo得分登顶榜首,遥遥领先。

在衡量通用推理能力的“人类终极考试”(Humanity’s Last Exam)中,该模型取得了37.5%(无工具)的成绩,并在难度极高的高难度科学推理测试GPQA Diamond中拿下了91.9%的顶级表现,这些数据均超越了此前由Gemini 2.5 Pro保持的纪录。

特别值得一提的是,Gemini 3 Pro在结构化逻辑思维与复杂计算方面表现强势提升,其在数学基准测试MathArena Apex中以23.4%的成绩再次刷新纪录。

作为一款真正的原生多模态模型,Gemini 3 Pro在视频和视觉理解能力上同样创造了新的行业标准,在多模态大考MMMU-Pro中得分81%,在视频推理基准Video-MMMU中达到87.6%。

谷歌表示,这些显著的性能提升使得Gemini 3 Pro可以在科学、数学、工程等复杂领域提供更可靠的分析与建议,并且能为每一次交互带来全新的深度体验,回答更加聪明、简洁且直截了当,更倾向于提供具有洞见的结论与判断,充当一个真正的思考伙伴。

Gemini 3 Pro的预览版已于11月18日起在Gemini应用、Search AI Mode、AI Studio、Vertex AI以及谷歌全新推出的代理式开发平台Google Antigravity中开放,并将在未来几周内向Google AI Ultra订阅用户开放增强推理模式——Gemini 3 Deep Think。

Gemini 3

另外, Gemini Agent 也上线了。Gemini Agent是基于Gemini 3的智能体,它能自主规划并跨应用执行复杂的多步骤任务,使AI从简单的问答演变为自动化的工作流程协作伙伴。

更多消息请守住 Mdroid

来源:谷歌12