谷歌Gemini 3发布：表现全面超越上一代模型

已经近一年没有大手笔更新的谷歌 AI Gemini ，今天终于正式发布了 Gemini 3 系列！

谷歌首席执行官桑达尔·皮查伊将其定义为“行业顶尖”，而谷歌DeepMind的首席执行官戴密斯·哈萨比斯更称其为“世界上最好的多模态理解模型”。

与前代产品相比，Gemini 3 Pro在推理、多模态能力和代理工作流方面实现了代际级的飞跃，宣称在几乎所有主流AI基准测试中都全面超越了此前发布的2.5 Pro。

Gemini 3 Pro的发布并非一次简单的升级，而是一次性能的全面跃升，这在多项前沿基准测试中得到了清晰的体现。

在新模型的能力展示中，谷歌强调其在推理和多模态理解上实现了“前所未有的深度与细腻度”，能够更精确地把握问题的深层语境和细微差别，这意味着用户可以更少地依赖反复提示，从而获得更精确和更具洞察力的结果。

在人工智能模型的相对实力盲测榜单LMArena上，Gemini 3 Pro以突破性的1501 Elo得分登顶榜首，遥遥领先。

在衡量通用推理能力的“人类终极考试”（Humanity’s Last Exam）中，该模型取得了37.5%（无工具）的成绩，并在难度极高的高难度科学推理测试GPQA Diamond中拿下了91.9%的顶级表现，这些数据均超越了此前由Gemini 2.5 Pro保持的纪录。

特别值得一提的是，Gemini 3 Pro在结构化逻辑思维与复杂计算方面表现强势提升，其在数学基准测试MathArena Apex中以23.4%的成绩再次刷新纪录。

作为一款真正的原生多模态模型，Gemini 3 Pro在视频和视觉理解能力上同样创造了新的行业标准，在多模态大考MMMU-Pro中得分81%，在视频推理基准Video-MMMU中达到87.6%。

谷歌表示，这些显著的性能提升使得Gemini 3 Pro可以在科学、数学、工程等复杂领域提供更可靠的分析与建议，并且能为每一次交互带来全新的深度体验，回答更加聪明、简洁且直截了当，更倾向于提供具有洞见的结论与判断，充当一个真正的思考伙伴。

Gemini 3 Pro的预览版已于11月18日起在Gemini应用、Search AI Mode、AI Studio、Vertex AI以及谷歌全新推出的代理式开发平台Google Antigravity中开放，并将在未来几周内向Google AI Ultra订阅用户开放增强推理模式——Gemini 3 Deep Think。

另外， Gemini Agent 也上线了。Gemini Agent是基于Gemini 3的智能体，它能自主规划并跨应用执行复杂的多步骤任务，使AI从简单的问答演变为自动化的工作流程协作伙伴。

更多消息请守住 Mdroid。

来源：谷歌1 ， 2

谷歌Gemini 3发布：表现全面超越上一代模型

谷歌Gemini 3发布：表现全面超越上一代模型

关于我们

著作权说明

媒体品牌