GPT-5 AI大模型发布:速度提升高达400%!

GPT-5 AI大模型发布:速度提升高达400%!
AI 大模型领跑者 OpenAI 今天凌晨正式发布了旗下最新的大模型大迭代 – GPT-5!
根据介绍, GPT-5 定位为更安全、可控、可信赖的通用 AI 模型。它不仅延续了前代的基础能力,还在逻辑推理、长文本处理、多模态理解和工具集成方面做出全面升级。
新模型原生支持文本、图像与音频之间的跨模态交互,在实际应用中能更稳健地完成多步骤任务,维持上下文的连贯性,提升信息整合的深度和准确度。
GPT‑5 不再只是一个强大的写作工具,它被设计成能自动调用函数、检索资料、执行脚本甚至编排任务流程的智能体,适用于更复杂的生产场景。

企业用户尤其受益于其更高的输出一致性与系统可控性:模型支持术语表、风格模板与审计记录,可确保内容合规、风格统一并具备可追踪性。
GPT‑5 的发布不仅是一次模型迭代,更是一次系统级的重构。它在多个维度的性能评测中刷新纪录,展现出前所未有的推理能力、多模态理解和工具调用稳定性。
在编码方面,GPT‑5 在 SWE-bench Verified 测试中取得了 74.9% 的准确率,超越了 Claude Opus 4.1(74.5%)和 Gemini 2.5 Pro(59.6%)。在 Aider Polyglot 测试中得分高达 88%,错误率比前代模型 o3 降低了三分之二。不仅能生成高质量代码,还能解释复杂代码库的结构与逻辑,支持多轮协作式开发。
在数学与科学推理方面,GPT‑5 Pro 在 AIME 2025 测试中获得 94.6% 的得分,在 HealthBench Hard 测试中幻觉率仅为 1.6%,远低于 GPT‑4o 的 15.8%。在长文本检索任务中,其准确率达到 89%,并支持高达 400,000 个上下文 token的处理能力。
多模态方面,GPT‑5 原生支持图像、音频与文本的统一语义空间,在 MMMU 测试中得分 84.2%,跨模态任务响应速度提升 400%。它能将手绘图转化为三维动画、将语音讲解与图像同步生成,在教育、医疗、创意等领域展现出极高的实用性。
工具调用方面,GPT‑5 在 τ2-bench telecom 测试中得分 96.7%,刷新业界记录。它能稳定串联数十次工具调用,支持并行执行与状态更新,在复杂任务中保持路径一致性。
此外,GPT‑5 引入了安全补全机制(safe completions),在拒绝回答时能清晰说明原因并提供替代方案,幻觉率比 GPT‑4o 降低约 45%,比 o3 降低约 80%。
安全机制也同步加强,GPT‑5默认以“最小必要”原则处理敏感信息,对违规使用进行更有效识别,并支持人机共治模式。通过灰度部署与红队测试,模型能力在真实世界中渐进提升,同时保障使用边界。
早期使用者已反馈:知识孤岛被打通,多轮客户支持和跨部门任务的处理效率显著提高。GPT‑5 能解释复杂问题,用“教学式语言”回应用户提问,而不是简单堆砌答案。
开发者方面,GPT‑5保持接口兼容性,并新增迁移辅助功能与调用观测指标,让升级过程更平滑。企业则可获得更细粒度的策略控制与私有化选项,匹配不同规模与行业需求。
目前 GPT‑5 已在以下平台上线:
– ChatGPT 全平台:免费用户、Plus、Pro、Team 均可使用,Pro 用户可无限调用 GPT‑5 Pro 版本
– Microsoft Copilot 系列:包括 Microsoft 365 Copilot、GitHub Copilot、Copilot for Windows/macOS/iOS/Android、Azure AI Foundry
– API 平台:提供 gpt-5、gpt-5-mini、gpt-5-nano 三个版本,支持 verbosity 与 reasoning_effort 参数控制
– Codex CLI 与开发工具集成:支持代码编写、调试与部署,已被 Cursor、JetBrains、Vercel 等平台接入
想要尝试 GPT-5 的能力的童鞋们可以在以上平台上手。
更多消息请守住 Mdroid。
来源:OpenAI