GPT-4发布:支持图像识别,ChatGPT即日升级!

GPT-4发布:支持图像识别,ChatGPT即日升级! 1

GPT-4发布:支持图像识别,ChatGPT即日升级!

生成式 AI 对话聊天语言大模型 GPT 发布巨大更新 GPT-4!

在 ChatGPT 引爆科技领域之后,人们一直在讨论AI的下一步发展会是什么,很多学者都提到了多模态,今天它终于来了 – Open AI 昨晚正式发布多模态预训练大模型GPT-4。

GPT-4实现了以下几个方面的重大提升:强大的图像识别能力;文字输入限制提升至2.5万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。

Open AI 工程师在介绍视频中表示:“GPT-4是世界上第一款高体验、强能力的先进AI系统,我们希望很快把它推向全球人民。”

Open AI 发布了技术报告和系统卡,将 ChatGPT 直接升级为 GPT-4 版本,并开放了 GPT-4 的 API

此外,微软营销主管在 GPT-4 发布后第一时间表示:“如果你在过去六周内使用了新版必应 new Bing 预览版,那么你已经提前了解到 Open AI 最新模型的强大功能。”是的,微软的新版必应已经使用了GPT-4。

GPT-4 是一个大规模的多模态模型,能够处理文本和图像输入,并输出正确的文本回复。

GPT-4发布

经过实验测试,GPT-4 在各种专业测试和学术基准上的表现与人类水平相当。例如,在模拟律师考试中,它的得分在应试者中排名前 10% 左右,而相比之下,GPT-3.5 的得分在倒数 10% 左右。

Open AI 花费了 6 个月的时间,使用对抗性测试程序和 ChatGPT 的经验教训对 GPT-4 进行迭代调整,从真实性和可控性等方面获得了历史上最佳的结果。

GPT-4发布:支持图像识别,ChatGPT即日升级! 2

在过去的两年里,Open AI 重建了整个深度学习堆栈,并与 Azure 合作为其工作负载设计了一台超级计算机。

Open AI 通过 ChatGPT 和 API 发布了 GPT-4 的文本输入功能。为了使图像输入功能更具普适性,Open AI 正在与其他公司展开合作。

有趣的是,GPT-3.5 和 GPT-4 之间的区别很微妙。当任务的复杂性达到足够的阈值时,差异就会出现,GPT-4 比 GPT-3.5 更可靠、更具创造性,并且能够处理更细微的指令。为了了解这两个模型之间的差异,OpenAI 在各种基准和一些为人类设计的模拟考试上进行了实验。

GPT-4发布:支持图像识别,ChatGPT即日升级! 3

Open AI 对 GPT-4 进行了传统基准测试,这些测试是为机器学习模型设计的。结果表明,GPT-4在这些测试中远优于现有的大型语言模型和大多数最先进模型(SOTA)。

当然,GPT-4 最重要的升级在于可支持图像提示和生成,并且其新的功能与纯文本输入模式并行,使用户能够针对任何视觉或语言任务进行指定。

GPT-4发布:支持图像识别,ChatGPT即日升级! 4 GPT-4发布:支持图像识别,ChatGPT即日升级! 5

具体而言,它可以生成针对人类提供的散布文本和图像的输入所对应的文本输出(如自然语言或代码)。在多个领域,包括涉及文本和照片的文档、图表或屏幕截图等,GPT-4 展示了类似于纯文本输入的功能。

想要了解更多关于 GPT-4 可以查看 Open AI 网站

GPT-4发布:支持图像识别,ChatGPT即日升级! 6

如果想今天就开始试用基于 GPT-4 的 ChatGPT,则需要订阅 ChatGPT Plus ,每月 20 美元。

更多消息请守住 Mdroid

来源:Mashable

关注Mdroid中文科技网: