GPT-4o很好,但最大亮点可能是免费
5 月 11 日 ZAKER 科技曾报道过,知名外媒记者马克 · 古尔曼爆料苹果即将与 OpenAI 达成协议,为今年的新 iOS 系统提供一些生成式 AI 功能,我们极有可能在在 iOS 18 中用上 ChatGPT。
与此同时,ChatGPT 母公司 OpenAI 也宣布要举行 " 春季更新 " 在线活动。在北京时间 5 月 14 日凌晨 1 点如期举行的发布会上,OpenAI 用 26 分向我们介绍了全新的 GPT-4o,o 代表 Omni model(全能模型),主打可实时进行音频、视觉和文本推理功能。
GPT-4o 更 " 像人 " 了
GPT-4o 的主要升级点在于打通任何文本、音频和图像的输入,相互之间可以直接生成,无需中间转换;此外 GPT-4o 语音延迟大幅降低,能在 232 毫秒内回应音频输入,平均为 320 毫秒,这与对话中人类的响应时间相似。
发布会上,OpenAI 联合创始人兼总裁格雷格 · 布罗克曼(Greg Brockman)还将旧版本只具备对话功能的 ChatGPT,与基于 GPT-4o 发布的具备视觉能力的新版 ChatGPT 进行了 5 分钟的对话。
GPT-4o 不仅能通过视觉 AI 能力理解摄像头中发生的事情,同时还能够将理解的内容通过语音与旧版本 ChatGPT 交互,进行更加丰富有趣的互动。同时还支持中途打断和对话插入,且具备上下文记忆能力。
可以说从实际演示效果方面它延续了 OpenAI 一贯以来的 " 炸裂 "" 精彩 ",GPT-4o 对话之流畅、理解之迅速,很难不让人以为手机的后面是一个活生生的人,但实际上真人可能并不具备 GPT-4o 强大的检索能力和问题解答能力。
而且 GPT-4o 对广大用户来说它有个远超 GPT-4 的优点:免费。
体验 GPT-4 级别的智能、从模型和网络获取响应、分析数据并创建图表、聊一聊你拍的照片、上传文件以获取摘要、写作或分析帮助、使用 GPTs 和 GPT Store、通过 Memory 构建更加有帮助的体验,这些功能全部可以免费获得。
要知道 GPT-4 Plus 版本就因为收费贵、付款麻烦,使用门槛高让绝大部分人望而却步,能让更多的人用上便是 GPT-4o 的最大亮点。
或只是 GPT 版 Siri 的提前预览?
但从大家对 OpenAI 的期待来看,尽管 GPT-4o 很强,但也让人意犹未尽。从实际体验来看 GPT-4o 更像一款加强版的聊天机器人,更确切地说像一个加入 GPT 的 Siri,很难让人不怀疑,苹果和 OpenAI 合作之后提供的 Siri 会不会就是这个模样。
特别是在预告中 OpenAI 公司的 CEO Altman 甚至用上了 " 魔法 " 二字,相比之下 GPT-4 的神通广大、Sora 那种神笔马良的既视感,GPT-4o 显然称不上魔法。
而且从多模态能力方面考察,GPT-4o 的能力并没有比上代有明显提升。哪怕是和 GPT 的老对手 Anthropic 的 Claude 3 相比也没有拉开差距,可以说从模型能力来看 GPT-4o 和 GPT-4 没有本质区别。
或许是早有预料,对此 OpenAI 的公关团队已经准备好了话术,发布会现场以及会后 Altman 发布的博客中对此解释道:
" 我们使命的一个关键部分是将非常强大的人工智能工具免费(或以优惠的价格)提供给人们。我非常自豪我们在 ChatGPT 中免费提供了世界上最好的模型,没有广告或类似的东西。
当我们创办 OpenAI 时,我们最初的想法是我们要创造人工智能并利用它为世界创造各种利益。相反,现在看起来我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,让我们所有人都受益。"
总而言之,OpenAI 在 5 月 13 日为我们带来的或许只是升级版、更像 Siri 的 GPT-4,大家如果期待 GPT-5 的出现,还需要等上一段时日。不过用户能免费用上能力等同于 GPT-4 的 AI,也是一件大好事。
当前 GPT-4o 已经可以在 OpenAI 官网体验了。
参考资料:
1、OpenAI 没有王炸 虎嗅网
2、OpenAI 发布全能模型 GPT-4o!速度提升 200% 支持实时音视频交互 新浪科技
3、OpenAI 用 26 分钟改变世界!免费版 GPT-4 来了,视频语音交互快进到科幻片 爱范儿
还没有评论,来说两句吧...