本文作者:访客

OpenAI奇袭,谷歌反击

访客 2024-05-16 12:30:27 39624 抢沙发

经济观察网 记者 钱玉娟 北京时间 5 月 15 日凌晨,被美国人工智能研究公司 OpenAI" 截胡 " 的谷歌,如期举办了一年一度的 Google I/O 2024(2024 谷歌开发者大会,下称 " 谷歌 I/O")。

OpenAI奇袭,谷歌反击

大会上,谷歌发布了多个新产品、新工具、新功能,包括:最新款大模型 Gemini1.5 Pro 的上下文窗口从 100 万 tokens(最小输入单元)升级到 200 万,并推出轻量化模型 Gemini 1.5 Flash;推出文生图新模型 Imagen 3、音乐创作大模型 Music AI Sandbox、视频生成模型 Veo;将 AI 融进了搜索功能,将在美国推出 "AI 概览 "(AI Overviews);发布了 AI 通用智能体项目 Project Astra 和谷歌下一代开源模型 Gemma2。

如果没有 OpenAI" 截胡 " 的话,这将是今年科技圈的 " 沸点 "。

在谷歌 I/O 前一日,北京时间 5 月 14 日凌晨,OpenAI 召开了春季发布会。该发布会十分简短,仅花了不到 30 分钟,宣布了全新旗舰模型 GPT-4o,以及在大模型 ChatGPT 中免费提供更多功能。但 GPT-4o 的 " 类人 " 响应速度,让观看者感觉 VPA(虚拟个人助理)的实现指日可待。这让科技圈提前沸腾了。

宝宝树、米茶公社创始人王怀南熬夜观看了 OpenAI 的春季发布会。他也曾是谷歌亚太区 CMO(首席营销官)。他称,老东家(谷歌)5 月 14 日(美国当地时间)在美国加州召开大型产品发布会," 一定是以 AI 为主线条的 "。在他看来,OpenAI 用看似不经意的 26 分钟,挑战了一家公司一年一度的重大发布," 这是一个四两拨千斤的举措 "。

两小时,谷歌连环回击

相比于 OpenAI 不到 30 分钟的春季发布会,谷歌 I/O 花了近两个小时,公布了多个新产品、新工具。

今年谷歌 I/O 的主舞台设在了加州海岸线湖公园内的圆形剧场。开幕前一天,谷歌 CEO 桑达尔 · 皮查伊(SundarPichai)在台侧拍下一张图片,发出了他的第一篇 LinkedIn(领英)帖子,并配文," 迫不及待地想看到这些座位上坐满了来自世界各地的开发者 "。

从目前网络上流出的大会相关图片来看,圆形剧场座无虚席。在大会开场,桑达尔 · 皮查伊也说,现在已经有超过 150 万开发者正在使用谷歌的原生多模态大模型 Gemini。

但这场围绕 AI 的竞赛,还在进行中。

大会上,谷歌宣布诞生一年的 Gemini 实现着能力跃升,除了 1.5 Pro 进阶版的上下文窗口拓展至 200 万个 tokens,轻量级模型 1.5 Flash 的上下文窗口也达到了 100 万个 tokens。Gemini 的功能方面也有不少拓展,例如移动对话体验,交谈更自然,模型也可引入安卓系统的底层,多模态的 Nano 版模型还包括诈骗监测等功能。

谷歌还推出 Imagen 3、Music AI Sandbox、Veo 三个大模型应用。其中视频生成模型 Veo 可以生成超过一分钟的视频,更是被视为谷歌反击 OpenAI 的文生视频大模型 Sora 的产品。

谷歌还发布了 AI 通用智能体项目 Project Astra 和融进了 Gemini 的搜索功能 AI Overviews。

谷歌 DeepMind 的 CEO 戴密斯 · 哈萨比斯(DemisHassabis)首次现身谷歌 I/O。他展示了 Project Astra(高级视觉和对话响应智能体项目,该项目代表着谷歌对人工智能助手的未来愿景),在展示过程中,他一边实时拍摄一边与手机中的 AI Agent(助手)交谈,AI Agent 展现出多模态理解和实时对话能力。

从大会视频来看,Project Astra 的表现不错,虽然它的响应速度比起 " 与人类的响应时间相似 " 的 GPT-4o 要慢一些。如果不是 OpenAI 率先发布了 GPT-4o,ProjectAstra 极有可能是点燃大众对 VPA 畅想的那一个。

在 OpenAI 召开春季发布会之前,市场曾广传 OpenAI 将推出 AI 搜索功能。但本业是搜索的谷歌,率先将 AI 功能放进了自己的搜索业务。

谷歌称,基于最新版本 Gemini,用户可以对搜索引擎提出任何想知道的事情,或者需要做的事情,比如 " 寻找波士顿最好的瑜伽或普拉提工作室 ",除了给出搜索结果,搜索引擎还可以做工作室介绍,给出门店距离、工作时间等信息;当用户需要 " 创建一个饮食计划 " 时,搜索引擎也可以完成。

" 我们最大的投资和创新领域之一,是我们的创始产品——搜索。" 桑达尔 · 皮查伊回顾了谷歌创建搜索至今 25 年的历史,重点分享了在 Gemini 变革下,谷歌 AI 搜索实现的水平提升。

在 OpenAI 缺席 AI 搜索赛道之后,谷歌通过 AI Overview、"Circle to Secarch" 画图即搜功能,以及视频搜索等多个功能的突破,让自家支持多轮推理、规划能力、视频提问等功能的 AI 搜索,面向市场进行展示,也给予竞争对手有力的回击。

谷歌的创新危机

尽管亮相了多项更新和多个产品,也未能完全洗去市场对谷歌创新力的质疑。

接近两个小时的谷歌 I/O,谷歌推出的新产品、新工具、新功能,甚至新基建等,总计数目多到超过二十款,也将谷歌对 AI 的重视和在 AGI(通用人工智能)方向上的发展投入展露无遗。

"(市场侧)对谷歌 I/O 的反馈都很积极。" 一位在谷歌工作十余年的人士称。

但王怀南说:" 谷歌并没有抓到眼球。" 大会上,谷歌从 CEO 到多个产品的总负责人都有出场介绍,OpenAI 的春季发布会仅有三个人出场介绍 GPT-4o,但在王怀南看来,这三个人就 " 完全把背后有数百甚至上千人准备的两个小时的谷歌 I/O 的光芒掩盖掉了 "。

王怀南说:" 如今的谷歌像极了老微软。" 这并不是一个积极的描述。因为对王怀南这种二十多年前从硅谷走出的人来说,微软 " 没有创新,只懂赚钱,没有理想,没有使命,产品混乱 "。

王怀南看完谷歌 I/O 后称,虽然这次谷歌发布的新产品、新工具、新功能、新基建等数量众多,但发布的产品 " 全是保护自己的商业利益和保护搜索的产品 "。时值如此关键的竞争时点,几乎是 " 革命的关头 ",曾经被视为 AI 创新标杆的谷歌却用一个保护性的想法,保护着它现有的搜索习惯和搜索的商业模式,这让他想到了当年的微软。

但如今的微软步伐也轻快了起来。微软不仅巨额投资 OpenAI 旗下的 ChatGPT,还将旗下 Bing 搜索的服务器、搜索数据甚至算力等倾斜支持 OpenAI 进行大模型训练,系列投入让微软 " 跨步走上了 AI 革命的直通车 "。

王怀南称,他看到了一个 " 轻装上阵,不靠搜索吃饭 " 的微软,甚至发现那个 " 老旧的、缓慢的、被动防御的、碎片化的 " 微软,变得灵活且以用户为导向,这就像过去那个 " 凭借创新时不时让大家惊艳到不可思议的老谷歌 "。

这就让谷歌的劲敌不只是年轻的 OpenAI,还有正在改变的微软。

当下的谷歌在迸发活力的 OpenAI 和微软的反衬下," 急需断掉自己创新的原始思维。" 但王怀南同时也称,目前谷歌重投 AI 并进行组织调整的动作,让他看到了想象空间。

搜索引擎起家的谷歌,当前对 AI 的重视程度也越来越高。大会现场,谷歌也统计,桑达尔 · 皮查伊和戴密斯 · 哈萨比斯两个小时主题演讲中,提及 AI 多达 121 次,Gemini 出现的频次并不输于 Google 一词。

但桑达尔 · 皮查伊在大会上也称," 目前谷歌仍处于 AI 平台转型的初期 "。出门问问创始人李志飞也通过社交媒体表示,眼下的 AI 产业也处于早期阶段,无论是技术发展还是商业竞争," 离终局还很远 "。

李志飞称,OpenAI 的一些操作 " 越来越机会驱动 ",除了有心机和谷歌抢头条,创始人 " 言必 AGI" 的状态也不被他看好。基于此,他也称,在沿着惯性和顺着势能一路狂奔的路上,OpenAI 也要考虑一下 " 如何避免成为 AI 时代的先烈 "。

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,39624人围观)参与讨论

还没有评论,来说两句吧...