本文作者:访客

大模型价格战开局40天:羊毛出在猪身上,AI独角兽很受伤

访客 2024-06-16 18:14:31 83252 抢沙发

本文来源:时代周报 作者:申谨睿

大模型价格战开局40天:羊毛出在猪身上,AI独角兽很受伤

图源:Pixabay

短短一年,大模型的赛制已经从资格赛进阶至淘汰赛——刚刚迈过资金准入门槛的大模型厂商,火急火燎地卷进了价格战的漩涡。

这场价格鏖战始于私募巨头幻方量化旗下的 AI 公司 DeepSeek。5 月 6 日,DeepSeek 宣布开源第二代 MoE 大模型 DeepSeek-V2,标价为 GPT-4-Turbo 的近 1%,百万 tokens 只需 1 元。

智谱紧随其后,于 5 月 11 日称个人版 GLM-3Turbo 调用价格从 5 元 / 百万 tokens 降低至 1 元 / 百万 tokens。

4 天后,字节跳动也加入了价格屠夫的阵营,打着低于行业平均价 99.3% 的旗号,宣布豆包 Pro 32k 模型 0.8 厘 / 千 tokens,用户花 1 元可获取与 5 本《新华字典》相当的数据量。

接下来的一周内,阿里、百度和腾讯等互联网大厂和垂直赛道头部玩家科大讯飞相继释放了降价信号。阿里云宣布通义千问 9 款模型一起降价,其中主力模型 Qwen-Long 直降 97%;百度智能云则直接宣布文心大模型两大主力模型 ERNIE Speed 和 ERNIE Lite 免费;腾讯云则称,其主力模型之一混元 -lite 模型的价格从 0.008 元 / 千 tokens 调整为全面免费,其他模型降幅最高达 87.5%;而科大讯飞则表示轻量级模型 API 永久免费。

实际上,OpenAI 也是降价阵营的主力军,其最新模型 GPT-4o 价格较 GPT-4-Turbo 再次减半,这是自 2023 年初以来 OpenAI 进行的第 4 次降价。按照 OpenAI 的预期,其大模型将以每年 50%-75% 的幅度继续下调。

回溯出行、本地生活、新能源车等领域,每个赛道的决胜局都少不了价格战。然而当前大模型盈利前景尚不明朗,价格战却早早脱胎于无形,竞争的激烈程度可见一斑。

" 价格战一般存在于行业中后期,即技术成熟、市场完善、竞争格局清晰之时,各占山头的企业通过压低价格来抢夺对手的蛋糕。"AI 投资人刘柯(化名)向时代周报记者称,大模型厂商间的比拼比新能源车领域还要猛烈,他们前期烧掉的资金还没有收回来,急于投身价格战无疑要承担巨大的资金风险。

价格战的早产,将本就金鼓连天的大模型赛道推向白热化。

近日,估值 10 亿美元的 Stability AI 资金链断裂,正在寻求被收购;融资近 5 亿美元的 Adept,正在与互联网大厂洽谈出售事宜;清华系大模型公司衔远科技传出了人事变动。据悉,公司创始人周伯文已不再主持公司事物,多位业务负责人也在今年春节前后离职。每日经济新闻报道称,出现该变动的原因是公司 " 产品迟迟无法落地,商业化进展缓慢 "。

另时代周报记者从一位 AI 投资人处获悉,另一家清华系大模型明星企业深言科技也正经历发展瓶颈。该投资人称,深言科技创始成员大额套现,产品研发进展缓慢,部分团队核心成员已将主要精力放回学业。时代周报记者就该问题尝试联系深言科技创始人岂凡超进行核实,截至发稿未得到回复。

大模型价格下调已成趋势,厂商该如何平衡成本与支出?谁会是这场战役的受益方?腰部大模型企业又该怎样迎战?

价格下跌一大截,技术前进一小步

大模型厂商的降价手段与互联网企业有所不同。无论是网约车,还是电商和外卖行业,所谓价格战往往通过巨额补贴来实现。而大模型的降价逻辑是通过技术手段的驱动,重构生产函数,提升研发效率来压低成本。

随着模型工程化、架构、系统手段不断优化,推理成本的减少有效带动了模型降价。DeepSeek-V2 的一篇论文中称,研发团队利用 MLA(Multi-head Latent Attention,多头潜在注意力)结合 MoE(Mixture-of-Experts 专家混合模型),实现了模型性能跨级别提升,同时减少了计算量、推理现存及成本。

但推理成本的降低,只能算模型厂商们向前迈的一小步。零一万物 CEO 李开复此前表示,整个行业每年降低 10 倍推理成本是可以期待的,而且必然也应该发生。" 降低模型推理成本并不难,难的是探索模型综合能力的上限,模型能力提升,才能带来 API 商业模式的持续增长。"Minimax 创始人闫俊杰也表达了相同观点。

无奈在模型能力相近的情况下,国内厂商只能先简后繁。

目前,大模型价格战仅限于推理所用的 token 降价层面。token 是自然语言模型处理文本的最小单位。大模型厂商在训练出闭源大模型后,会将其 API(应用程序编程接口)出售给开发者并收取费用。这种主流商业模式的计费法则一般依靠 token 所对应的汉字、字母的使用量来计算。

token 并非大模型的全部。下游企业在获取大模型 API 后还需通过投喂数据、微调等方式进行模型优化和部署,而这些成本依旧昂贵。比如阿里的 Qwen-Turbo 大模型,进行百万个 tokens 推理只需要 2 元,若继续进行训练,则需要花费 30 元,具体部署时,每月则需要 2 万元。

而百度云的千帆大模型平台虽然有两款大模型可以免费调用,但是模型部署、精调、评估、数据管理、插件调用等环节都需要按量付费。以最基础的模型部署为例,客户租赁 5 天私有资源池至少需要 7000 元。

时代周报记者还注意到,大模型厂商的降价并没有覆盖全线产品。如阿里、百度降价幅度最高的产品都是其轻量模型,主要适用于使用频次不高、推理量不太大、任务处理量不太复杂的中小企业、开发者在短期内使用。

显然,大模型企业见缝插针卷价格,很大程度上还是为了制造噱头吸引用户,以缓解 API 这一模式的增长焦虑。

为了提高大模型的 API 调用量,大模型厂商始终不遗余力地探索降低 AI 应用门槛的方法,让更多的人先用起来。百度云在 2023 年曾推出了模型开发工具 Model Builder 和 AI 应用开发工具 AppBuilder。今年 4 月,其又联合有渠道、场景的供应商一起合作服务客户,希望进一步拉升文心大模型标准化的 API 调用量。

百度公布的最新数据显示,文心大模型日处理文本 2500 亿 token,另一大厂字节跳动日均处理 1200 亿 token。这其中很大一部分是公司内部业务在调用做 AI 应用和业务探索。可见,标准化的模型 API 并没有迎来确定性的增长。

2023 年年底,The information 称 OpenAI 的年度经常性收入已经达到了 16 亿美元,只不过,如此体量的营收相比其百亿美金级别的研发成本而言也还是杯水车薪。

羊毛出在猪身上,价格战喂饱云厂商

官方辞令背后,这场价格战更像是云厂商在另一赛道布下的战局——用低价的大模型引流,带动背后公有云服务的销售。IDC 数据显示,2023 上半年中国大陆公有云市场同比增速放缓至 15.9%,这一增速在 2023 下半年进一步放缓至 9.5%。

官宣降价后,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,公有云的技术红利和规模效应,带来巨大的成本和性能优势,能大幅压缩模型推理成本、加快推理速度。

随后,在百川智能新一代基座大模型 Baichuan 4 的发布会上,创始人王小川表示,价格战核心要看背后的商业模式是什么,如果是做 to B 服务的,降价的根本目标不是为了卖大模型本身,而是带动整套云服务的销售。这推动云厂商从偏传统的服务模式,进入到一个新战场。

猎豹移动董事长兼 CEO 傅盛也在朋友圈发文称,这次价格战,降得最凶的都是有云服务的大公司,通过大模型来获取云客户,羊毛出在猪身上,降得起。

此前,大模型为公有云带来的增量很小。拿百度举例,2024 年一季度百度云收入为 47 亿元,同比增长 12%,其中 6.9% 的云收入来自外部客户使用大模型及生成式 AI 相关服务。以此测算,当季生成式 AI 给百度云带来的收入约为 3.24 亿元。

阿里云在大模型降价后的第二天就推出了上云优惠。包括首次推出 5 亿元算力补贴,以及为 200 余款云产品制定折扣价,这些产品包括覆盖 GPU、云服务器、大模型训练与推理服务等产品。

" ‘公有云 +API ’被认为是企业使用大模型更具性价比的模式,哪怕 AI 利润暂时比较薄,只要有足够多的客户上公有云,云厂商便能吸引用户购买计算、存储、网络和安全等基础产品。" 科技分析师李笑霖告诉时代周报记者。

李笑霖还表示,低价策略主要利好 to B 的大模型厂商。" 随着越来越多的开发者被吸引进来,更多新的落地场景将随之被激活。而随着公有云和算力规模效应的逐渐显现,会进一步反向压缩模型厂商的成本。等待行业整体丰富起来,模型厂商还将获取源源不断的应用产品生态捆绑以及垂直模型的优化方案。"

" 应用产品与通用模型适配得越牢靠,意味着模型厂商与客户绑定越紧密,下游企业将持续为模型厂商支付运营费用,而转换平台要面临昂贵的转换成本。" 李笑霖补充道。

价格战早产,是大模型创企之殇?

大厂气势汹汹打价格,大模型创企却应声者寥寥。

原因在于,大模型创业公司如今都认可 " 双轮驱动 " 战略,认为只有既做通用模型,又做产品才有未来。但显然,模型所需的资金、人才和 GPU 集群都是稀缺资源,产品所需的营销、渠道也意味着大额消耗。创业公司们明显不舍得丢掉手中为数不多的筹码投身价格战。

李开复表示,ofo(共享单车)式的疯狂降价是双输的打法,大模型公司不会这么不理智,因为技术还是最重要的,如果是技术不行,就纯粹靠贴钱赔钱去做生意," 我们绝对不会跟这样的一个定价来做对标 "。官网显示,零一万物最新发布的闭源大模型 Yi-Large,每百万 tokens 价格 20 元。

王小川则说,这次 B 端降价,不是生产关系改变,而是直接做生产力供给,将 AI 直接供给生产力," 这件事情对我们而言,就是别掺和进去 "。

" 目前大模型赛道是错位与同质化竞争并存的状态。各家技术差距不大,但也具备相对差异化的产品。好在市场还不成熟,蛋糕尚且未被瓜分,明星创企依然有出头的机会,但需要找到万无一失的应对策略。" 刘柯向时代周报记者称,资本是逐利的,此前历经数轮融资的创业公司也到了向投资者递交成绩单的时刻,但技术大山连绵起伏,商业化前景也不够明朗,下半年行业或将面临洗牌,一些企业很可能在此节点就与赛道无缘了。

傅盛认为,这次大降价基本宣告了大模型创业公司必须寻找新的商业模式。

刘柯称:" 创业公司资金实力不如可以依靠云业务造血的大厂,因此一味拼低价显然是没有生存空间的,如果要向应用层延伸,或者打造 AI 原生,也不能忽略大厂的围追堵截。AI 搜索、AI Agent 等热门应用都有大厂在布局,况且现有的大模型能力还不足以支撑一个超级 APP 的诞生。"

假如深入 B 端交付业务,也意味着大模型创企或将为了迎合国内市场,面临为纷繁的客户做精细化定制的处境,最终要舍弃掉与 AGI 相匹配的估值。

刘柯表示,明星创企不妨与专注于某一领域的大模型开发和服务平台,与大厂合作,作为其 ISV 服务商,来为大厂提供某些专项场景所需的软件服务系统," 剩者为王,是大混战时期的生存哲学。"

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,83252人围观)参与讨论

还没有评论,来说两句吧...