大模型降价背后，国产大模型的竞争逻辑变了

访客 2024-05-29 15:11:08 62024 抢沙发

默认

文｜刘旷

随着人工智能技术的快速发展，大模型以其强大的数字处理能力和深度学习能力，不断与各领域交叉融合，逐步成为产业创新的关键抓手，和驱动新质生产力的关键引擎。据国家最新公布的数据显示，截至今年 3 月，我国共有 117 个生成式人工智能服务完成备案，各类国产大模型，更是超过了 200 多个，多模态的大模型应用场景正在不断拓展。

然而，随着大模型的快速发展，算力成本日益成为影响人工智能推广应用的重要因素，大模型产品的价格居高不下，更是长期制约着人工智能应用的发展。近日，随着字节跳动率先将大模型的使用价格，调低至 " 厘 " 时代，百度、阿里、腾讯等巨头纷纷跟进，迅速将大模型推至免费时代。

大模型免费时代加速到来

5 月 15 日，火山引擎云服务平台，发布了国内首批通过算法备案的 " 豆包大模型 "，主力模型，仅需 0.8 厘就能处理 1500 多个汉字，比行业价格低 99.3%，带动大模型企业市场定价，从 " 以分计价 " 步入 " 以厘计价 " 时代，助力企业以更低成本加速业务创新。在字节跳动打响大模型降价第一枪之后，随后百度、阿里纷纷跟进。

5 月 21 日上午，阿里云方面宣布，通义千问 GPT-4 级主力模型 Qwen-Long 的 API 输入价格降至 0.0005 元 / 千 Tokens，直降 97%。随后，百度通过官方微信发文称，文心大模型两款主力模型 ENIRE Speed 和 ENIRE Lite 全面免费。一个降价一个免费，阿里云和百度智能云的降价行为表明，国内大模型科技公司开启了价格比拼模式。

一方面，价格战有利于巨头抢占更多客户资源，从而迅速扩大市场份额，使其在市场竞争中保持领先地位。随着大模型用户和场景的不断扩大，模型调用价格的主要趋势是，性能不断提升、价格不断下降。而随着算法调用价格下降，算法使用成本也将进一步下降，这将推动大模型进入快速增长时代，促进大模型产业加快发展。目前来看，相比技术与实力都比较雄厚的百度、阿里而言，字节跳动率先开启价格战，本质上还是希望借此机会实现 " 弯路超车 "。而百度、阿里、腾讯选择跟进，很明显是不甘落后，更不愿意将市场拱手让人。

另一方面，随着大模型产业的快速发展，推理成本飞速下降，也成为终端降价的基础。据百度官方透露，相比一年前，文心大模型的算法训练效率提升到了原来的 5.1 倍，周均训练有效率达到 98.8%，推理性能提升了 105 倍，推理的成本降到了原来的 1%。也就是说，客户原来一天调用 1 万次，同样成本之下，现在一天可以调用 100 万次。

在业内人士看来，降低成本是推动大模型快进到 " 价值创造阶段 " 的一个关键因素，并且只有大的使用量，才能打磨出好模型，也能大幅降低模型推理的单位成本。因此，大模型的降价，不能只是停留在提供低价的轻量化版本，而是让主力模型和最先进的模型也足够便宜，才能真正满足企业的复杂业务场景需求，验证大模型的应用价值，推动 AI 应用创新和价值创造。随着头部厂商纷纷参与大模型 " 降价 "，大模型的真正免费时代或许正在加速到来。

AI 基建竞赛进入拼应用阶段

在 AI 风口之下，作为 AI 基建的云服务商们，去年还主要聚焦大模型产品，今年大厂的竞争点，已不再局限于技术，现在更重要的是价格，以及具体的落地场景。

首先，巨头都在加大开源力度，以扩大自身大模型生态影响力，扶持更多 AI 原生应用创新。5 月 9 日，阿里云正式发布通义千问 2.5，宣布模型性能全面赶超 GPT-4Turbo，成为地表最强中文大模型。在阿里云 AI 峰会上，阿里云首席技术官周靖人介绍，阿里云大模型 API 日调用量已经过亿；除了日常 2C 应用外，也服务了 9 万家企业客户，目前通义开源模型下载量已超过 700 万。

同样选择对外开源的还有腾讯混元文生图大模型。5 月 14 日，腾讯宣布其旗下混元文生图大模型全面升级，并对外开源。这也是首个中文原生的类 Sora 架构开源模型，支持中英文双语输入及理解，参数量 15 亿。放眼市场，当下的文生图开源生态，比如 Stable Diffusion 基本围绕英文语义理解，要先把中文翻译成英文才能生成图片。腾讯混元文生图大模型的出现，打破了这一现状，让文生图生态更了解中文。

事实上，腾讯的大模型应用，已经具有显著的产品思维。自去年 9 月份腾讯混元大模型上线以来，腾讯采取的就是 " 大模型全家桶 " 的策略，目前其内部已经有超过 400 多个业务接入了腾讯混元大模型。比如，在混元大模型之后，既可以是微信读书的 "AI 问书 "，也可以是腾讯会议的 "AI 小助手 "。看得出来，互联网巨头们在做开源的同时，正在试图用自身的 AI 应用，为其他合作者们打个样。

其次，通过大模型工程优化，加速大模型推理成本降低，从而推动大模型大规模降价，以繁荣应用场景落地。以前的推理模型，大多采用的是单机推理，大模型用的是分布式推理。比如，如今业内很多公司都在使用 MoE 架构模型，而 MoE 架构中基于多个专家并行机制，推理时只激活部分专家，即可以极大压缩参数量和推理成本。事实上，为了让用户可以低成本地使用 AI，并推动应用的发展，降价已经成为了国内大模型厂商的共识了。

今年 2 月份，阿里云宣布全线下调云产品官网售价，平均降价幅度超过 20%，最高降幅达 55%，涉及 100 多款产品、500 多个产品规格。4 月份，阿里云将降价策略扩大至海外公有云产品。大厂们之所以打起价格战，是因为大模型价格越低，使用的人越多；使用量越大，大模型才能被调用得越来越好。简言之，价格力的出现，才能推动大模型更好地落地。

大模型棋至中局

自 ChatGPT 横空出世以来，大模型的火热有目共睹。面对大模型带来的技术革命，不仅仅是微软、谷歌、百度、字节等大厂下场做大模型，众多与 AI 相关的创业公司也在持续涌现，业内更是出现了百川智能、月之暗面、MiniMax、智谱 AI 等 AI 四小龙。随着大厂下调 API 价格，包括新 AI 四小龙在内的创投公司，都将面临全新的考验。

一方面，以 BAT 为首的云服务商，成为了 " 降价主力军 "，直接对以出售 B 端 API 为生的中小创业公司产生严重冲击。在业内专业人士看来，本轮大模型降价的目的，不是为了用户直接使用，而是为了吸引开发者。因为短期来看，大模型的性能遇到了瓶颈，当下无论哪一家，都拿不出新的杀手锏，降价自然就成了优先级最高的选项。

因为现在各大模型 APP 基本都是免费的，本质上是各大模型的 APP 用户量都涨不动了，包括 OpenAI。一时间各大 AI 大模型的 APP 推广费用水涨船高，投入产出比直线下降。在这种情况下，必须让更多的开发者参与进来，开发出应用以吸引用户的参与。

不过，针对各大厂的降价，各大 AI 创业公司并未选择跟进，而是选择冷眼旁观。比如，一些参与 AI 大模型投资的投资人就表示，" 这波降价对一些创业公司 TO B 模式影响较大。" 因为过去很多公司，之所以选择跟初创公司合作，主要就是看重初创公司的 API 比大厂要便宜，但现在基本上没有任何比大厂便宜的可能性了，这意味着创业公司的 B 端商业化模式不复存在了。

在这种情况下，被迫卷入价格战的创业公司，将不得不寻找全新的商业模式。倘若在一段时间之内，创业公司找不到全新的商业模式，将面临生死考验，届时业内将首先面临一波创投企业的大洗牌。这也会倒逼一些创投企业，加速探索垂直领域的细分应用机会，开发全新的 AI 应用，将服务对象从 B 端转向 C 端。

另一方面，当前的行业价格战，可以看做是 " 百模大战 " 带来的一个衍生结果，大模型降价或有利于行业头部大模型公司加速整合步伐。目前来看，当前的中文大模型市场，空间相当有限，不可能所有的大模型都取得成功。作为生态产品的大模型，要么赢家通吃，要么落寞退场。当前，国内做 AI 大模型的厂商，除了 BATH 之外，字节跳动、科大讯飞、商汤科技等众多厂商也都有参与，各家不免落入 " 拼算力规模 " 的内卷之中。由于各家的功能差异不大，同质化竞争之下，价格战自然在所难免。

另外，伴随着苹果、微软、联想等设备厂商，在本地化 AI 算力和本地大模型方面的重金投入，AI PC、AI Phone 等成为主流，而通用大模型的使用场景则大幅度受限。这迫使很多大模型厂商，不得不寻找破局方法，以求尽快做出创新性的应用成果，来应对外部威胁。

因此，表面上来看是大模型在降价，背后牵动的却是，与之相关的各大参与方的角逐。价格战之下，中小创业公司纷纷转向，大型云服务商则趁势抢占市场份额，一波大洗牌显然已经开启。

大模型的竞赛逻辑变了

其实，从降价开始，行业内关于 AI 大模型的竞赛逻辑就已经变了。用业内人士的说法来讲，企业使用 AI 并不是成本驱动，而是能否产生业务价值来决定，而这或许会成为今后一段时间，大模型竞赛的核心逻辑。

首先，基础大模型的 API 调用模式，离实际业务相差甚远，决定企业使用 AI 的并非是成本，而是是否有效、好用。单纯从 API 降价角度来看，推动整个行业大降价并没有多大门槛，但是真正的 TO B 商业成功则相对较难，因为 AI 大模型如何扎根企业业务，帮助企业实现对应的业务效益，才是企业关心的核心问题。

但很多大模型尚且流于表面，距离真正的业务落地仍有相当远的距离。在大模型未能有效与企业结合的情况下，无论定价有多低，都不会让企业觉得有价值。因为真正让企业决定买单的是，AI 带来的高效和好用的体验，以及由此产生的降本增效的成果。所以，降价能否达成目标，核心还是看用户体验和反馈，否则就变成了厂商的一厢情愿。

其次，大模型 API 降价给行业内卷敲响了警钟，单纯的堆参数、拼算力、价格，并不是行业健康发展的最优解，未来只有差异化才有出路。与所有的行业一样，从混沌初开到进入大混战，多是以惨烈的价格战作为标志。如今大模型经过狂热的 " 百模大战 " 之后，价格战初步显现，同质化竞争的恶果逐步出现。

事实上，目前业内一些玩家，已经在尝试做一些面向 C 端的尝试了。比如，百川智能近期发布基座大模型 Baichuan 4 时，同步推出首款 AI 助手 " 百小应 "，类似于 AI 搜索应用。在王小川看来，中国商业环境里，C 端市场规模比 B 端大 10 倍，必须走 " 基座大模型 "+"AI 应用 " 的 " 双轮驱动 " 策略。

放眼未来，随着行业大模型的加速洗牌，未来各家大模型企业，要么选择在垂直应用领域进行深耕；要么选择结合自身优势，与大模型公司联合，做适合自己的小模型，而不是一拥而上地参与大模型竞赛，一味在数量、参数上进行对拼。

标签：模型阿里