谁才是大模型「四小龙」？

访客 2024-07-12 12:49:40 66863 抢沙发

默认

这两年热闹的大模型创业潮，被业内称为“AI 2.0”。

与之对应的“AI 1.0”，指的是2015年左右开始的那一波AI创业潮，当时诞生了商汤、旷视、云从、依图等明星创业公司，它们以CV技术（计算机视觉）为主导，大量融资，风头无两。这四家公司，是公认的“AI四小龙”。

“AI 2.0”时代，大语言模型成了新的主导技术，业界普遍认为，这一波浪潮会掀起生产力革命。这次同样出现了很多创业公司，它们被投资机构和科技巨头追捧，估值水涨船高。但谁是“大模型四小龙”，目前尚无共识。

有一种说法是，智谱AI、月之暗面、百川智能、面壁智能，这四家公司是新的“四小龙”，在6月中旬举办的2024智源大会上，四位CEO首次同台，“四小龙”的说法就传开了。

还有人说中国有“大模型五虎”：百川智能、智谱AI、月之暗面、MiniMax、云从科技。这里边把面壁智能剔除了。

这些说法没有得到广泛认可。总体上，智谱AI、百川智能、月之暗面可以入围，剩下的这个名额会给谁，还存在不确定性。

我们认为，综合创始人背景、技术实力、融资能力、商业化潜力等因素，智谱AI、百川智能、月之暗面、MiniMax这四家公司，可以称作“大模型四小龙”，它们最有可能拿到“AI 2.0”时代的船票。

四小龙，各不同

“大模型四小龙”，各有各的特色，我们分别用四个词来形容：根正苗红（智谱AI）、厚积薄发（百川智能）、高举高打（月之暗面）、隐秘机巧（MiniMax）。

从公司成立时间来看，智谱AI最早——2019年6月，那会儿大模型很小众，科技圈和投资圈没什么人关注。百川智能最晚——2023年4月，当时ChatGPT已经亮相快半年，国内大模型公司正在抢人、抢钱。

智谱AI来头不小，它由清华大学孵化，脱胎于清华大学计算机系知识工程实验室，是根正苗红的清华系。它的核心团队也来自清华，CEO张鹏是清华计算机系博士，总裁王绍兰为清华创新领军博士，首席科学家唐杰是清华计算机系教授。

清华的光环加持，再加上入局早，让智谱AI有一定先发优势。早在2020年，智谱AI就研发并训练了一个百亿参数的模型。OpenAI发布GPT-3模型后，智谱AI加大在预训练大模型上的投入，后来几乎全模型产品线对标OpenAI。

从整体的观感上，智谱AI对外展现的形象很正，讲的故事也很大，包括它背后的投资机构也主要是人民币背景。

最晚入局的百川智能，所有能量来自王小川。

王小川是互联网江湖里的“老人”，早年在搜狐一路做到CTO的位置，后来又在搜狐内部创业，担任搜狗CEO，最后搜狗被卖给了腾讯。王小川的技术实力和创业能力早已被验证，过去这些年他也积累了深厚的人脉，所以当他宣布入局大模型创业时引起了很高关注。

另外，王小川当年带领搜狗搜索跟百度搜索打仗，如今又在大模型赛道和百度狭路相逢，时不时吐槽几句李彦宏，这些素材成为人们茶余饭后的话题，也增加了百川智能的热度。

月之暗面比百川智能早成立一个月，没有显赫的背景，但有一个明星创始人。

杨植麟92年生人，是这几个大模型公司CEO中最年轻的，他毕业于清华大学和卡耐基梅隆大学，学术和工作经历都跟大语言模型相关，之前就在AI学术圈小有名气，算是个小天才式的人物。尤其是他读博士时，跟着苹果AI研究负责人和谷歌首席科学家做研究，发了一些论文，给了他很大加持。

这些标签和光环，被杨植麟充分利用，经过有意识的包装和营销，他树立了清华90后学霸的人设，被打造成新锐大模型创业者的代表。

这家公司的创始人和产品，都比公司有名。今年3月Kimi智能助手爆火出圈之前，很多人根本不知道月之暗面。但杨植麟一路高举高打，硬是靠一个人打满了全场。

MiniMax是这四家公司中*调的，但实力不容小觑。它早在2021年12月就成立了，比目前市场上活跃的大部分大模型公司都要早，它在2022年推出的AI对话产品Glow，上线四个月就收获了近500万用户，在年轻人中很受欢迎。

当很多大模型公司在拼参数、秀肌肉的时候，MiniMax已经找到了应用场景，并将产品悄悄落地了，还打进了海外市场。

MiniMax的核心班底来自商汤，创始人闫俊杰在商汤从实习生做到副总裁，还曾担任研究院副院长和智慧城市事业群CTO，这项业务曾为商汤贡献了大量收入。在2021年底商汤上市前，闫俊杰离职创办了MiniMax。联合创始人周彧聪也曾在商汤科技研究院主管算法团队。

商汤就是在上一轮AI创业潮中成长起来的，位列“AI四小龙”，如今，闫俊杰创办的MiniMax晋级为“大模型四小龙”，和老东家同台竞技。

总体来看，“大模型四小龙”的四位创始人履历非常光鲜，都是各自领域里的精英，但同时他们又各有特色，导致每家公司的气质和侧重点有所不同，进而导致了竞争策略的差异。

融资、估值与站队

四家公司都有融资，估值涨得很快。

目前估值最高的是智谱AI，市场传闻在6月初的一笔融资中，智谱AI估值约30亿美元，中东石油巨头沙特阿美旗下基金投了4亿美元。

月之暗面与智谱AI接近。今年2月由阿里领投的那笔超10亿美元融资中，月之暗面估值已达约25亿美元，这是当时国内AI大模型公司获得的单轮*金额融资。最新传闻是，腾讯或将入局，将月之暗面的估值推高至30亿美元。

这意味着，智谱AI和月之暗面将率先进入“200亿人民币俱乐部”。

MiniMax和百川智能的估值相对低一些，融资轮次也相对较少。今年3月有消息称阿里领投了MiniMax新一轮大规模融资，估值超过25亿美元。百川智能官宣的融资停留在去年10月，今年4月有传闻称最新估值18亿美元，百川智能否认了。

由于月之暗面和百川智能在2023年上半年才成立，那段时间也是国内大模型投融资最热闹的阶段，所以几笔金额较大的融资，基本都集中在过去一年里。

这四家公司由于被业内认为是头部项目，融资时遭到投资机构拥抢，加剧估值上涨，吸走了行业里的活跃资金。反观那些腰尾部的项目，融资则没那么容易，估值也没这么疯狂。

天眼查数据显示，李开复创办的零一万物，除了公司成立时获得了创新工场的启动资金，对外只获得了阿里云的一笔投资；知乎CTO李大海担任CEO的面壁智能，成立至今获得两笔融资；微软前全球副总裁姜大昕创办的阶跃星辰，没有公开的融资纪录。

跟十年前的那波AI创业潮相比，今天的资金更加理性，或者说是局部疯狂。当年“AI四小龙”融资时，行业里有大量流动的热钱，项目在资本泡沫中长大。

而大模型遭遇了资本寒冬，美元基金退潮，能拿出大钱的大基金不多，头部几个基金抢项目又很强悍，VC对着十来家大模型公司猛投，项目估值一时被拉到很高。

英诺天使基金合伙人王晟对「定焦」说，“百模大战”中很多投资机构陷入迷茫，资金端20多家VC投资很活跃，资产端就几十个项目融了很多钱，两边都没有泛化。实际活跃的投资机构也就20来家，剩下的都是在看热闹，跟着摇旗呐喊。“因为大家*看不懂，第二不敢投，第三投不到。一堆创业者各种鼓吹项目多厉害，其实根本没人投。”

项目和基金都在扎堆。王晟认为头部几个项目的估值被拉的过高了。

红杉投资了“大模型四小龙”中的三家——月之暗面、智谱AI、Minimax，此外还有光年之外和阶跃星辰。今日资本也投资了光年之外，还投了“大模型四小龙”中的两家——月之暗面和智谱AI。

除此之外，“大模型四小龙”从一开始就进入了大厂的射程，主动或被动接受了大厂的投资，提前选边站队。

这与“AI四小龙”时代有很大不同，当年的AI创业浪潮完全由创业公司主导，互联网大厂基本没怎么参与，它们还在忙着抢地盘、大并购，那是消费互联网的黄金时代。今天的大模型创业，OpenAI发布ChatGPT之后，大厂从*天就下场了，甚至比很多创业者还早，没有给创业公司留出时间差。

大厂基本都是两手准备，一手自研，一手投资。

最典型的是阿里，它除了全力推进自研大模型通义千问，还投资了场上几乎所有的头部项目——“大模型四小龙”+零一万物。腾讯投资了“四小龙”中的三家——Minimax、智谱AI、百川智能，接下来有可能投资月之暗面，另外它此前还投了王慧文的光年之外。美团收购了光年之外，还投资了智谱AI、月之暗面。

从项目的视角来看，智谱AI背后站着阿里、腾讯、美团；百川智能背后有阿里、腾讯、小米；月之暗面是阿里、美团；MiniMax是腾讯。

如果我们相信*投资机构和大厂的眼光，以融资情况来看，智谱AI、百川智能、月之暗面、MiniMax这四家公司，毫无疑问是公认的头部，即便它们是被“捧”出来的。

如何赚钱？

“AI四小龙”当年也从投资人手中拿了很多钱，但最后从市场上没赚到多少钱。它们的技术很好，商业化很难，客户主要是B端企业和G端政府，通过向它们提供人脸识别等AI解决方案来赚钱。

这不是一个好的商业模式，项目非标准化、落地周期长、成本高，导致后来一提到“AI四小龙”，就跟亏损、烧钱的标签混在一起。

“大模型四小龙”同样要面对来自商业化的拷问。

四家公司中，智谱AI最早进行商业化探索。按照智谱AI自己的说法，公司从成立的*天起就有收入，在研究技术的同时也在开拓市场。因为智谱AI一开始的研发重点是数据挖掘与科技情报分析，2020年6月OpenAI发布GPT 3后，智谱AI才将重点转向大语言模型。

然而这不能证明智谱AI跑通了大模型的商业模型，反而说明它从一开始就有To B基因，像是上一代视觉AI公司的翻版。

2023年初开始，智谱AI开始组建大模型的商业化团队，人员规模一度发展到上百人，而很多大模型公司所有人加起来都不到一百人。它探索出API、云端私有化、本地私有化等几个主要的变现方式。

智谱AI有意无意进入了巨头的射程范围。今年5月，大模型公司掀起价格战，字节、阿里、百度、腾讯全部卷入其中，将API价格降到无限逼近零。业内普遍认为，大模型创业公司的成本比大厂高，专用数据少，很难建立壁垒，无力与巨头打持久战。

出身相对“平民”的月之暗面和MiniMax，选择从C端入手，靠产品说话。

杨植麟说过，月之暗面不是为了竞争而建立的公司，不做to B，从*天就决定做to C。

作为一个学院派创业者，杨植麟被认为是典型的“技术信仰派”，带有一点理想主义，相信scaling law，而不只是盯着眼前的竞争。

它去年10月推出的面向C端的产品“Kimi智能助手”，被网友称为ChatGPT中文平替，热度和月活一度逼近百度的文心一言。今年3月，Kimi宕机上了热搜，然后被股民盯上，炒作“Kimi概念股”，让这款产品加速出圈。

通过Kimi，月之暗面向外界证明了自己的技术实力和产品能力，为变现奠定了基础，随后推出打赏模式，但这块的收入还很薄弱。有意思的是，当时Kimi火了之后，阿里在*时间宣布，通义千问免费开放1000万字长文档处理功能，超过Kimi。而当时阿里刚成为月之暗面的股东。

MiniMax应该是目前C端产品做的最成熟的大模型公司之一，它的突破口是AI情感陪伴。

*款产品Glow，上线四个月收获500万用户，随后因涉及隐私和敏感问题遭到举报被下架，后来Glow以升级版本“星野” 卷土重来，去年底月活用户达到数百万人。MiniMax还开发了一款AI虚拟人物聊天软件Talkie，主打出海，上线一年时间累计下载超过1400万次。Data.ai数据显示，2024年4月，Talkie的日活跃用户数超过900万。

MiniMax很会做产品，非常精准把握了年轻一代的消费喜好。比如Talkie*的卖点是AI角色定制，AI角色又与卡牌游戏机制相结合，这些卡牌不仅可以收藏，还能在平台上交易。Talkie让用户付费订阅，同时通过抽卡机制让用户充值，还在抽卡环节插入广告。

当其他大模型公司还在拼参数时，MiniMax已经找到落地场景并开始赚钱了。

百川智能切入市场的方式是开源。Meta靠开源在AI圈一炮打响后，百川智能选择跟随，在公司成立两个月后就发布了70亿参数的开源大模型，随后不断进行升级，通过开放API接口的方式进入ToB领域，开启商业化进程。

王小川考虑的问题很大，像大多数大模型公司CEO一样，他也还在探索最适合公司的商业化落地方式。

结语

站在今天的时点，评选“大模型四小龙”可能还有点早，毕竟，这个赛道还处在早期，存在太多变数。上文提及的四家头部公司之外，零一万物、面壁智能、阶跃星辰也都很有实力，只是暂时在估值、产品落地、商业化等方面略逊一筹。

现在大家都在等待超级应用出现，超级应用可能会成为改变行业格局的跷跷板。大模型公司们都在往这个方向努力，因为如果应用跟不上，商业化的空间就无法打开，靠融资推动的商业模式也就难以为继。

在那之前，“大模型四小龙”需要突破技术天花板，找到落地场景，平衡好与巨头们的微妙关系，甚至被迫参与价格战。它们面对的挑战，丝毫不比“AI四小龙”小。

标签：模型公司