刚刚，31岁的杨植麟回应一切

访客 2024-11-16 18:08:15 59133 抢沙发

默认

（图片来源：钛媒体 App 编辑林志佳拍摄）

2023 年 11 月 16 日起，一款名为 Kimi 的 AI 应用产品在中国横空出世、瞬间爆红，在苹果 App Store 应用商店的下载排名中，一度超越微信、抖音，冲到榜首。

被称为 " 中国版 ChatGPT" 的免费 AI 应用 Kimi，能一口气直接进行 200 万字长文本处理，文笔比百度 " 文小言 "（文心一言）更加流畅自然，而且引发社交平台讨论，一度让平台暂时 " 宕机 "。

今年 10 月，Kimi 智能助手月活超过 3600 万人。

Kimi 智能助手背后的 " 缔造者 "，来自一家创立约 579 天的 AI 公司 " 月之暗面 "（Moonshot AI），公司创始人、CEO 是一位 31 岁的连续创业者杨植麟。

杨植麟于清华大学计算机系毕业、美国卡内基美隆大学计算机博士，曾在 Meta AI 和 Google AI 研发团队工作过，同时他也是 Transformer-XL 与 XLNet 两篇重要论文的第一作者，两者均涉及大语言模型领域的核心技术，并且是中国 35 岁以下 NLP（自然语言处理）领域引用量最高的研究者。回国后，他曾带领团队参与盘古大模型的核心技术研发，还带领其联合创立的 NLP 公司循环智能的产品研发。

随着 Kimi 智能助手爆火，过去 1 年多，无论是月之暗面，还是杨植麟本人，都面临着巨大的争议与热度。

首先，融资层面，月之暗面优异的 AI 技术、产品、应用和市场销售能力，让阿里巴巴、腾讯、红杉中国、美团、小红书、招商局中国基金等机构一窝蜂抢投，数月前满周岁时融资总额就已达数十亿元人民币，公司估值已超过 200 亿元。

其次，AI 大模型市场持续 " 狂飙 "，从 " 百模大战 " 到 " 价格战 "、落地应用竞争、" 百变 AI 应用 " 等，大模型领域竞争加剧，MoE（混合专家）、AI 视频、实时语音对话、多模态、开源闭源、端侧模型等新技术新模式不断涌现，而在此之前，Kimi 在部分产品功能层面是有所缺失的，而且在 Kimi 免费下，月之暗面每月大量投流和研发投入，导致市场开始怀疑其商业盈利能力和长期行业竞争力。

最后，近期杨植麟 " 被仲裁风波 " 引发关注，金沙江创投等 5 家前投资人向媒体透露仲裁消息，让更多人担忧接下来公司的发展情况。

围绕 " 昨天、今天和明天 " 话题，11 月 16 日下午，北京海淀京东科技大厦，闭关技术研发数月的杨植麟，在 Kimi Chat 全面开放一周年日，不仅发布了对标 o1 的全新 kimi 数学模型—— k0-math（未来一两周内上线 kimi 探索版），并且与钛媒体 App 等对诸多话题进行沟通与回应。

谈投放和成本：Kimi 留存率很重要，这与 AGI 有正相关作用

最近出现 AI 创业公司被收购、人才回流的现象，你怎么看待当前 AI 发展现状。

杨植麟：我们没有遇到。我觉得也很正常，行业发展进入新的阶段，之前有很多公司在做（大模型），现在有一些小公司在做，行业发展规律。

今年 2、3 月份开始，月之暗面开始聚焦和缩减（出海业务），我认为应该疯狂做减法，更加聚焦。

提升留存率是很重要的，留存率和 AGI 是正相关过程，现在与 AGI 还有一定的距离，今天做的交互能力还很有限。

" 我们主动选择做了业务的减法，应该聚焦把一个业务产品做好，大模型公司里面人数最少，算力卡和人的比例做的最高，公司人员规模做的不会做的很大，业务做很多减法。你看，ChatGPT 有 5 亿人次月活，已经是超级应用，当然也有其他应用很难‘破圈’，我们看到了美国市场的情况，选择聚焦，跟 AGI 的未来发展有关，控制人数不要太多，而把更多聚焦到创新业务做好。"

此次公布的全新一代数学推理模型 k0-math。基准测试显示，Kimi k0-math 的数学能力可对标全球领先的 OpenAI o1 系列可公开使用的两个模型：o1-mini 和 o1-preview。在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中，k0-math 初代模型成绩超过 o1-mini 和 o1-preview 模型。在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中，k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。同时，Kimi 探索版也通过运用强化学习技术创新了搜索体验，在意图增强、信源分析和链式思考三大推理能力上实现突破。

Kimi 创始人杨植麟博士介绍，k0-math 模型和更强大的 Kimi 探索版，未来几周将会分批陆续上线 Kimi 网页版和 Kimi 智能助手 APP，帮助大家解决更有挑战的数学和搜索调研类任务。

谈与豆包竞争：不应该关注竞争本身

杨植麟：不应该更多关注竞争本身，更多应该提升思考能力，用户很大价值，能够解决 AGI 能力。投流不是当下考虑的重要问题。

当然，大模式推理成本问题也很重要，因此，kimi 未来考虑次数限制，一个模型问题，每个用户（100 次）有次数限制，让用户自己去选择。早期，kimi 认为需要分配、动态更优的算力，需要想多久，简单问题想的时间很短，这是更优的。

如今，算力成本在不断下降的过程，所以依然有很大的空间。

谈多模态：我们在内测

杨植麟：关于多模态，我们在内测，我觉得 AI 接下来很重要是思考和交互这两个问题，然后我觉得，思考方面可能没有交互更重啊哟，就是说或者不是说交互不重要，我觉得思考会决定你的上限，然后交互我觉得是一个必要条件。

谈算力和 Scaling Law 瓶颈：训练明年会到天花板，但 Scaling Law 还有更多空间

杨植麟：我觉得训练还有空间，我觉得可能还有半代到一代模型的空间，所以但是这个空间基本上我觉得可能会在明年释放出来，明年基本上我觉得领先的模型会把必须能做到一个比较极致的阶段。

我觉得今天，比如说我们去看最好的模型，它可能还大概有这样的空间可以去 " 压榨 "，但是我们判断，接下来可能最重点的东西可能还是会在强化学习，他的范式上可能会产生一些变化，我并不是说他不用调，只是说你会通过不同的方式去 Scaling，这个是我们的判断。

然后你说，scaling Law 会不会是一个天花板，或者像现在其实我觉得我还比较相对来说比较乐观一点。然后核心就在于说原来你用静态数据集，静态数据集其实你是比较简单粗暴的使用方式，现在就是说你其实理论强化学习的方式，很多情况下你是有人在参与这个过程，但是人他没有办法说给你标注那么多数据，他不可能把每道题具体的思路每道都给你标出来，所以你其实是把用 AI 本身去把人的东西加上一个杠杆，然后比如说你可能标 100 条数据，你就能产生非常大的作用，因为剩下他都是在自己在思考。

谈数据泛滥和错误率优化：整个行业会变好

杨植麟：对于强化学习来说，这是需要自己生成的，奖励模型效果，减少尽可能错误的东西，因此需要训练更多的数据，设置奖励机制，才可能解决数据泛滥等问题。

关于数据、算力和算法平衡问题，这是一个 " 荡秋千 " 的过程，来回切换，此前在 GPT-4 上算力不够，因此需要做更多的工程，但现在需要做更多的数据清洗，做更好质量的数据，而且机制算法的改变，这是整个行业的问题，加多少卡解决不了，因此算法层面需要做更多的 scaling。

中美大模型差距：我觉得创新能力更重要

杨植麟：这是一个好事。中美没有什么变化或者说差距，本来我一直觉得还是（中美）相对是一个常数，一直会 Pre-Train，明年可能不可持续，一段时间内算力不是瓶颈，创新能力很重要，对我们来说可能是一件好事。

因为他并不因为本来你不做预训练，你可能今年 1 亿明年 10 亿或者 100 亿，你就是受不了，它不一定可持续，这个时候你可能更多的创新能力是（对于中美 AI 联系）更重要。

（本文首发于钛媒体 App，作者｜林志佳，编辑｜胡润峰）

标签：我觉得模型