本文作者:访客

GPT准备替中医把脉了

访客 2024-05-30 09:23:14 28527 抢沙发

出品 | 虎嗅医疗组

GPT准备替中医把脉了

作者 | 陈广晶

编辑 | 苗正卿

头图 | 视觉中国

坐在你面前的,是 " 赛博中医 ":它的眼睛是摄像头,像老中医一样,要 " 扫描 " 你的舌苔、面色;它也能号脉,感应器构成的号脉终端不到 2 分钟,便能 " 摸个门清 "。很快,这位赛博中医对你 " 了然于胸 " 了,它迫不及待地给你手机发了一份专属健康报告:阳虚 or 阴虚、寒湿 or 湿热,怎么应对,怎么开方,报告上一目了然。

" 看 " 到你挺感兴趣,这位赛博中医举起机械臂,想帮你立刻来一场赛博艾灸、赛博推拿。

这是很多医院、体检中心悄然上线的 AI 中医机器人,被戏称为 " 赛博中医 "。

" 赛博中医 " 太受欢迎了,几乎任何场合都是 " 人气王 "。即便明知道娱乐属性更强,长期亚健康的职场人也还是会乐此不疲,忍不住要在赛博中医的摊位前排长龙。

这波 " 中医 + 科技 " 热潮,已经不满足于赛博中医了。热度,渗透到了中医药大模型领域,只不过这次排队的,换成了产业界 " 玩家 "。

进入 5 月份以来,大洋彼岸的 OpenAI 的 GPT-4o、谷歌的 Gemini、Deepmind 的 Alphafold3 等,都引起国内吃瓜群众一波又一波的狂欢,余韵之中,字节跳动、华为云、阿里云等也动作频繁。在光环之下,中医药大模型也没闲着。

5 月初,华为云和天士力共同开发的 " 数智本草 " 大模型发布。在此前,在 GPT 推动的 AI 热潮中,早有扁鹊、华佗、神农、孙思邈、" 数智岐黄 "、" 岐黄问道 "" 本草智库 "、" 天河 · 灵枢 "…… 虎嗅根据公开信息统计,2023 年以来至少已有三四十个中医药相关大模型相继亮相。

这些大模型都肩负着给产业发展摸脉、问诊、开药方的使命。在其背后,除了华为云、百度云、阿里云等科技公司,清华大学、中国中医科学院、天津大学等高校、科研院所,最重要的推动力量还要数云南白药、华润江中、太极集团、康缘药业、神威药业、天士力等一众知名中药企业。

但一直以来,中医药都非常神秘,堪比 " 黑盒 ",特别是中药,有 " 丸散膏丹,神仙难辨 " 之说,数据和理论研究都还远远不够。

AI 能让中医 " 质变 " 吗?

在中医药产业内部,越来越多专家学者已经达成共识,认为 AI 给中医药发展创造了一个 " 千载难逢的机遇期 "。

" 中医药与人工智能结合是必然发展趋势,不以人的意志为转移。"中国工程院院士、国医大师张伯礼在 " 数智赋能大健康产业新质生产力暨第四届中医药国际发展大会 " 上就曾这样直言。

中医药大模型到底能给 " 江湖水深 " 的中医,带来哪些关键变化?AI 能让中医产业发生关键转向吗?

" 重注 " 中医药大模型

中医药大模型有什么用?

按照现代中药创制全国重点实验室常务副主任、天士力医药集团董事长闫凯境博士所说,他们此次发布的 " 数智本草 " 大模型,关键内容是 " 说理 " 和 " 寻药 ",从而打造 " 数智中药 " 研发新范式,赋能天然药物的发现和新方剂的生成,并带动中药全产业链的跨越性转型升级。

简单来说:把古往今来名家名医的医学理论、传统中医药知识,加上天士力累积的中医药研发、生产、市场等数据充分 " 投喂 " 给大模型,从而打造出一个足够智能的能够实现 " 从方到病、从病到方 " 过程的 AI。

这里面的复杂性在于:既要从已有的方剂、产品中拆解出中医药的药效组分、作用靶点、基因网络等信息,用科学的语言解读中药产品,为异病同治打下基础;也要从中医药理论、企业数据等出发为新药研发提供助力。从而促使企业 " 不断进行创新性自我重塑和持续沉淀 "。

其实,这个过程就像是在打磨一把打开中医药神秘大门的 " 钥匙 ",并用这把 " 钥匙 " 解开更多关于健康、疾病的秘密,开发出更多新药好药。

长期以来,外界对中国传统药企,特别是中药企业的印象,往往是重营销而轻研发的,很多知名中药企业每年的研发投入都只有一两亿元,甚至更少,在总营收中的占比非常小。现在情况,发生了 180 度转变。

从 2023 年年报看,多家企业研发费用激增。比如:太极集团的研发投入同比增长了 113.52%;华润江中研发投入增长了 33.37%;天士力的研发投入增幅为 29.49%,总金额达到了 13.15 亿元的新高,在同类企业中排在榜首。除了新增管线,针对大模型的投入也是重头戏。

研发中医大模型并非易事,训练过程中涉及的 " 样本量 " 需求比较大。

以天士力为例。该公司本次与华为云推出的 " 数智本草 " 大模型,是由天士力 2017 年开始打造的 " 星斗云 " 系统迭代升级而来。它们也是天士力做 " 数智中药 " 创新的基础。

此次发布的 " 数智本草 " 仅中药古籍就吸纳了上千本,方剂超过 9 万份,中成药配方 4 万多份,此外还有 4000 万以上的文献摘要、300 多万天然产物、2 万多个靶点通路信息,以及 10 万多临床方案和超 16 万的中药专利、药典政策指南等,整体参数量 380 亿。

为了对大模型进行微调,企业又为其提供了 350 万特有天然产物分子数据,进而实现了智能问答、交互计算、生成文档三大应用模式,以及上述提供的整个数智化闭环模式。

现代中药智能制造生产线一角 / 天士力提供

尽管从参数到训练数据的规模还都无法与 GPT 等知名大模型,甚至是生物制药领域的大模型相比,但是背后的转型之痛,对于传统的中医药企业来说,已经堪比脱胎换骨了。

要喂养大模型,就需要高质量的数据,这在传统的作坊、车间、产业链里是很难实现。因此,做中医药大模型最关键的一步就是对生产车间、产线、种植基地做数智化升级。

根据扬州大学马康宁、张斌对中医药企业供应链管理数字化转型模式的研究结果,天士力从 2013 年的中药材全程质量追溯体系建设开始,已经做了 10 多年的数字化转型,对装备和产线都实行了智能升级,将中药研发、种植、提取、生产、销售全产业链都做了标准化。

在此基础上,一条生产线,如果想一年采集 2.1 亿数据,就需要设置 2100 多个数据采集点。

为此,2014 年至 2023 年,天士力的研发总投入 76.3 亿元,在中药行业排在第一位。虽然具体在数智化上的花费占比没有公开,另一家上市公司的数据或许可以提供参考。

另有某知名上市公司的公开信息显示,他们仅建设一个年产能 1 万多吨的智能化、数字化中药提取车间,就花费了 3 亿元,相当于该公司此前一年的研发投入的 90% 以上。

让药企们,对中医大模型 " 舍得投入 " 的根本原因是,中医药市场正呈现爆发的趋势。根据中研普华产业院研究报告,预计到 2026 年中国中药市场的整体规模将达到 1.5 万亿元以上,整体平均增速 12% 左右,超过同期医药产业整体增速。

不过,要承接这样的利好也没那么容易。

急需 " 救命药 " 的药企

一个关键的机会窗口来自医药消费趋势的变化:中国医疗体系正从 " 治疗疾病 " 转向 " 健康管理 " 转变,对以 " 治未病 " 为特点的中医药来说,也是前所未有的机遇期。

而中医药本身在市场上 " 形象 " 的变化,进一步强化了这个风口。过去三年,越来越多研究在一定程度上证实了中医药的价值。比如:张伯礼院士透露,在心脑血管等疾病治疗中,中医药将西医药治疗效果的 " 天花板 " 又提高了近 30%。可以说,中医药拓展了疾病治疗的能力边界。

但面对这个难得的机会窗口,中医产业并没有 100% 完成热身。现实是,中药还有很多问题待解决,比如:因原料(主要是中药材)质量波动大而出现的不同批次产品质量不均一,中药方剂本身物质组成复杂,毒副作用认识不足,作用机制不清等,使很多中药产品难以获得市场认可,也无法走得更远。

以及,周遭因素影响下,一些中成药领域曾经的明星单品,已经风光不再。比如丹参川芎嗪注射液,曾是年销数十亿的药品,受重点监控、退出医保目录等影响,市场逐渐萎缩,后来干脆退市了。

" 单品 " 压力陡增,导致药企压力也越来越大。

从 2023 年年报看,中国中药、华润三九、大理药业、龙津药业等多家中药上市公司的业绩大幅下滑。

来自:视觉中国

积极推动数智化的天士力也面临转型压力。

从公司财报数据看,天士力的主营业务收入增长率在 2017 年达到巅峰后,到 2019 年已经降到了 5.61%,2020 年还出现了负增长,到了 2023 年其同比增幅不到 0.5%,主要聚焦的医药工业板块,增幅只有 3.22% 了。该公司的核心产品复方丹参滴丸,还在部分地区受到了重点监控、集采降价等影响。

据沈阳化工大学徐宏鑫在撰文中指出,主营业务收入增长率在 5% 以下的企业产品处于衰退期,主营业务利润有出现滑坡的风险。天士力的产品经过成长期与稳定期,开始进入衰退期。" 应及时研发新产品,以避免丢失原有的市场份额 "。

然而,现在按照传统手段要想推出新的 " 爆款 " 药,已经非常难了。要知道,药品研发本来就很复杂,即便是单分子药物,其可选空间就已经达到 10 的 60 次方以上了,有药效的物质不好找,能够安全用到人体的更少,全球新药研发成功率只有 2% 左右了。

中药作为大自然的产物,成分更复杂,究竟是哪些成分在起效还没有研究清楚,方剂又有不同药材的配伍,更是叠加了不同药材间、同一药材不同成分间的相互作用等,复杂程度难以想象。

公开资料显示,2018 年到 2023 年,中国一共批了 45 个中药新药,相对提交的注册申请可谓是九牛一毛。2023 年就有 1163 件中药注册申请,获批的中药新药却只有 9 个。

如果没有一项颠覆性的技术,彻底改变中医药的发展范式,确实很难后来居上、弯道超车。AI 大模型显然就被寄予了这种力挽狂澜的期望,俨然成了产业界提振信心的 " 药神 "。

不宜 " 神 " 化大模型

某种程度上说,以大模型为基础的数智化,确实在改变中医药。而且这种改变不只局限在讲清道理、发现新药。

按照天士力勾勒的 " 数智中药 " 蓝图,数智化将通过 3 条路径来颠覆中药全产业链。

包括:在研发中,可以多维度多模态数智中药研发技术深刻解析药物与疾病特征;在生产中,可以智能制造技术保障中药产品质量精准控制、高效、绿色、可持续发展;在使用环节,可以智慧中医大脑高效赋能数智中药个体化精准服务。目标是要 " 引领现代中药达到用药精准、生产精智、疗效精确的新高度 "。

另有科技领域投资人曾告诉虎嗅,大模型会用一种更高效的、人类无法理解的方式理解世界,然后再用人类能够理解的方式转述出来。从这个角度看,它与中医药也有某种共同之处,确实有潜力揭开传统中医药的神秘面纱,打开长期困扰行业发展的桎梏。

而且 AI 在中医药领域的突破,还可能进一步解决现在医学的困境。

在《数智中药:现代中药数智化升级与创新发展》一文中,天士力的研究人员还指出,将现在生命科学和人工智能技术结合的研发体系,将分子信号通路作为分子本草技术的靶点,有机会 " 突破单一靶点药物开发难、周期长、停滞不前的困境 "。

滴丸凝结过程模拟 / 天士力提供

只不过,要实现这一点也还是说起来容易,做起来还有一些待解决的问题。

比如:在数据方面,中药领域的数据复杂多样、质量参差不齐、缺乏标准;还缺乏完善的隐私保护措施。在算法方面,也需要更多符合中医药特点的算法工具等。

此外,还有交叉人才的培养问题。中医药大模型的开发,需要融合中医、中药、计算机、统计学等多方面的知识,如果开发者缺少中医思维,很可能会出现误解或疏忽。且中医语言的一大特色就是隐喻,要正确理解和处理这类语言,对非专业人士和 AI 也是挑战。

上述问题的解决,绝大部分都不能单靠科技公司或制药企业,还需要政府、产业界、学术界共同努力。正因为此,天士力相关负责人也告诉虎嗅:" 我们所做的这些也不是要在短期内颠覆行业。" 更多还是在为中医药现代化发展的新范式打基础,是中医药领域的 " 数智化基建 "。

尽管客观来说,中医药大模型并不是包治百病的 " 神药 ",但是,有越来越多中药大厂积极布局这一新技术,对推动传统产业发展、破解生命奥秘来说,仍是值得期待的好事。

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,28527人围观)参与讨论

还没有评论,来说两句吧...