文 | 王方玉
编辑 | 苏建勋
大模型竞争下半场,行业开始走深走实。健康、文旅、大数据、城市治理……越来越多的垂直领域大模型兴起并开始商业化应用,AI 应用及其产业生态发展进入了新的阶段。
在这股垂直大模型浪潮之前,有一家 AI 创业公司,从创立伊始就选择专注生命科学垂类大模型,并从底层的基础大模型做起,至今已有 4 年时间。
2020 年,百度集团创始人李彦宏和时任百度风投 CEO 的刘维,联合创办了百图生科。2021 年,百图生科构建了千亿参数规模的大模型 "xTrimo"。据介绍,这是全球首个、也是目前最大的生命科学领域的 " 超大规模多模态模型体系 "。
需要指出的是,百图生科的生命科学基础大模型并非自然语言大模型 + 生物学文本的垂直 " 大模型 ",而是围绕生命科学的氨基酸、碱基等高复杂序列数据,用 Transformer 等技术去提炼序列中的隐藏规律,从而对单个蛋白质、细胞中蛋白质相互作用、细胞本身,以及细胞系统的规律实现建模,从而批量化地解决创新药物或者生命科学项目研发的挑战。
刚刚过去的 10 月,百图生科在第三届中国生物计算大会上正式发布了全新一代生命科学基础大模型—— xTrimo V3。
据悉,该模型在 V2 大模型突破千亿参数、理解蛋白质语言、初步进入细胞等场景的基础上,进一步扩展到 2100 亿参数,覆盖蛋白质、DNA、RNA 等七大生命科学主流模态,并在各个原有模态上依靠新的数据、新的架构,做了显著的增强。
会后,百图生科联合创始人兼 CEO 刘维,中国总裁邓永富、技术副总裁张晓明等管理团队与 36 氪等多家媒体进行了交流,阐释了百图生科耕耘生命科学基础大模型四年的长期布局与战略思考。
专注高价值、前沿未知问题
2024 年诺贝尔化学奖的颁布,让 AI for Science(AI4S,即人工智能驱动的科学研究)这一科学研究的新范式出现在聚光灯下。诺贝尔化学奖的决定,很大程度上肯定了这一研究范式、乃至整个赛道的长期价值。
实际上,在获得诺奖加持之前,AI4S 已经在生命科学、药物研发领域有了较广泛的实践和应用,可以帮助缩短药物研发周期,降低研发成本。目前全球 AI 制药的市场规模已超过百亿元人民币。
百图生科的生命科学基础大模型所解决的问题,与 AI 制药既有相似和交叉之处,也有显著差异。
百图生科方面表示,目前市面上的 AI 制药公司专注于解决效率提升的问题,通过 AI 建模行业所积累的数据,加速药物的研发;而百图生科更加偏重于利用大模型和生成式 AI 解决前沿、未知问题,特别是今天行业里已有的数据和模拟软件解决不了的问题。
" 百图生科并非以完成某个单点技术突破或者纯粹的科研论文为目的,而是希望能将大模型能力实际应用到在生物制药以及生命科学领域的一个个垂直前沿场景之中,围绕各类前沿发现问题,一个个去建立依靠多个 AI 模型才能实现的系统能力。"
刘维告诉 36 氪,生命科学行业其实是愿意冒风险去买没有确定性结果、但带来新的可能性的技术服务,这些技术最常见的就是动物模型和实验模型,每年大药企购买实验模型从而产生可能的候选分子的金额高达千亿美金。今天 AI 模型要代替或者扩充的是这部分市场,而不是狭义的软件市场。
他预测,未来在前沿药物研发领域,至少会有百分之二三十的费用是用来购买 AI 模型,因为实验模型的性价比和绝对能力都不能匹配前沿研发的需求。
正如芯片和汽车电子在新能源车成本中的比例从燃油车时代的 1% 提升到如今的 20%-30%。随着生命科学研发的目标更多从天然产物筛选和改造,变成理性设计的前沿产物,未来生命科学行业的 AI 化将是大势所趋。
在此背景下,百图生科将自身定位为 " 一家生命科学 AI 模型提供商 "。
生命科学大模型,不止于制药
要做生命科学领域的基础大模型,长期的技术积累和训练至关重要,但同时商业化也是无法避开的关键问题。
为了避免过早地被商业利益所裹挟,百图生科过去很长时间一直没有把商业化作为核心任务,而是专注于技术突破。但自从去年下半年开始,百图生科的商业化有所提速。
特别是百图生科与赛诺菲达成的战略合作,不仅总交易金额体量大,而且是少有的基于 Foundation Model (基础大模型)的 AI 模型开发合作,而不是联合开发某类特定靶点或药物。国际大客户愿意斥巨资为 AI 模型买单,这无疑进一步凸显出了大模型的价值。
" 应该说前几年的百图生科的前期投入,得到了市场的 reward。" 刘维表示,截至目前,百图生科已服务了全球 300 多家用户,实现超过 20 亿美元(约合 140 亿元)的订单总价值, 客户包括了跨国药企、大型 CRO、明星创业公司、国内外研究机构等。
百图生科生命科学大模型的商业化应用,也不止于服务药企。
百图生科方面表示,百图生科生命科学大模型不仅可以应用在药物研发中涉及通用蛋白、多种构型的抗体、细胞疗法、基因疗法等多个领域,在靶点发现、工艺优化、合成生物学、生物制造、生命科学工具等多样的方向上均有不错的水平展现。
例如,生物学的酶本身也是一种蛋白,目前百图生科已经完成了多个海外客户的 AI 生成生物酶的项目。今年 9 月,百图生科与大北农达成战略合作。双方将共建大农业生物科技 AI 大模型,聚焦生物合成、基因编辑、蛋白质组学、医药健康、人工智能 + 等方向,开始在中国市场的落地。
" 由于历史投入原因,生物制造领域应用前沿技术的力度远不如生物制药大,我们也希望能够借这个机会把新技术引入进去,加速该领域价值的发现。我们判断,在合成生物学和生物制造领域中国大有可为,市场规模将远超美国。" 刘维指出。
当然,药物研发始终是百图生科最专注的核心领域。百图生科表示,目前药物研发领域综合投入每年高达万亿美元,但主要集中在解决几个高价值的大病种问题上,如果利用 AI 能够将研发效率进一步提高,会有更多的精准药物能被设计和商业落地,将极大地推动人类在个性化药物、罕见病等领域的健康福祉,也自然的能为 AI 企业带来足够的回报。
要实现这一超级目标,在平衡商业化和企业成长的同时,百图生科始终面向前瞻性的问题,持续进行研发投入。
" 我们的一个整体判断是,生命科学大模型是一个长周期的事情,因此战略选择是面向未来,面向终极,我们下一代要做的研发,是领先生命科学行业三五年的新主题,为下一代药物或者生物公司提前做好 AI 能力上的布局,只有看得更远,解决前沿问题,才能为行业创造更多社会价值的同时分享更多的经济价值。" 刘维对 36 氪表示。
登录后才可以发布评论哦
打开小程序可以发布评论哦