AI革新蛋白质设计,药物设计潜力凸显
瑞典当地时间10月9日,2024年诺贝尔化学奖正式揭晓,David Baker因其在计算蛋白质设计方面的成就获得一半奖金,另一半则被分别授予了Alpha Fold2的开发者Demis Hassabis和John Jumper。
在生命科学,尤其是创新药物研发领域,蛋白质设计优化是早期研发阶段非常重要的环节之一。由于蛋白质结构复杂,传统技术限制下蛋白质设计优化不仅耗时较长,且成本高昂,是创新药研发的技术难点之一。
AI技术的注入颠覆原有蛋白质设计的工作模式,大幅提升研发效率和成功率。此次诺奖化学奖获得者均利用AI技术在蛋白质设计与结构预测领域取得了此前难以想象的成就,其中David Baker首次使用生成式AI从头设计出了全新的抗体,有望让AI从头设计蛋白进入抗体药物市场。
技术突破的同时,AI技术也促使蛋白质设计服务这一新型产业应运而生。除了药物研发,蛋白质设计服务也逐渐向合成生物学、酶制剂等应用领域拓展,并陆续出现成功案例。
AI对蛋白质设计领域带来颠覆性影响
作为生命的基础单位,蛋白质在创新药物研发过程中扮演着重要的角色。在单抗、ADC等大分子药物的研发过程中,对蛋白质进行优化调整以提高其适应工业化生产的能力,提升药物的治疗效果,是非常常见的策略。
由于蛋白质结构繁杂且变化多端,以往科学家要更多依赖于专家指导及湿实验验证的方法不断尝试探索,才能实现对蛋白质功能的精确调控,不仅耗费较大人力物力,成功率和项目周期都难以把握。“蛋白质结构的复杂性以及序列空间非常大,这两点导致以往依靠专家经验理解和高通量筛选等方式进行的蛋白质设计难以获得良好效果。”天鹜科技CTO刘灏对第一财经表示。
近年来AI技术突飞猛进,推动一些细分领域不断取得突破。2020年末,谷歌旗下DeepMind推出的第二代用于蛋白质三维结构预测的人工智能系统AlphaFold2,一举破解了困扰生物学界50多年的“蛋白质折叠”难题,引发轰动。
在AI技术的助力下,人类在蛋白质设计领域仿佛“任督二脉”被打通,科学家可以直接通过蛋白质序列预测蛋白质结构并精准建模,从而能够更便捷地研发出廉价有效的药物。
“AI技术的出现,对整个蛋白质设计领域带来了颠覆性的影响。”刘灏表示,人类对蛋白质结构预测的精准度达到了此前难以企及的高度,同时,为蛋白质设计带来了更多可能性,例如蛋白质的从头设计,又如天鹜科技所使用的从”序列直达功能“的全新预测方式。
得益于蛋白设计能力的提升,近年来mRNA疫苗、肿瘤药物、合成生物材料以及酶制剂等诸多赛道均实现了重大技术突破。
2024年,DeepMind推出了AlphaFold3,该款程序不仅可以用于预测蛋白质结构,还可以预测核酸、小分子等生命分子,并且与现有技术相比准确率提升了50%,在药物设计方面的潜力进一步凸显。
应用领域不断拓展
除了技术手段的突飞猛进,AI技术的引入也开创了蛋白质设计服务这一全新的产业。刘灏表示:“传统技术手段下,蛋白质定制化设计效率低而成本高昂,企业很难仅凭借此业务实现盈利。AI技术的出现使得企业以蛋白质设计服务为主营业务从此成为可能。”
据介绍,在创立后两年多时间内,天鹜科技依托自主研发的AI蛋白质设计通用大模型AccelProtein™,已成功交付了二十余款蛋白质设计项目,成为了国内领先的AI蛋白质设计服务商。
“我们目前与医药企业的合作模式以CRO模式为主,服务内容包括为处于早期研发阶段的蛋白类药物以及生产工艺环节所使用的工具蛋白提供设计优化服务。”刘灏介绍称,目前为止AI蛋白质设计依然是一项比较新的技术,对有效性的验证非常重要,通过提供优化服务,为企业带来短期收益的同时,也不断验证平台的有效性,“成功案例越多,客户与我们合作的意愿也会更强烈,这是一个正向的循环。”
从长期需求来看,由于具有靶向性强、生物活性高等优势,单抗、双抗、ADC、融合蛋白等基于蛋白质的药物近年来备受青睐,药企研发项目的增多使得蛋白质设计服务需求持续增长。此外,一些细胞和基因疗法中所使用的工具类蛋白也需要设计和优化,AI蛋白质设计服务在这些领域有着很大的应用潜力。
不过,由于创新药行业目前整体仍处于景气低位,对于AI蛋白质设计服务企业而言,如何拓展业务空间,实现稳定增长是当下需面临的问题。
“药物研发受到严格的法规约束,对产品的性能要求更高,验证周期也相对更长,因此我们需要拓展一些新的业务来提升快速变现的能力。”刘灏称,AccelProtein™是一个通用大模型,可以应用于酶制剂、合成生物学、生物药等多个不同领域的蛋白质设计中,为企业向上述领域拓展提供技术支持。
“在酶制剂或合成生物学领域,客户对产品的性能要求相对单一,实验流程模块化程度较高,从产品交付到中试放大生产再到产品上市,整个周期相对药物研发是很短的。”刘灏表示,由于验证周期短,公司本身也会提供中试工艺开发等延伸服务,从而进一步帮助客户缩短产品开发周期。
据了解,这并不是个例,国内另一家AI蛋白质设计企业分子之心,也正基于其NewOrigin大模型以及在产业项目方面所积累的经验,逐渐将业务范围向材料、食品、化工、农业等诸多领域拓展。
不过,刘灏表示,相对于合成生物和酶制剂等业务领域,药物研发尽管短期回报较慢,但高投入高回报的特点决定了长期发展上限更高,因此依然是十分值得看好的发展方向。
数据、研发经验和成功案例是核心竞争力
数据是AI制药的要素之一,也往往是制约AI制药企业发展的瓶颈。在蛋白质设计领域,数据同样是关键的资源之一。
据悉,由于行业的独特性,AI蛋白质设计企业可以从目前已公开的2.8亿条蛋白质序列数据中获利,但真正拉开差距的远非这2.8亿条数据。
刘灏表示,在小分子药物领域,国际大药厂数十年积累的实验数据资源是其构建AI模型的重要优势;在蛋白质设计领域,企业也在纷纷构建自己的数据壁垒,天鹜科技在2.8亿条公开数据的基础上,还建立了5亿条私有数据集,以此为基础训练的大模型为公司在蛋白质设计优化服务方面带来显著优势。
除了数据资源,在产品研发方面的经验和成功案例对于AI蛋白质设计企业核心竞争力的影响也非常明显。刘灏表示,在面对下游客户时,成功交付的案例数量往往受到更多关注。
元星智药CEO王梅杰也认为,在蛋白质设计领域,持续研发过程中积累的成功经验,尤其是不断积累的技术专利,将构成AI+企业的护城河。
随着国内药企ADC、单抗等大分子创新药研发项目的持续推进,国内AI蛋白质设计企业积累的经验和案例有望随之增长,从而不断打造和增强企业核心竞争力。