药物虚拟筛选平台实现千亿级分子库秒级检索
传统需数月甚至数年的药物早期筛选过程,现在可缩短至数十秒。记者27日从国家超级计算天津中心获悉,该中心首席科学家孟祥飞和清华大学智能产业研究院教授兰艳艳领衔的AI(人工智能)生物医药团队,研发出面向超大规模药物发现的AI虚拟筛选平台——GalaxyVS。该平台依托新一代天河超算系统,在全球范围内首次实现对近千亿级可合成化合物库的秒级虚拟筛选。
创新药物研发过程中,从海量化合物中找到能靶向特定蛋白的活性分子尤为关键。实测数据显示,GalaxyVS单次检索千亿分子库几十秒内即可完成,平均单个靶点口袋检索用时不到1秒。系统日吞吐量达约16万亿次分子对接,比当前国际最先进的超算纪录高出6个数量级。
“GalaxyVS围绕近千亿级化学空间重构了一套‘AI模型+超级计算+高性能检索+药物化学约束’的全流程平台。”项目团队核心成员、国家超级计算天津中心李培顺博士介绍。平台以清华大学智能产业研究院团队的DrugCLIP模型为基础,将蛋白口袋与小分子映射到统一向量空间,把传统依赖逐一对接的蛋白—配体匹配问题,转化为可大规模并行执行的高维向量快速检索,从而突破了传统分子对接在速度和规模上的限制。
李培顺表示,该平台为肿瘤、神经退行性疾病、新发传染病等领域的先导分子发现提供了全新路径。未来,GalaxyVS有望进一步拓展至跨物种蛋白—配体互作图谱构建、大规模开放数据集建设和AI驱动药物发现基础设施建设。
(文章来源:科技日报)