澳科大博士生在国际顶级会议KDD 2026发表创新研究成果:提出全球首个分子毒性修复基准ToxiMol
澳科大博士生在国际顶级会议KDD 2026发表创新研究成果:提出全球首个分子毒性修复基准ToxiMol
近日,澳门科技大学创新工程学院智能科学与系统博士课程三年级博士生林飞作为第一作者,在国际顶级学术会议 ACM SIGKDD Conference on Knowledge Discovery and Data Mining(KDD 2026)发表题为《Breaking Bad Molecules: Are MLLMs Ready for Structure-Level Molecular Detoxification?》的研究论文,该论文脱颖而出,获录用为 Oral(Oral录用仅为该会所有录用论文中的前20%)发表。论文由澳门科技大学联合上海交通大学、中国科学院自动化研究所、中国科学院过程工程研究所生物药制备与递送全国重点实验室、上海人工智能实验室及宁波大学共同完成,其通讯作者为澳科大创新工程学院工程科学系教授王飞跃。

林飞博士生
KDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining)是数据挖掘、人工智能与数据科学领域最具影响力的国际顶级学术会议之一,被中国计算机学会(CCF)推荐为A类国际学术会议。根据 Google Scholar Metrics 统计,KDD 长期位居数据挖掘与知识发现领域国际顶尖会议行列,在全球人工智能与数据科学研究领域具有广泛影响力。本次论文获录用于 KDD 2026 AI for Sciences Track Oral,仅占录用论文中的少数比例,体现了该研究成果的创新性与学术价值。此次成果也是澳门科技大学作为第一单位在 KDD 会议上发表的首篇研究成果,彰显了澳科大在人工智能与生命科学交叉领域(AI for Science)的卓越研究实力与创新能力 。
在新药研发过程中,研究人员常常会遇到一个关键难题:一个候选分子可能具有良好的药效潜力,却同时伴随肝毒性、心脏毒性或致突变风险。对于药物化学家而言,理想的解决方案并不是完全推翻原有分子重新设计,而是在尽量保留其核心结构和药物潜力的前提下,精准调整可能引发毒性的结构片段,从而降低风险、提升安全性。这一过程看似只是「改一改分子」,实际上却高度依赖专业知识、经验判断和反复实验。研究人员不仅要判断分子为什么可能有毒,还要考虑修改之后是否仍然像一个可成药的分子,是否容易合成,是否会因为解决一个毒性问题而引入新的药物开发障碍。因此,分子毒性修复是药物发现中极具挑战性的任务之一。而且,传统的分子去毒工作高度依赖资深药物化学专家的反复试验,所以成本也一直居高不下。
近年来,多模态大模型在图像理解、文本推理和复杂任务生成方面展现出快速进展,也开始被应用于分子设计、药物发现等科学问题。由此,一个值得深入检验的问题随之出现,该问题也一直缺乏系统性地验证:当模型看到一个有毒分子,并被明确告知需要降低某一类毒性时,大模型是否真的能够像药物化学专家一样,对分子结构进行合理修改?它是理解了结构与毒性之间的关系,还是只是根据已有模式生成一个「看起来像分子」的答案?
围绕这一问题,研究团队提出了全球首个专为评估通用 MLLMs 分子毒性修复能力而设计的基准任务——ToxiMol。与传统的判断分子是否有毒不同,ToxiMol 关注的是更进一步的结构级修复任务:给定一个真实有毒分子及其对应的毒性类型,要求模型生成一个新的分子结构,使其在降低目标毒性的同时,尽可能保留原有分子的核心性质和药物开发潜力。ToxiMol 覆盖 11 个毒性修复主任务,涵盖 LD50、DILI、AMES 等典型毒性端点,并构建了 660 个具有较高结构复杂度和机制差异性的真实有毒分子样本。该基准不仅考察模型能否生成合法分子,更强调模型是否具备面向真实药物研发场景的综合优化能力。为了更加严格地评估模型生成结果,研究团队进一步设计了多维度评估体系 ToxiEval。该框架采用了「全约束通过」的严格策略,大模型给出的修复方案必须同时满足结构有效性、安全评分、成药性(QED)、合成可行性(SAS)以及结构相似性等多重约束,才会外被判定为毒性修复成功。通过 ToxiMol 与 ToxiEval 的结合,此项成果首次构建起面向结构级分子毒性修复任务的标准化评测体系,为后续相关领域的探索提供了重要的基础设施。

ToxiMol 分子毒性修复任务与 ToxiEval 多准则评估链
此次研究成果的发表,展现了澳门科技大学在人工智能与交叉科学研究领域的持续创新能力,以及在 AI for Science 前沿方向上的国际竞争力。未来,澳门科技大学将继续支援前沿科学研究,推动人工智能与生命科学、医药健康等领域的深度融合,为全球科技创新与智能社会发展贡献更多力量。
⬇️论文链接⬇️

(https://arxiv.org/abs/2506.10912)
GitHub 项目主页:https://github.com/HydroSophy/ToxiMol
数据集:https://huggingface.co/datasets/HydroSophyTech/ToxiMol-benchmark