Angew. Chem. :分子热力学与机器学习耦合的共晶预测新方法

  • A+


共晶因其独特的分子协同效应,在新型功能材料设计和生物医药领域的创新制剂开发中展现出革命性潜力,特别是在提升材料机械性能、优化药物溶解特性及生物利用度等方面具有不可替代的应用价值。然而,共晶筛选常采用实验试错法,开发技术风险和成本居高不下。人工智能技术的发展为共晶筛选提供了新的途径,具有快速和成本低的优势。然而,目前对共晶形成的多尺度机制缺乏深入、系统和科学的认识,限制了人工智能方法在该领域应用的可靠性。此外,工业上共结晶往往采用溶液结晶法,反应溶剂的选择对结晶产物的纯度和产率均具有重要影响,但目前对溶剂介导的共晶形成及调控机制尚未建立完整的科学框架,晶型选择性与过程稳定性的动态耦合关系仍未阐明,这直接导致结晶工艺开发陷入“配体筛选-溶剂选择-过程优化-质量控制”的迭代困局,使得技术开发风险和成本显著攀升。

针对上述挑战,近日东南大学吉远辉教授团队通过将共结晶分子热力学机制与机器学习算法深度融合,提出“共晶配体和反应溶剂”共预测的创新策略,该研究是向推进“机制+数据驱动”的晶体工程设计迈出的重要一步。



1

作者通过将XGBoost算法耦合分子结构描述符与多种热力学机制模型,包括:汉森溶解度参数(HSP)、真实溶剂类导体屏蔽模型(COSMO-RS模型)和微扰链统计缔合流体理论(PC-SAFT),实现了在配体和反应溶剂预测性能上的大幅提高,相较仅基于结构描述符的模型准确率提高了12.6%,这主要得益于分子结构和热力学机制模型的互补性。此外,三种热力学机制模型分别从混溶性、混合热力学、分子间相互作用的角度实现了对共结晶过程热力学驱动力的全面捕捉。在此基础上,通过可解释模型SHAP分析揭示了热力学机制在模型决策中的重要贡献,定量阐明了过剩熵、过剩焓、溶解度参数距离、药物-溶剂色散能参数等热力学机制参数对模型的贡献,有助于在后续结晶工艺开发中理性选择配体和溶剂来实现理想的结晶产物,为结晶工艺的智能设计提供了机制基础。

2
3

进一步地,作者在包含105组药物共晶和含能共晶的独立测试集中验证了模型的准确性、稳定性和泛化性,并在与五种竞争性模型的对比中得到了验证。最后,通过对抗真菌药物酮康唑与两种配体在九种反应溶剂中的共结晶实验,进一步证实了模型的可靠性和在实际场景中的应用潜力。

0
00

该工作是首例热力学机制与人工智能融合的共晶配体和反应溶剂预测模型,为指导建立共晶工业化的筛选流程提供了一种高效的方案。

文信息

Unlocking the Potential of Machine Learning in Co-crystal Prediction by a Novel Approach Integrating Molecular Thermodynamics

Yutong Song, Yewei Ding, Junyi Su, Jian Li, Yuanhui Ji


Angewandte Chemie International Edition

DOI: 10.1002/anie.202502410



weinxin
我的微信
关注我了解更多内容

发表评论

目前评论: