最近,微软研究院开发的AI²BMD登上了Nature杂志,这是生物分子动力学(MD)模拟中,继经典MD和量子力学之后,首个成功地兼顾了模拟效率和精度的开创性方法。
这是继AlphaFold之后,AI在生化科学领域的又一次革新。
随着AI技术的不断发展,其在生化科学领域的应用也取得了显著的进展。
AlphaFold等算法能够以前所未有的速度预测和分析蛋白质的三维结构,解决了长期以来困扰生物学界的难题。
蛋白质的动态表征和分子相互作用模拟仍是生物科学领域的重要挑战。
微软研究院开发的AI²BMD系统,正是针对这一挑战而诞生的。
AI²BMD是基于人工智能的从头算生物分子动力学系统,它的开发是为了解决生物分子模拟中的精度和效率问题。
经典MD方法侧重于模拟的效率,但精度相对较低;而量子力学方法如DFT虽然精度高,但计算成本高昂,难以处理大型生物分子系统。
AI²BMD的诞生,旨在实现具有从头算精度的生物分子模拟,同时保持较高的计算效率。
1. 蛋白质分片方法:AI²BMD采用了一种通用的蛋白质分片方法,将蛋白质分割为重叠的单元,从而创建了一个包含2000万快照的数据集,这是DFT级别中规模最大的数据库。
2. 基于AI的势能函数:AI²BMD利用机器学习训练了势能函数,利用ViSNet模型在每一步模拟中计算蛋白质的能量和原子力,达到从头算的精度。
3. 高效的模拟程序:为了使用AI²BMD的势能进行模拟,研究团队设计了一个基于原子模拟环境的AI驱动MD模拟程序。该程序支持云环境,可以将计算结果定期保存到云存储,以应对长时间计算中可能出现的断点。
1. 实现了从头算精度:AI²BMD引入了一种可推广的「机器学习力场」,实现了全原子蛋白质动态模拟的从头算精度。
2. 解决泛化问题:AI²BMD首次解决了机器学习力场在蛋白质动态模拟中的泛化难题,展示了多种蛋白质的稳健从头算MD模拟。
3. 通用兼容性:AI²BMD将量子力学建模从小的局部区域扩展到整个蛋白质结构,无需任何蛋白质的先验知识。
4. 速度优势:AI²BMD比DFT和其他量子力学方法快了几个数量级,支持含有超过一万个原子的蛋白质的从头算计算。
5. 多样的构象空间探索:AI²BMD能够探索更多构象空间,提供更多研究蛋白质灵活运动的机会。
6. 与实验高度一致:AI²BMD在不同生物应用场景中,表现出与湿实验的高度一致性。
AI²BMD提出的框架旨在解决机器学习力场在应用中的精度、稳健性和泛化局限。
通过考虑蛋白质的基本结构单元——氨基酸链段,AI²BMD具备高度的通用性、适应性和多功能性。
该方法可以在解决科学难题方面发挥作用,并在药物发现、蛋白质设计和酶工程等生物医学研究领域推动新的发展。
在2023年首届全球AI药物研发大赛中,AI²BMD成功预测出一个可与SARS-CoV-2主蛋白酶结合的化合物,展示了其在加速现实世界药物研发方面的巨大潜力。
本文的主要作者是微软研究院的高级研究员TongWang和高级首席研究经理BinShao。
他们领导的研究团队在生物信息学、计算生物学、分子动力学和机器学习等领域有着深厚的研究背景。
他们的研究成果已在多个高影响力期刊上发表。
AI²BMD是微软研究院在生物科学领域的一项重大突破。
它的出现将为生物分子模拟带来新的视角和可能性,为药物发现、蛋白质设计和酶工程等领域的发展提供强大的支持。
我们期待AI²BMD在未来能够带来更多的突破和创新,推动生物科学的进步。
本文地址: https://www.gosl.cn/hlzxwz/bc976d74fc73e974489b.html
上一篇:OpenAIo1价格昂贵,不必担忧...