PROBE方法实现机器学习原子势可靠性概率预测,性能随骨干网络表达力增强而提升
B910化工消息:5月1日,arXiv发表研究提出了一种新的机器学习原子势(MLIP)不确定性量化方法PROBE(Post-hoc Reliability from Backbone Embeddings)。
现有的MLIP不确定性量化方法依赖于独立训练的骨干网络集成,这些方法在基础模型规模的MLIP上扩展性不佳,且成员分歧信号与每分子预测误差的相关性较弱。
PROBE采用了一种根本不同的策略:在预训练MLIP的冻结逐原子表征上训练一个紧凑的判别分类器,将MLIP不确定性量化重新构建为选择性分类而非误差回归。该方法产生逐预测的可靠性概率,单调跟踪实际误差,且不需要修改底层模型。
在大规模保留评估集和两种结构不同的MLIP架构上,PROBE作为二元可靠性信号优于集成分歧。其性能随骨干表征表达力的增强而增强,暗示了向基础模型规模MLIP的有利扩展轨迹。多头自注意力还额外提供了逐原子重要性图谱,在不增加计算成本的情况下提供化学可解释的诊断信息。PROBE是后验的、架构无关的,可直接部署在任何暴露逐原子表征的MLIP上。 (来源:arXiv)
现有的MLIP不确定性量化方法依赖于独立训练的骨干网络集成,这些方法在基础模型规模的MLIP上扩展性不佳,且成员分歧信号与每分子预测误差的相关性较弱。
PROBE采用了一种根本不同的策略:在预训练MLIP的冻结逐原子表征上训练一个紧凑的判别分类器,将MLIP不确定性量化重新构建为选择性分类而非误差回归。该方法产生逐预测的可靠性概率,单调跟踪实际误差,且不需要修改底层模型。
在大规模保留评估集和两种结构不同的MLIP架构上,PROBE作为二元可靠性信号优于集成分歧。其性能随骨干表征表达力的增强而增强,暗示了向基础模型规模MLIP的有利扩展轨迹。多头自注意力还额外提供了逐原子重要性图谱,在不增加计算成本的情况下提供化学可解释的诊断信息。PROBE是后验的、架构无关的,可直接部署在任何暴露逐原子表征的MLIP上。 (来源:arXiv)


