当前位置:首页 > 化工头条

CompleteRXN 构建化学反应数据库补全基准,约束解码模型在极端分布外测试达91%准确率

化工头条2026-05-04166
B910化工消息:4月30日,arXiv发表研究引入了CompleteRXN,一个大规模监督基准,用于在真实缺失数据条件下完成化学反应方程式。

化学反应数据库如USPTO存在严重的不完整性,经常缺少副产物、共反应物和化学计量系数。这限制了它们在下游应用中的适用性和可靠性。研究通过将USPTO记录映射到整理过的机理反应,构建了对齐的不完整反应和原子平衡反应数据集。

研究评估了多种基线方法,包括带约束解码的编码器-解码器反应补全模型CRB和算法方法SynRBL。在CompleteRXN基准上,CRB在随机分割上达到99.20%等价准确率,在极端分布外分割上达91.12%。SynRBL产生了许多平衡且化学上合理的补全结果,但在基准测试分割上准确率较低。

所有方法在缺失程度增加时性能退化。在基准外的完整未整理USPTO上评估时,性能出现显著下降,凸显了基准性能与实用鲁棒性之间的差距,为未来工作提供了动力。 (来源:arXiv)

扫描二维码推送至手机访问。

版权声明:本文由B910化工发布,如需转载请注明出处。

本文链接:https://b910.cn/N/1072.html

分享给朋友:

相关文章

特朗普签署行政令推动迷幻药审批,相关上市公司股价上涨

美国总统特朗普签署行政令,指示FDA向获得突破性疗法认定的迷幻药发放局长国家优先审评券(CNPV),推动atai Life Sciences、Otsuka等涉足迷幻药研发的企业股价上涨。该政策为迷幻药…

机器学习筛选拓扑量子材料发现高电压镁离子电池正极候选材料

研究团队结合改进型晶体图卷积神经网络(mCGCNN)与第一性原理计算,对917种含镁拓扑量子材料进行筛选,发现Mg₂VO₄和Mg₆MnO₈两种高电压正极候选材料,平均电压分别达3.66V和4.06V,…

Flagship孵化公司Serif Biomedicines走出隐身模式,推出"修饰DNA"新治疗类别

由Flagship Pioneering于2021年创立的生物技术公司Serif Biomedicines正式走出隐身模式,推出"修饰DNA"(Modified DNA)新治疗类别,旨在将mRNA的可…

INEOS投资45亿欧元建设欧洲最节能裂解烉置,Ratcliffe质疑欧盟资金政策

INEOS创始人Jim Ratcliffe发声质疑欧盟创新基金拒绝资助Project ONE项目的合理性。INEOS在安特卫普投资45亿欧元建设的世界级石化裂解装置将碳排放削减三分之二,是欧洲30年来…

兰州石化:持续转型升级 推动绿色低碳发展

兰州石化:持续转型升级 推动绿色低碳发展

        从正式跨入百万吨乙烯炼化生产企业序列,到形成兰州、榆林、长汀产业协同发展新格局 …… 作为始建于国家 " 一五 " 期间、&…

10月化学原料和制品出厂价格同比下降6%,环比上涨1.1%

    11月10日,国家统计局发布的数据显示,2020年10月份,全国工业生产者出厂价格同比下降2.1%,环比持平;工业生产者购进价格同比下降2.4%,环比上涨0.2%。其中,化…