MLST编辑优选:神经网络变分蒙特卡洛中的方差精准外推法
文章介绍
通讯作者:
- 陈基,北京大学
- 任维络,字节跳动研究部
研究背景:
在量子力学领域,精确求解多体薛定谔方程以确定电子结构是一项重大挑战。尽管量子蒙特卡洛方法以其高精度成为解决该问题的有力工具,但其计算成本高昂,且面临诸如费米子体系符号问题等难题。近年来,基于神经网络波函数拟设的变分蒙特卡洛方法因其极高的能量计算精度而引起广泛关注。然而,使用该方法计算相对能量时,采用统一的网络架构和训练步数往往无法有效抵消误差,导致这种简单策略在相对能量计算上精度较低。本研究通过采用方差外推法来解决此问题,对不同体系的计算结果应用方差外推,以零方差对应的能量数据计算相对能量。这种方法不仅加快了能量的收敛过程,更重要的是显著提高了相对能量结果的准确性,从而大幅提升了神经网络变分蒙特卡洛方法的效率和实用性。
研究内容:
神经网络变分蒙特卡洛方法利用高表达力的神经网络来模拟多电子波函数,并通过蒙特卡洛方法优化波函数以求解定态薛定谔方程的基态,如图1a所示。传统上,在缺乏有效评估策略时,采用简单的“训练匹配”方法来计算相对能量,但这种方法对不同体系的误差抵消效果并不理想。本文提出使用能量方差作为评估指标,引入“方差匹配”和基于训练阶段能量与方差高度线性相关性的“方差外推”方法,后者通过零方差对应的能量数据计算相对能量。
图 1 神经网络变分蒙特卡洛方法示意图,其中存在的问题以及本文提出的改进方法
氮气分子在不同的键长下展现出非常不同的组态关联效应,因此是一个极佳的测试体系。如图2所示,本文在氮气分子上的测试结果表明,“方差匹配”和“方差外推”方法均能够提升相对能量结果的准确性。其中,“方差外推”方法的提升效果尤为显著,不仅大大加速了相对能量结果的收敛过程,而且极大提升了其精度。除此之外,“方差外推”方法还很好地实现了能量结果的尺寸一致性。
图 2 氮气分子不同键长体系测试结果
在进一步的周期性体系测试中,“方差外推”方法同样极大地提高了相对能量精度。值得一提的是,经考察该方法不依赖于优化器的选择或具体的神经网络架构,且无需额外的计算开销。因此,我们期望它将成为未来神经网络变分蒙特卡洛方法使用各种强大的神经网络拟设计算相对能量时的一个重要而强力的工具。
作者介绍
陈基 研究员
北京大学
- 陈基,北京大学物理学院凝聚态物理与材料物理研究所研究员、助理教授、博士生导师。中国科学技术大学物理系本科,北京大学物理学院博士,英国伦敦大学学院博士后,德国马普所固体研究所洪堡博士后。入选国家海外高层次青年人才、北京市杰出青年人才。主要研究方向和兴趣是量子蒙特卡洛和机器学习计算方法的发展,以及应用先进计算方法研究水等轻元素凝聚态物质。
任维络
ByteDance Research
- 任维络,现任ByteDance Research算法研究员,从事AI for Science方向研究,博士毕业于斯坦福大学,本科毕业于中国科学技术大学。现在的研究重点是基于神经网络的量子蒙特卡洛及其在量子物理、量子化学中的应用。
期刊介绍
- 2023年影响因子:6.3 Citescore:9.1
- Machine Learning: Science and Technology (MLST)是一本跨学科期刊,致力于发表智能机器在物理、材料科学、化学、生物学、医学、地球科学、天文学和工程学等多学科领域的应用和发展。涉及领域包括:物理学和空间科学;设计和发现新材料和分子;材料表征技术;模拟材料、化学过程和生物系统;原子和粗粒度模拟;量子计算;生物学、医学和生物医学成像;地球科学(包括自然灾害预测)和气候学;模拟方法和高性能计算。同时,也包括机器学习方法在概念上的新进展:新的学习算法;深度学习架构;核心方法;概率和贝叶斯方法;生成方法;强化和主动学习;经常性和基于时间结构的方法;神经启发方法(包括神经形态计算)。