Machine Learning: Science and Technology编辑优选:噪音增强神经网络在解析延拓中的应用

01 9月 2022 gabriels

本篇研究来自清华大学翟荟课题组。本文指出在利用神经网络方法处理解析延拓问题时,在训练集中加入恰当的噪音是非常重要的。


文章介绍

Noise enhanced neural networks for analytic continuation

Juan Yao(姚娟), Ce Wang(王策), Zhiyuan Yao(么志远) and Hui Zhai(翟荟)

通讯作者:

  • 翟荟,清华大学高等研究院

 

研究背景:

解析延拓指的是将虚时关联函数延拓到实时,这是量子多体物理研究中的遇到的一个重要难题。因为物理实验中的直接观测量往往是实时关联函数,而诸如量子蒙特卡洛等数值方法往往只能给出虚时关联函数。因此,我们需要利用解析延拓将数值计算和物理实验观测联系起来。然后,由于从虚时到实时的变换存在内在的奇异性,虚时关联函数所携带的误差会被无限大地放大,导致解析延拓之后得到的结果极大地偏离真实情况。另一方面,受限于数值方法的局限性和精度,虚时关联函数的数据中不可避免携带一些噪音。这就是解析延拓问题的难点所在。过去人们发展了很多方法来解决这一问题,都未能彻底解决这一问题。近年来利用神经网络解决这一问题成为一种新的尝试。

 

研究内容:

图一 构建从虚时关联函数到实时关联函数的神经网络

 

解析延拓的核心问题在于奇异映射对噪音的高度敏感性。因此,我们的研究的重点是,在预测实时关联函数或者普函数时,如何提高神经网络(图一)对噪音的鲁棒性。

 

图二 损失函数在不同噪音下的表现

 

首先,我们以人工模拟谱函数为例,研究了训练集合和测试集合中不同噪音强度的添加对网络预测性能的影响。我们发现当训练集合的噪音略强于测试集合的噪音的时候,神经网络对测试数据集的噪音抵抗性最强(图二)。也就是说对于含有噪音的数据,为了预测其准确性或者提高神经网络的噪音抗性,我们可以在训练集合数据中添加强度略强的噪音。

 

图三 对比maxEn 方法,不加入噪音的神经网络方法,加入噪音的神经网络方法,以及谱函数真实情况

 

进一步地,我们研究了实际蒙特卡洛数值模拟的数据。我们以严格可解的横场伊辛模型为例来阐释如何模拟和选择适当强度的噪音。对于这类数据来说,人们对于其中的实际的噪音强度无从知晓。我们对训练集合添加不同强度的噪音,并对蒙特卡洛数值产生的数据做谱函数预测。因为该模型严格可解,我们了解其实时关联函数的真实情况。从预测表现进而我们可以确定合适的噪音强度来增强神经网络的噪音鲁棒性。对于这一物理模型的预测,我们发现即使在谱函数较为奇异(例如,某一频率范围的谱函数为零,谱函数存在从零奇异增长到非零的区域)的情况下,训练好的噪音增强神经网络依旧可以给出比较合理的预测(图三)。

对于这两种情况,我们发展的方法,其预测结果都明显超过了之前发展的其他处理解析延拓的方法,也超过了数据中不加入噪音的神经网络方法。我们验证了数据集中噪音对神经网络方案效果的增强作用,最终展现了的其性能表现的优越性。


作者介绍

姚娟  助理研究员

南方科技大学量子科学与工程研究院

 

王策  助理教授

同济大学物理科学与工程学院

 

么志远  博士后

清华大学高等研究院

 

翟荟  教授

清华大学高等研究院


期刊介绍

Machine Learning: Science and Technology

  • 2021年影响因子:6.013  Citescore:4.2
  • Machine Learning: Science and Technology (MLST)是一本跨学科期刊,致力于发表智能机器在物理、材料科学、化学、生物学、医学、地球科学、天文学和工程学等多学科领域的应用和发展。涉及领域包括:物理学和空间科学;设计和发现新材料和分子;材料表征技术;模拟材料、化学过程和生物系统;原子和粗粒度模拟;量子计算;生物学、医学和生物医学成像;地球科学(包括自然灾害预测)和气候学;模拟方法和高性能计算。同时,也包括机器学习方法在概念上的新进展:新的学习算法;深度学习架构;核心方法;概率和贝叶斯方法;生成方法;强化和主动学习;经常性和基于时间结构的方法;神经启发方法(包括神经形态计算)。