MLST编辑优选:机器学习在生物集群运动相变中的应用

08 6月 2023 gabriels
本工作来自北京师范大学韩战钢、陈晓松与陕西师范大学陈理课题组。该工作首先证实了Vicsek模型中相邻两相的相变均为一级相变,但由于传统序参量不敏感,本研究借助卷积神经网络(CNN),成功地完成了相分类,精确地找到了各相变点。此工作展示了机器学习在研究复杂系统方面的巨大潜力。


文章介绍

Machine learning phases in swarming systems

Tingting Xue(薛婷婷), Xu Li(李旭), Xiaosong Chen(陈晓松), Li Chen(陈理) and Zhangang Han(韩战钢)

通讯作者:

  • 陈理,陕西师范大学物理学与信息技术学院
  • 韩战钢,北京师范大学系统科学学院

 

研究背景:

厘清相变本质和确定相变边界是理解复杂系统的一个基本科学问题。生物集群运动作为近年来一个新兴的非平衡系统,吸引了诸多领域中学者的关注,其中的相变类型问题一直存在争议。特别是,近几年在经典Vicsek模型中发现了新的cross sea相(如图一的III),为此问题增添了新的复杂性。传统研究相变都是基于计算结构序参量,我们通过系统计算能够确定总共4个相之间的相变均为一级相变,但这些参量在有些参数区间不敏感,导致不同相之间的边界无法得到准确界定(图二)。我们在这项工作中,利用了CNN来作为一种新的尝试去解决这一问题。

图一 Vicsek模型在不同噪声下的典型快照。

图二 结构序参量随噪音的变化趋势。

 

研究内容:

本工作的主要思想是使用监督学习,对不同相的物理状态进行采样,如图一中的粒子空间分布斑图,连同其所处的相标记作为训练数据集来训练神经网络;训练完成后,利用CNN来估计测试数据处于各个相的概率;最后,根据这些概率推断出相变点。具体来说,我们选择纯态的典型快照图片作为训练集,以保证每个图像标签的正确性。但对于测试集来说,并无任何要求。训练集、验证集和测试集中独立采样,没有重叠图像。

本研究成功地利用CNN对相位进行了高精度的分类,并识别出了相变点,克服了各种传统方法无法获得相变点的困难(图三)。图三中,随着系统尺寸增加,有新的相涌现出来,不同相及其的概率能以很高的精度被识别出来。

图三 不同尺寸下测试集输出概率随噪音的变化,分别为L=32,128,512,1408。

简言之,本工作澄清了Vicsek模型中相变类型的本质,并且展示了CNN可以在没有系统先验知识的情况下精准地确定相变点,为研究复杂系统中的相变提供了新的可能性。


作者介绍

 

薛婷婷(左) 博士生  李旭(右) 博士生

北京师范大学系统科学学院

 

 

陈晓松  教授

北京师范大学系统科学学院

 

 

陈理  教授

陕西师范大学物理学与信息技术学院

 

 

韩战钢  教授

北京师范大学系统科学学院


期刊介绍

Machine Learning: Science and Technology

  • 2021年影响因子:6.013  Citescore:4.2
  • Machine Learning: Science and Technology (MLST)是一本跨学科期刊,致力于发表智能机器在物理、材料科学、化学、生物学、医学、地球科学、天文学和工程学等多学科领域的应用和发展。涉及领域包括:物理学和空间科学;设计和发现新材料和分子;材料表征技术;模拟材料、化学过程和生物系统;原子和粗粒度模拟;量子计算;生物学、医学和生物医学成像;地球科学(包括自然灾害预测)和气候学;模拟方法和高性能计算。同时,也包括机器学习方法在概念上的新进展:新的学习算法;深度学习架构;核心方法;概率和贝叶斯方法;生成方法;强化和主动学习;经常性和基于时间结构的方法;神经启发方法(包括神经形态计算)。