
MLST编辑优选:机器学习在生物集群运动相变中的应用
本工作来自北京师范大学韩战钢、陈晓松与陕西师范大学陈理课题组。该工作首先证实了Vicsek模型中相邻两相的相变均为一级相变,但由于传统序参量不敏感,本研究借助卷积神经网络(CNN),成功地完成了相分类,精确地找到了各相变点。此工作展示了机器学习在研究复杂系统方面的巨大潜力。 文章介绍 Machine learning phases in swarming systems Tingting Xue(薛婷婷), Xu Li(李旭), Xiaosong Chen(陈晓松), Li Chen(陈理) and Zhangang Han(韩战钢) 通讯作者: 陈理,陕西师范大学物理学与信息技术学院 韩战钢,北京师范大学系统科学学院 研究背景: 厘清相变本质和确定相变边界是理解复杂系统的一个基本科学问题。生物集群运动作为近年来一个新兴的非平衡系统,吸引了诸多领域中学者的关注,其中的相变类型问题一直存在争议。特别是,近几年在经典Vicsek模型中发现了新的cross sea相(如图一的III),为此问题增添了新的复杂性。传统研究相变都是基于计算结构序参量,我们通过系统计算能够确定总共4个相之间的相变均为一级相变,但这些参量在有些参数区间不敏感,导致不同相之间的边界无法得到准确界定(图二)。我们在这项工作中,利用了CNN来作为一种新的尝试去解决这一问题。 图一 Vicsek模型在不同噪声下的典型快照。 图二 结构序参量随噪音的变化趋势。 研究内容: 本工作的主要思想是使用监督学习,对不同相的物理状态进行采样,如图一中的粒子空间分布斑图,连同其所处的相标记作为训练数据集来训练神经网络;训练完成后,利用CNN来估计测试数据处于各个相的概率;最后,根据这些概率推断出相变点。具体来说,我们选择纯态的典型快照图片作为训练集,以保证每个图像标签的正确性。但对于测试集来说,并无任何要求。训练集、验证集和测试集中独立采样,没有重叠图像。 本研究成功地利用CNN对相位进行了高精度的分类,并识别出了相变点,克服了各种传统方法无法获得相变点的困难(图三)。图三中,随着系统尺寸增加,有新的相涌现出来,不同相及其的概率能以很高的精度被识别出来。 图三 不同尺寸下测试集输出概率随噪音的变化,分别为L=32,128,512,1408。 简言之,本工作澄清了Vicsek模型中相变类型的本质,并且展示了CNN可以在没有系统先验知识的情况下精准地确定相变点,为研究复杂系统中的相变提供了新的可能性。 作者介绍 薛婷婷(左) 博士生 李旭(右) 博士生 北京师范大学系统科学学院 陈晓松 教授 北京师范大学系统科学学院 陈理 教授 陕西师范大学物理学与信息技术学院 韩战钢 教授 北京师范大学系统科学学院 期刊介绍 Machine Learning: Science and...