文章推广

MLST编辑优选：机器学习在生物集群运动相变中的应用

08 Jun 2023 gabriels

本工作来自北京师范大学韩战钢、陈晓松与陕西师范大学陈理课题组。该工作首先证实了Vicsek模型中相邻两相的相变均为一级相变，但由于传统序参量不敏感，本研究借助卷积神经网络（CNN），成功地完成了相分类，精确地找到了各相变点。此工作展示了机器学习在研究复杂系统方面的巨大潜力。

文章介绍

Machine learning phases in swarming systems

Tingting Xue（薛婷婷）, Xu Li（李旭）, Xiaosong Chen（陈晓松）, Li Chen（陈理） and Zhangang Han（韩战钢）

通讯作者：

陈理，陕西师范大学物理学与信息技术学院
韩战钢，北京师范大学系统科学学院

研究背景：

厘清相变本质和确定相变边界是理解复杂系统的一个基本科学问题。生物集群运动作为近年来一个新兴的非平衡系统，吸引了诸多领域中学者的关注，其中的相变类型问题一直存在争议。特别是，近几年在经典Vicsek模型中发现了新的cross sea相（如图一的III），为此问题增添了新的复杂性。传统研究相变都是基于计算结构序参量，我们通过系统计算能够确定总共4个相之间的相变均为一级相变，但这些参量在有些参数区间不敏感，导致不同相之间的边界无法得到准确界定（图二）。我们在这项工作中，利用了CNN来作为一种新的尝试去解决这一问题。

图一 Vicsek模型在不同噪声下的典型快照。

图二结构序参量随噪音的变化趋势。

研究内容：

本工作的主要思想是使用监督学习，对不同相的物理状态进行采样，如图一中的粒子空间分布斑图，连同其所处的相标记作为训练数据集来训练神经网络；训练完成后，利用CNN来估计测试数据处于各个相的概率；最后，根据这些概率推断出相变点。具体来说，我们选择纯态的典型快照图片作为训练集，以保证每个图像标签的正确性。但对于测试集来说，并无任何要求。训练集、验证集和测试集中独立采样，没有重叠图像。

本研究成功地利用CNN对相位进行了高精度的分类，并识别出了相变点，克服了各种传统方法无法获得相变点的困难（图三）。图三中，随着系统尺寸增加，有新的相涌现出来，不同相及其的概率能以很高的精度被识别出来。

图三不同尺寸下测试集输出概率随噪音的变化，分别为L=32，128，512，1408。

简言之，本工作澄清了Vicsek模型中相变类型的本质，并且展示了CNN可以在没有系统先验知识的情况下精准地确定相变点，为研究复杂系统中的相变提供了新的可能性。

作者介绍

薛婷婷（左） 博士生 李旭（右） 博士生

北京师范大学系统科学学院

陈晓松 教授

北京师范大学系统科学学院

陈理教授

陕西师范大学物理学与信息技术学院

韩战钢 教授

北京师范大学系统科学学院

期刊介绍

Machine Learning: Science and Technology

2021年影响因子：6.013 Citescore：4.2
Machine Learning: Science and Technology （MLST）是一本跨学科期刊，致力于发表智能机器在物理、材料科学、化学、生物学、医学、地球科学、天文学和工程学等多学科领域的应用和发展。涉及领域包括：物理学和空间科学；设计和发现新材料和分子；材料表征技术；模拟材料、化学过程和生物系统；原子和粗粒度模拟；量子计算；生物学、医学和生物医学成像；地球科学（包括自然灾害预测）和气候学；模拟方法和高性能计算。同时，也包括机器学习方法在概念上的新进展：新的学习算法；深度学习架构；核心方法；概率和贝叶斯方法；生成方法；强化和主动学习；经常性和基于时间结构的方法；神经启发方法（包括神经形态计算）。