MLST编辑优选:机器学习在生物集群运动相变中的应用
文章介绍
Tingting Xue(薛婷婷), Xu Li(李旭), Xiaosong Chen(陈晓松), Li Chen(陈理) and Zhangang Han(韩战钢)
通讯作者:
- 陈理,陕西师范大学物理学与信息技术学院
- 韩战钢,北京师范大学系统科学学院
研究背景:
厘清相变本质和确定相变边界是理解复杂系统的一个基本科学问题。生物集群运动作为近年来一个新兴的非平衡系统,吸引了诸多领域中学者的关注,其中的相变类型问题一直存在争议。特别是,近几年在经典Vicsek模型中发现了新的cross sea相(如图一的III),为此问题增添了新的复杂性。传统研究相变都是基于计算结构序参量,我们通过系统计算能够确定总共4个相之间的相变均为一级相变,但这些参量在有些参数区间不敏感,导致不同相之间的边界无法得到准确界定(图二)。我们在这项工作中,利用了CNN来作为一种新的尝试去解决这一问题。
图一 Vicsek模型在不同噪声下的典型快照。
图二 结构序参量随噪音的变化趋势。
研究内容:
本工作的主要思想是使用监督学习,对不同相的物理状态进行采样,如图一中的粒子空间分布斑图,连同其所处的相标记作为训练数据集来训练神经网络;训练完成后,利用CNN来估计测试数据处于各个相的概率;最后,根据这些概率推断出相变点。具体来说,我们选择纯态的典型快照图片作为训练集,以保证每个图像标签的正确性。但对于测试集来说,并无任何要求。训练集、验证集和测试集中独立采样,没有重叠图像。
本研究成功地利用CNN对相位进行了高精度的分类,并识别出了相变点,克服了各种传统方法无法获得相变点的困难(图三)。图三中,随着系统尺寸增加,有新的相涌现出来,不同相及其的概率能以很高的精度被识别出来。
图三 不同尺寸下测试集输出概率随噪音的变化,分别为L=32,128,512,1408。
简言之,本工作澄清了Vicsek模型中相变类型的本质,并且展示了CNN可以在没有系统先验知识的情况下精准地确定相变点,为研究复杂系统中的相变提供了新的可能性。
作者介绍
薛婷婷(左) 博士生 李旭(右) 博士生
北京师范大学系统科学学院
陈晓松 教授
北京师范大学系统科学学院
陈理 教授
陕西师范大学物理学与信息技术学院
韩战钢 教授
北京师范大学系统科学学院
期刊介绍
- 2021年影响因子:6.013 Citescore:4.2
- Machine Learning: Science and Technology (MLST)是一本跨学科期刊,致力于发表智能机器在物理、材料科学、化学、生物学、医学、地球科学、天文学和工程学等多学科领域的应用和发展。涉及领域包括:物理学和空间科学;设计和发现新材料和分子;材料表征技术;模拟材料、化学过程和生物系统;原子和粗粒度模拟;量子计算;生物学、医学和生物医学成像;地球科学(包括自然灾害预测)和气候学;模拟方法和高性能计算。同时,也包括机器学习方法在概念上的新进展:新的学习算法;深度学习架构;核心方法;概率和贝叶斯方法;生成方法;强化和主动学习;经常性和基于时间结构的方法;神经启发方法(包括神经形态计算)。