天文观测产生海量数据 用机器学习给天体分类已十分普遍
随着下一代大规模测光巡天项目的开展,人们期待发现数以万计的强引力透镜系统。但如何在海量天体图像中快速地找到强引力透镜候选体?近年来,人工智能的快速发展,给人类提供了一种新的可能。
以2009年发射升空的世界首个用于探测太阳系外类地行星的飞行器开普勒太空望远镜为例,仅在起初3年半的任务期内,就监控了超过15万个恒星系统,同时也产生了海量数据。这些数据通常要经由计算机处理,但当计算机识别出一定的信号时,又必须依靠人类分析,判断其是否是行星轨道所产生的,这项巨大的筛查工作单靠美国国家航空航天局(NASA)的科学家或科学小组,是无法有效完成的。
“如此大的数据量,人工分析在很多时候已经达不到所需要的速度。借助人工智能的优势,我们可以极大地提升对数据的分析速率。”龙潜向科技日报记者介绍,人工智能展现出来的效率和准确性远高于传统方法。
龙潜研究员长期从事人工智能深度学习方面的研究。近期,他与尔欣中教授团队合作,构建并训练了一个卷积神经网络,用来寻找强引力透镜系统。他们把这个网络应用到欧洲南方天文台2.6米巡天望远镜(VST)千平方度巡天数据,并找到了38个新的强引力透镜候选体。此次构建的神经网络,也可应用于其他大型望远镜的巡天数据。
“在这项工作中,我们用计算机分别模拟了强引力透镜图像和非强引力透镜图像,从而来训练计算机。我们发现,在准备训练计算机的图像时,非强引力透镜图像比强引力透镜更加重要。”尔欣中说,开始的分析中,他们使用简单的规则星系图像作为非强引力透镜训练样本,发现结果正确率非常低。只有把各种可能的非引力透镜图像都考虑进来之后,才能得到比较好的结果。
“这就像在教电脑认识什么是狗的时候,还要告诉它猫、羊、牛等都不是狗。而如果你只告诉它猫不是狗,电脑有非常大的概率把羊、牛认成狗。”龙潜说,目前利用机器学习来对天文学中各种天体分类已经非常普遍,最简单的是把恒星和星系分开,或者把不同行态的星系进行分类,以及利用星系的多重颜色来估计星系的距离等。
东航为最美逆行者保驾护航 “焕享一新——百联千店 i 购季”百联集团新零售全业态奏 北斗收官,“梦之蓝M6+”助力中国航天直奔苍穹! 中兴通讯LTE-V2X车载模组ZM8350助力智能网联车路协同发展