一个面向原始数据搜寻的快速射电暴数据集
Abstract
快速射电暴是目前国际天文学新兴前沿热点, 随着海量观测数据带来的处理和分析的挑战, 亟需开展快速射电暴信号智能搜寻和甄别的研究. 为了加速快速射电暴搜寻研究, 开发了一套基于机器学习的快速射电暴数据集, 它可以训练机器学习算法以搜寻原始数据中的快速射电暴. 目前数据集有8020个快速射电暴、4010个背景噪声和4010个射频干扰仿真图像, 这些图像是根据开放的快速射电暴观测结果构建的, 并可根据需要扩展数量. 本研究旨在为最先进的人工智能算法提供开源数据集, 以测试和比较快速射电暴识别算法. 该数据集为卷积神经网络(Convolutional Neural Network, CNN)和经典机器学习算法提供图像和numpy格式的文件. 数据集可以实现快速射电暴和非快速射电暴分类, 或快速射电暴、射频干扰和背景噪声分类. 在本例中, 使用有预训练模型的31种经典CNN算法. 在快速射电暴/非快速射电暴分类中, 第一个历元训练中达到90%以上的准确率, 在真实数据测试中达到99.8%的最大准确率.