首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
大型巡天项目的快速发展,产生大量的恒星光谱数据,也使得实现恒星光谱数据的自动分类成为一项具有挑战性的工作.提出一种新的基于胶囊网络的恒星光谱分类方法,首先利用1维卷积网络和短时傅里叶变换将来源于LAMOST(Large Sky Area Multi-Object Fiber Spectroscopy Telescope)Data Release 5(DR5)的F5、G5、K5型1维恒星光谱转化成2维傅里叶谱图像,再通过胶囊网络对2维谱图像进行自动分类.由于胶囊网络具有保留图像中实体之间的分层位姿关系和无需池化层的优点,实验结果表明:胶囊网络具有较好的分类性能,对于F5、G5、K5型恒星光谱的分类,准确率优于其他分类方法.  相似文献   

2.
天体光谱分类是天文学研究的重要内容之一,其关键是从光谱数据中选择和提取对分类识别最有效的特征构建特征空间.提出一种新的基于2维傅里叶谱图像的特征提取方法,并应用于LAMOST (the Large Sky Area Multi-Object Fiber Spectroscopic Telescope)恒星光谱数据的分类研究中.光谱数据来源于LAMOST Data Release 5(DR5),选取30000条F、 G和K型星光谱数据,利用短时傅里叶变换(Short-Time Fourier Transform, STFT)将1维光谱数据变换成2维傅里叶谱图像,对得到的2维傅里叶谱图像采用深度卷积网络模型进行分类,得到的分类准确率是92.90%.实验结果表明通过对LAMOST恒星光谱数据进行STFT可得到光谱的2维傅里叶谱图像,谱图像构成了新的光谱数据特征和特征空间,新的特征对于光谱数据分类是有效的.此方法是对光谱分类的一种全新尝试,对海量天体光谱的分类和挖掘处理有一定的开创意义.  相似文献   

3.
恒星光谱分类是天文学中一个重要的研究问题.对于已经采集到的海量高维恒星光谱数据的分类,采用模式匹配方法对光谱型分类较为成功,但其缺点在于标准恒星模版之间的差异性在匹配实际观测数据中不能体现出来,尤其是当需要进行光谱型和光度型的二元分类时模版匹配法往往会失败.而采用谱线特征测量的光度型分类强烈地依赖谱线拟合的准确性.为了解决二元分类的问题,介绍了一种基于卷积神经网络的恒星光谱型和光度型分类模型(Classification model of Stellar Spectral type and Luminosity type based on Convolution Neural Network, CSSL CNN).这一模型使用卷积神经网络来提取光谱的特征,通过注意力模块学习到了重要的光谱特征,借助池化操作降低了光谱的维度并压缩了模型参数的数量,使用全连接层来学习特征并对恒星光谱进行分类.实验中使用了大天区面积多目标光纤光谱天文望远镜(Large Sky Area Multi-Object Fiber Spectroscopy Telescope, LAMOST)公开数据集Data Release 5 (DR5,用了其中71282条恒星光谱数据,每条光谱包含了3000多维的特征)对该模型的性能进行验证与评估.实验结果表明,基于卷积神经网络的模型在恒星的光谱型分类上准确率达到92.04%,而基于深度神经网络的模型(Celestial bodies Spectral Classification Model, CSC Model)只有87.54%的准确率; CSSL CNN在恒星的光谱型和光度型二元分类上准确率达到83.91%,而模式匹配方法MKCLASS仅有38.38%的准确率且效率较低.  相似文献   

4.
机器学习在当今的诸多领域已经取得了巨大的成功.尤其是提升算法.提升算法适应各种场景的能力较强、准确率较高,已经在多个领域发挥巨大的作用.但是提升算法在天文学中的应用却极为少见.为解决斯隆数字巡天(Sloan Digital Sky Survey,SDSS)数据中恒星/星系暗源集分类正确率低的问题,引入了机器学习中较新的研究成果–XGBoost (eXtreme Gradient Boosting).从SDSS-DR7 (SDSS Data Release 7)中获取完整的测光数据集,并根据星等值划分为亮源集和暗源集.首先,分别对亮源集和暗源集使用十折交叉验证法,同时运用XGBoost算法建立恒星/星系分类模型;然后,运用栅格搜索等方法调优XGBoost参数;最后,基于星系的分类正确率等指标,与功能树(Function Tree, FT)、Adaboost (Adaptive boosting)、随机森林(Random Forest, RF)、梯度提升决策树(Gradient Boosting Decision Tree, GBDT)、堆叠降噪自编码(Stacked Denoising AutoEncoders, SDAE)、深度置信网络(Deep Belief Network, DBN)等模型进行对比并分析结果.实验结果表明:XGBoost在暗源分类中要比功能树算法的星系分类正确率提高了将近10%,在暗源集的最暗星等中比功能树提高了将近5%.同其他传统的机器学习算法和深度神经网络相比, XGBoost也有不同程度的提升.  相似文献   

5.
深度学习是当前机器学习、模式识别和人工智能领域中的一项热点研究技术,非常适用于处理复杂的大规模数据.基于深度学习理论构建了一个5层的栈式自编码深度神经网络,对恒星大气物理参数进行自动估计,网络各层的节点数分别为3821-500-100-50-1.使用美国大型巡天项目Sloan发布的Sloan Digital Sky Survey(SDSS)实测光谱以及由Kurucz的New Opacity Distribution Function(NEWODF)模型得到的理论光谱进行了实验验证,对有效温度(Teff)、表面重力加速度(lg g)和金属丰度([Fe/H])3个物理参数进行了自动估计.结果表明,栈式自编码深度神经网络的估计精度较好,其中在SDSS数据上的平均绝对误差分别为:79.95(Teff/K),0.0058(lg(Teff/K)),0.1706(lg(g/(cm·s~(-2)))),0.1294 dex([Fe/H]);在理论数据上的平均绝对误差分别是:15.34(Teff/K),0.0011(lg(Teff/K)),0.0214(lg(g/(cm·s~(-2)))),0.0121 dex([Fe/H]).  相似文献   

6.
星系的结构和形态能够反映星系自身的物理性质,其形态的分类是后续分析研究的一个重要环节.EfficientNet模型使用复合系数对深度网络模型的深度、宽度、输入图像分辨率进行更加结构化的统一缩放,是一种新的深度网络优化扩展方法.将该模型应用于星系数据形态的分类研究中,结果表明基于EfficientNetB5模型的平均准确率、精确率、召回率以及F1分数(精确率与召回率的调和平均数)都在96.6%以上,与残差网络(Residual network, ResNet)中ResNet-26模型的分类结果相比有较大的提升.实验结果证明EfficientNet的深度网络优化扩展方法可行且有效,可应用于星系的形态分类.  相似文献   

7.
机器学习在当今诸多领域已经取得了巨大的成功,但是机器学习的预测效果往往依赖于具体问题.集成学习通过综合多个基分类器来预测结果,因此,其适应各种场景的能力较强,分类准确率较高.基于斯隆数字巡天(Sloan Digital Sky Survey,SDSS)计划恒星/星系中最暗源星等集分类正确率低的问题,提出一种基于Stacking集成学习的恒星/星系分类算法.从SDSS-DR7(SDSS Data Release 7)中获取完整的测光数据集,并根据星等值划分为亮源星等集、暗源星等集和最暗源星等集.仅针对分类较为复杂且困难的最暗源星等集展开分类研究.首先,对最暗源星等集使用10折嵌套交叉验证,然后使用支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、XGBoost(eXtreme Gradient Boosting)等算法建立基分类器模型;使用梯度提升树(Gradient Boosting Decision Tree,GBDT)作为元分类器模型.最后,使用基于星系的分类正确率等指标,与功能树(Function Tree,FT)、SVM、RF、GBDT、XGBoost、堆叠降噪自编码(Stacked Denoising AutoEncoders,SDAE)、深度置信网络(Deep Belief Network,DBN)、深度感知决策树(Deep Perception Decision Tree,DPDT)等模型进行分类结果对比分析.实验结果表明,Stacking集成学习模型在最暗源星等集分类中要比FT算法的星系分类正确率提高了将近10%.同其他传统的机器学习算法、较强的提升算法、深度学习算法相比,Stacking集成学习模型也有较大的提升.  相似文献   

8.
大天区面积多目标光纤光谱天文望远镜(Large Sky Area Multi-Object Fiber Spectroscopy Telescope, LAMOST,又叫郭守镜望远镜)巡天项目提供了海量恒星光谱数据,DR5数据集中包含大量A型星谱线指数和有效温度的信息。机器学习算法可以发掘数据底层相互关系的神经网络模型,已广泛应用于多个学科。通过使用DR5数据集中的A型星19种谱线指数和有效温度,通过主成分分析法给出了每种谱线指数占整个数据信息的百分比,并以此为基础,选取与有效温度关系最紧密的12种谱线指数,利用有效温度误差小于100 K的数据训练得到有效温度的神经网络回归模型。模型在测试数据集上整体表现较好,程序给出的决定系数R~2为0.904,平均绝对误差为58.38 K。对比相关研究的模型,测量准确度有了明显提升。此外,通过建立模型,对有效温度误差大于100 K的原始数据重新进行测量,得到的有效温度绝对误差的平均值有了明显下降;同时DR5数据集中A5型恒星数据缺少有效温度参数,通过模型的测量,对这一部分数据进行了补充。  相似文献   

9.
恒星大气物理参量的非参数估计方法   总被引:1,自引:0,他引:1  
恒星大气物理参量(有效温度、表面重力、化学丰度)是导致恒星光谱差异的主要因素.恒星大气物理参量的自动测量是LAMOST等大规模巡天望远镜所产生的海量天体光谱数据自动处理中一个重要研究内容.针对测量大样本的恒星光谱数据估计每个恒星的大气物理参量,提出了一种基于变窗宽核函数的估计算法:变窗宽算法是对固定窗宽算法的改进,分为3个步骤:(1)将历史恒星光谱数据进行PCA处理,得到光谱的低维特征数据;(2)利用特征数据与其物理参数的对应关系,建立一种变窗宽的非参数估计模型;(3)利用该估计模型,直接计算待测恒星光谱的3个物理参量(有效温度、表面重力、金属丰度).实验结果表明:该方法与固定窗宽估计模型以及在其他文献中报道的方法相比,具有较高的估计精度和鲁棒性.  相似文献   

10.
天体光谱数据的智能处理正由传统机器学习方法逐步转向深度学习,主要采用基于计算机视觉的技术手段。基于计算机视觉领域广泛应用的DenseNet网络结构,针对光谱数据进行修改,建立了适用于光谱数据的一维卷积神经网络模型,解决天体光谱数据分类任务。在验证数据集上,恒星、星系、类星体的F1分数达到了0.998 7、0.912 7、0.914 7,高于传统的神经网络。光谱分类关注区域的可视化结果表明,本文模型可以学习到各类天体对应的特征谱线,具有较强的可解释性。本文方法被用于阿里云天池天文数据挖掘大赛——天体光谱智能分类,并在843支参赛队伍的3次数据评比中获得了2次第一、1次第三的成绩,证明了该模型在保证分类精度的同时,具有极强的鲁棒性、泛化性,适用于光谱的自动分类。  相似文献   

11.
新一代大规模光谱巡天项目产生了近千万条低分辨率恒星光谱,基于这些光谱数据,介绍一种名为The Cannon的机器学习方法。该方法完全基于已知恒星大气参数(有效温度、表面重力加速度和金属丰度等)的光谱数据,通过数据驱动来构建特征向量,建立光谱流量特征和恒星参数的函数对应关系,进而应用到观测光谱数据中,实现对恒星光谱的大气参数求解。The Cannon的主要优势为不直接基于任何恒星物理模型,适用性更广;由于使用了全谱信息,即便对于低信噪比光谱也能得到较高可信度的参数结果,该算法在大规模恒星光谱的数据处理和参数求解方面具有明显的优势。此外,还利用The Cannon得到LAMOST光谱数据中K巨星和M巨星的恒星参数。  相似文献   

12.
星系的形态与星系的形成和演化息息相关, 其形态学分类是星系天文学后续研究的重要一环. 当前海量天文观测数据的出现使得天文数据自动分析方法越来越得到重视, 针对此问题, 利用先进的深度学习骨干网络EfficientNetV2, 分析不同的注意力机制类型和使用节点对网络性能的影响, 构建了一种命名为EfficientNetV2-S-Triplet7 (即在EfficientNetV2-S stage7的$1\times1$卷积层后加入Triplet模块)的改进算法模型来实现星系形态学的自动分类. 使用第二期星系动物园(Galaxy Zoo 2, GZ2)中超过24万张的测光图像作为初始数据进行实验测试. 在对数据进行预处理时采取了尺寸抖动、翻转、色彩畸变等图像增强手段来解决图像数量的不平衡问题. 在同一系列经典和前沿的深度学习算法模型AlexNet、ResNet-34、MobileNetV2、RegNet进行对比实验后, 得出EfficientNetV2-S-Triplet7算法在分类准确率、查全率和F1分数等指标上具有最好的测试结果. 在9375张测试图像中的3项指标值分别可达到89.03%、90.21%、89.93%, 查准率达到89.69%, 在其他模型中排在第3位. 该结果表明将EfficientNetV2-S-Triplet7算法应用于大规模星系数据的形态学分类任务中有很好的效果.  相似文献   

13.
M型恒星(M dwarf)是主序星中质量较小的恒星,也是银河系中数量最多的恒星类型,在其周围形成的行星通常距离主星较近,宜居带也比F、G、K型恒星更靠近主星,更有利于发现系外宜居行星.研究表明, M型恒星周围平均存在2.5颗小质量行星,约为F、 G、 K型恒星的3.5倍,但M型恒星周围巨行星的出现率(occurrence rate)则比F、 G、K型小一个量级.基于M型恒星周围发现的401颗行星的参数开展了统计研究,发现质量越大的行星平均轨道半长径越大.类地行星约占行星总数的74%,且轨道半长径均小于1 au,其中28颗行星具有潜在宜居性.根据行星质量-半径关系,在质量等于4倍地球质量(M⊕)处存在一拐点,除少数几颗行星外,大部分小于该质量的行星可能都是由约65%的硅酸盐和约35%的铁组成,大于该质量的行星半径则随质量增加而迅速增大.约60%的M型恒星周围的行星位于多行星系统且轨道分布紧密,相邻行星轨道在3:2、5:3及2:1等平运动共振位置处存在峰值. M型恒星的多行星系统形成与演化等问题对现今的行星形成理论提出了新挑战.  相似文献   

14.
近30年来的系外行星探测揭示了行星在宇宙中普遍存在的事实.为了深入研究适宜生命居住行星的普遍性,一方面需要了解宜居行星的特性;另一方面可以通过分析已发现系外行星的分布特征,推算该类行星在恒星周围的存在几率.在目前已发现的系外行星中,凌星法发现的占据了绝大多数,如Kepler空间望远镜所观测的系外行星共有2344颗. 2018年Kepler正式退役,其科学团队发布了最终版的Kepler Data Release (DR25),包含观测季度Q1–Q17的恒星共198709颗.通过对Kepler数据的分析,使用逆检测效率法和最大似然分析法两种不同的方法对系外行星半径周期参数空间内的行星生成率进行了估算,同时将计算样本根据恒星的光谱类型进行分类,分别估算得到了F、G、K型的Kepler恒星周围的行星生成率及其整体的生成率.对于半径范围1–20 R(R为一个地球半径),轨道周期范围0.4–400 d的Kepler凌星系外行星,宿主恒星为F型时逆检测效率法和最大似然法估算得到的行星生成率分别为0.36±0.02和0.47±0.02,宿主恒星为G型时的...  相似文献   

15.
多任务学习(Multi-task Learning,MTL)就是把多个问题一起进行分析、计算,以发掘不同问题之间的相关性,提高分析结果的精度,该类方法已被广泛地应用于机器学习、模式识别、计算机视觉等领域.使用多任务学习方案研究了恒星大气物理参数中表面温度(Teff)、表面重力加速度(lg g)、化学丰度([Fe/H])的估计问题.首先使用多任务Sparse Group Lasso算法提取对3个大气物理参数均有预测能力的光谱特征;然后使用支持向量机估计恒星大气物理参数.该方案在Sloan实测恒星光谱和理论光谱上均做了测试.在实测光谱上的平均绝对误差分别为:0.0064(lg(Teff/K)),0.1622(lg(g/(cm·s~(-2)))),0.1221 dex([Fe/H]).在由Kurucz的New Opacity Distribution Function(NEWODF)模型得到的理论光谱上也做了同样的特征提取和恒星大气物理参数估计测试,相应的平均绝对误差分别为:0.0006(lg(Teff/K))),0.0098(lg(g/(cm·s~(-2)))),0.0082 dex([Fe/H]).通过与文献中的同类研究比较表明,多任务Sparse Group Lasso特征提取与支持向量机回归(support vector machine regression,SVR)两者结合的方案有较高的恒星大气物理参量估计精度.  相似文献   

16.
坎贝耳于1911年,古伦堡于1915年,计算了各光谱型恒星的视线速度绝对值的平均值(?),发现了中型(F,G)和晚型(K,M)星的运动速度比早型(B,A)星大.卡普坦也曾经得出同样的结果。坎贝耳和古伦堡的结果列于表1内,他们的 V_r是作过太阳运动改正的.n 是所用的星数,V_r 以公里/秒为单位.在表1内也列出威尔逊和雷蒙于1930年对4233个恒星进行空间速度计算的结果.  相似文献   

17.
星系的光谱包含其内部恒星的年龄和金属丰度等信息, 从观测光谱数据中测量这些信息对于深入了解星系的形成和演化至关重要. LAMOST (Large Sky Area Multi-Object Fiber Spectroscopic Telescope)巡天发布了大量的星系光谱, 这些高维光谱与它们的物理参数之间存在着高度的非线性关系. 而深度学习适合于处理多维、海量的非线性数据, 因此基于深度学习技术构建了一个8个卷积层$+$4个池化层$+$1个全连接层的卷积神经网络, 对LAMOST Data Release 7 (DR7)星系的年龄和金属丰度进行自动估计. 实验结果表明, 使用卷积神经网络通过星系光谱预测的星族参数与传统方法基本一致, 误差在0.18dex以内, 并且随着光谱信噪比的增大, 预测误差越来越小. 实验还对比了卷积神经网络与随机森林回归模型、深度神经网络的参数测量结果, 结果表明卷积神经网络的结果优于其他两种回归模型.  相似文献   

18.
研究了低分辨率恒星光谱的[α/Fe]估计问题.所给方案包括以下3个步骤:首先,使用Haar小波对原始光谱进行四级分解,去除高频成分,以抑制高频噪声干扰;然后,基于光谱数据成分与[α/Fe]的相关性和LASSO(Least Absolute Shrinkage and Selection Operator)算法选择光谱特征;最后,基于MARCS恒星光谱库和多元线性回归方法对[α/Fe]进行测量.并使用ELODIE、SDSS(Sloan Digital Sky Survey)、LAMOST(Large Sky Area Multi-Object Fibre Spectroscopic Telescope)和4个星团的低分辨率恒星光谱数据验证了方法的有效性.在317个ELODIE光谱样本、412个SDSS光谱样本和1276个LAMOST光谱样本(信噪比SNRG大于20)上的(系统偏差,精度)分别为(0.04dex,0.064 dex)、(0.16 dex,0.065 dex)和(0.05 dex,0.062 dex).在球状星团M13、M15以及疏散星团NGC2420、M67上的估计结果与文献值基本一致.  相似文献   

19.
基于COSMOS(Cosmic Evolution Survey)天区的多波段测光数据和HST(Hubble Space Telescope)近红外高分辨率观测图像,利用质量限(恒星质量M*≥1010.5M⊙)选取了362个红移分布在1≤z≤3的星系样本,并对这些大质量星系的形态特征进行了分类研究.来自UVJ(U-V和V-J)双色图分类系统、目视分类系统、非模型化分类系统(基尼系数G和矩指数M20)和模型化分类系统(S′ersic index,n)的分类结果彼此相一致.相比较于恒星形成星系(SFGs),通过UVJ双色图定义的宁静星系(QGs)表现出致密的椭圆结构,而且G和n值偏大,但M20和星系有效半径(re)偏小.不同星系分类系统(双色图分类系统、非模型化分类系统和模型化分类系统)定义的SFGs和QGs样本,都明显存在星系的大小随红移的演化关系,这种演化趋势QGs比SFGs更剧烈,而且不依赖于星系分类方法的选择.  相似文献   

20.
星系形态与星系的形成和演化有着密切的联系,因此星系形态分类(galaxy morphology classification)成为研究不同星系物理特征的重要过程之一。斯隆数字巡天(Sloan Digital Sky Survey, SDSS)等大型巡天计划产生的海量星系图像数据对星系形态的准确、实时分类提出了新的挑战,而深度学习(deep learning)算法能有效应对这类海量星系图片的自动分类考验。面向星系形态分类问题提出了一种改进的深度残差网络(residual network, ResNet),即ResNet-26模型。该模型对残差单元进行改进,减少了网络深度,并增加了网络宽度,实现了对星系形态特征的自动提取、识别和分类。实验结果表明,与Dieleman和ResNet-50等其他流行的卷积神经网络(convolution neural network, CNN)模型相比,ResNet-26模型具有更优的分类性能,可应用于未来大型巡天计划的大规模星系形态分类系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号