排序方式: 共有47条查询结果,搜索用时 15 毫秒
41.
经济户口数据匹配是将经济户口中包含的企业名称和驻址等基本信息通过地名地址的规范化和一系列匹配算法,得到最佳匹配坐标并定位到电子地图上的过程,是我国推行全面数字化建设的重要举措。本文系统分析了经济户口数据的组织形式,深入研究了中文匹配的原理特点,并以潍坊市奎文区9 000多条经济户口数据作为训练集,设计构建了基于双字哈希和数组三层数据结构的经济户口语料库,总结制定了涵盖500种行业类型的三级编码规则,并根据中文词条的文字相似性和行业之间的相关关系,设置文字和类型相似度值,采用动态加权方法求得复合相似度指标,建立了基于经济户口语料库的相似度匹配方法。文章最后以潍坊市潍城区8 000多条经济户口数据作为测试集,对本文提出的匹配方法进行实验验证。试验结果表明,利用本文设计的经济户口语料库和相似度匹配方法能够高效地完成经济户口数据的唯一性匹配和相似度匹配,极大地提高了检索效率和匹配成功率,具有良好的实际可操作性。 相似文献
42.
基于大数据方法的玄武岩大地构造环境智能挖掘判别与分析 总被引:3,自引:1,他引:2
通过玄武岩判别图推断其所形成的大地构造环境的方法由来已久,自1971年Pearce提出了构造-岩浆判别图解法之后,已涌现出了几十种不同的判别图。然而,判别图的制作过程中使用的元素的信息量少,数据样本量少,缺乏代表性,以至于其适用范围有限,且准确率不够。为提高构造环境判别过程的效率和准确性,本文提出以大数据智能挖掘方法建立判别模型,通过玄武岩的化学成分,迅速准确地对其大地构造环境进行判别。所用到的玄武岩包括三类:洋中脊玄武岩(MORB)、洋岛玄武岩(OIB)和岛弧玄武岩(IAB),样品总量为755个。首先,本文分别利用主量元素判别图和微量元素判别图对三类数据的大地构造环境进行判别,包括Ti O_2-MnO-P_2O_5、Fe O~T-MgO-Al_2O_3、Ti-Zr-Y、Zr/Y-Zr和Ti-Zr判别图。由于判别图法针对的是特定的元素或化合物,而有些样品的成份记录不完善或没有测量到有指定物质,导致无法对该样品在判别图中绘制,因此在绘制不同的判别图之前,需要筛选掉一部分数据。判别结果表明,在不考虑无效数据的情况下,Zr/Y-Zr判别图的准确率最高,可达90%以上。但如果考虑到已筛选掉的数据,上述五种图对三种岩石的判别准确率均低于75%。在利用数据挖掘算法进行判别的过程中,本文分别试验了朴素贝叶斯(NB)、K邻近(KNN)、支持向量机(SVM)和随机森林(RF)四种算法。为达到较好的识别效果,本文将所有的化合物和微量元素组成51维的参数组用于训练模型,并且不会进行任何的数据筛选,即全部被视作有效数据。训练结果表明,NB的分类结果最差,但也超过了75%,而RF训练准确率高达100%。在算法的进阶分析中,测得RF算法验证准确率可达88.46%;为提升智能算法的实用性,本文利用贝叶斯定理对算法的判别结果求逆概率,以实现"由果及因"的合理推断;同时,本文通过人为模拟数据缺失,进一步验证不同的算法的鲁棒性,并认为RF和NB是应该被优先考虑的两种算法;最后,通过提取RF中的决策树,本文对样本中元素的重要性进行了分析,并找到了对判别效果影响最大的几个主量元素和微量元素。综上所述,利用数据挖掘算法判别大地构造环境要比判别图法更为准确、迅速且功能多样,可在该领域做进一步推广应用。 相似文献
43.
44.
沿大型断裂带出露的深成岩体记录并保存了形成时的大地构造活动及后期演化和变形的重要信息。为了更好地理解羌塘西部花岗岩的成因机制和演化历史,本文选取了龙木错断裂南部的泽错岩体进行地球化学、SHRIMP锆石U-Pb年代学及云母和钾长石~(40)Ar/~(39)热年代学分析。全岩地球化学判别图显示花岗岩样品为高钾钙碱性系列至钙碱性系列和过铝质。矿物组合表明无角闪石且含白云母。以上特征均显示出明显的S型花岗岩趋势。锆石U-Pb年龄为123±1. 7Ma至107±1. 4Ma,表明岩浆侵位的时代为早白垩世,此时班公-怒江洋仍在向北俯冲。云母和钾长石~(40)Ar/~(39)年龄及前人低温热年代学数据显示,侵位后岩体至少有四个阶段的冷却,包括120~90Ma、90~38Ma、38~26Ma和26~0Ma。第一阶段在侵位后10Myr内快速冷却至低于~320℃,而随后以相对较慢的速率冷却至~220℃。从90Ma到38Ma期间经历了较长时期极为缓慢的冷却,该阶段构造活动趋于静止,表明羌塘地体-拉萨地体碰撞应发生在90Ma之前。中新世受控于龙木错断裂左旋走滑的影响,最后一期的构造变形以东西向伸展为主,深成岩逐渐剥露至地表。龙木错断裂可能作为中新世以来高原物质向东运移西部边界的一条新的应力释放途径。 相似文献
45.
通过岩浆岩的地球化学特征判别岩浆形成的大地构造环境和岩浆源区的化学性质是地球化学全岩分析最重要的应用之一。该方法利用全岩地球化学数据,包括主量元素、微量元素和同位素组成数据,对给定岩浆岩(玄武岩、花岗岩等)的大地构造环境进行判别。作为人工智能技术在地球化学研究领域中的新尝试,机器学习判别方法逐渐成为经典判别图解法的补充研究手段。然而,高维数据特征筛选和繁多未知参数确定是影响算法分类准确性的两个主要因素。为此,提出一种遗传算法优化神经网络耦合判别方法(GA-NNDM)。该方法利用特征选择、参数确定和分类性能之间的反馈联系,将分类准确率、所选特征数量和特征代价作为适应度函数,通过迭代演化寻求最佳特征子集和未知参数,从而达到减少特征、优化参数和提高性能的目的。此外,根据公开玄武岩样品地球化学数据,通过K折交叉验证等方法设置纵向、横向比较实验来验证GA-NNDM在玄武岩构造环境判别方面的准确性、稳定性和外延性。仿真实验结果表明,GA-NNDM具有优良的判别效果和泛化能力,其总体分类准确率能达到90%。因此,GA-NNDM值得在地球化学领域做进一步推广应用。 相似文献
46.
青藏高原地气耦合系统及其天气气候效应:第三次青藏高原大气科学试验 总被引:3,自引:0,他引:3
赵平 李跃清 郭学良 徐祥德 刘屹岷 唐世浩 肖文名 师春香 马耀明 余兴 刘辉志 假拉 谌芸 柳艳菊 李建 罗达标 曹云昌 郑向东 陈军明 肖安 远芳 陈东辉 潘旸 胡志群 张胜军 董立新 胡菊旸 韩帅 周秀骥 《气象学报》2018,76(6):833-860
由于青藏高原(简称高原)是影响中国极端天气和气候事件的关键区,对天气、气候预报有重要影响。因此,中国气象局、国家自然科学基金委员会、中国科学院共同推动了"第三次青藏高原大气科学试验(TIPEX-Ⅲ)"工作。自2013年的预试验开始,TIPEX-Ⅲ在高原西部狮泉河、改则和申扎新建全自动探空系统,填补了高原西部缺少常规探空站的空白;在高原中、西部建成土壤温、湿度观测网;实施了高原尺度和那曲区域尺度的边界层观测,那曲多型雷达和机载设备的云降水物理特征综合观测,高原多站的对流层-平流层大气成分观测。在研究成果方面,项目结果指出,在高原中、西部草原、草甸和裸土下垫面状况下地表热量湍流交换系数和感热通量明显低于过去较早的估计值;高原主体的对流云活动主要不是来自南亚季风区的向北传播,而可能是局地发展所致;揭示出那曲对流云日变化特征、云宏微观特征以及云中水不同相态之间的转化机制,提出了夏季高原加热在维持亚洲大气"水塔"中的作用,以及高原加热对亚洲、非洲、北美洲气候的调节作用。在数值预报模式中,Γ分布比M-P分布更适合于高原雨滴谱特征,通过改进高原热传导过程参数化方案可以降低模式中高估的地表感热,并提升模式对中国中、东部雨带的模拟能力;此外,考虑青藏高原关键区信号可以提升中国中、东部降水的预报技巧。TIPEX-Ⅲ还带动了地面和高空常规观测、天气业务雷达和风廓线雷达等观测数据加工处理业务技术的发展,提升了中国国家级土壤湿度、水汽含量等遥感产品和高分辨率多源降水融合产品的质量,促进了气象监测、预报和数据共享业务的发展。 相似文献
47.
利用新疆2019年1—12月自动气象站气温观测资料,对1、5 km两种国家级气温多源融合实况产品进行评估检验,评估指标包括平均误差、平均绝对误差、均方根误差、相关系数和准确率。结果表明:(1)两种气温实况产品在新疆地区总体质量较好,但在海拔较高、地形复杂地区站点误差较大。平原站点的评估结果优于山区。1 km产品的准确率较5 km产品在各区域明显提升,其他评估指标1 km产品较5 km产品在平原站点质量有所提升、山区站点略有下降。从评估指标分段误差的站点数量来看,1 km产品较5 km产品处于误差低值区的站点数量明显增多,但误差高值区的站点数量也有所增加。(2)以北疆和天山山区的站点为例,分析评估结果逐月变化及日变化情况。1—3、12月(冬季)评估结果较差、波动较大,4—11月评估结果较好且较为稳定。北疆12—20时是各指标质量最佳的时段,且较为稳定,07时表现较差;天山山区07时产品质量较差,18—19时质量最好。(3)两种气温实况产品日最高、日最低气温质量较好,相关系数均超过0.99。 相似文献