共查询到19条相似文献,搜索用时 62 毫秒
1.
为了提高专用搜索引擎的分类精确度和可控度,提出了一种新算法。根据现有的后缀树文本聚类,通过建立基本分类表,并结合专用搜索引擎的特点进行改进,将文本分类和文本聚类有机地结合起来,使改进后的算法能够通过人工的干预,不断修正自己的分类结果。实验表明,相比传统的文本分类算法,这种算法能通过自我修正能力不断提高分类准确度,并且计算开销和传统文本分类算法相当。因此,该算法通过结合文本分类和文本聚类算法,在专用搜索引擎结果处理上提出了新的思路。 相似文献
2.
针对传统的最小生成树聚类算法存在使用全局不变阈值确定噪声边,聚类需要用户根据经验确定初始化聚类参数,如“边权值倍数容差”,“边长变化因子”等,聚类不能发现局部噪声的问题,本文提出了一种改进的最小生成树自适应空间点聚类算法。该算法在无需用户输入参数的前提下,克服主观因素的影响,根据最小生成树边长的数理统计特征定义裁剪因子。算法首先从宏观层面对最小生成树进行首轮删枝操作,消除全局环境下的噪声边,进而根据各子树的边长统计情况,自适应设定局部裁剪因子,进行第二轮删枝操作,消除局部环境下的噪声边。最后,采用1个模拟数据和1个实际应用验证算法的有效性,结果表明本文提出的改进算法在无需人为提供经验参数的环境下能够发现任意形状、不同密度的簇,能够准确的识别出空间点中的噪声数据,从而能够实现空间点数据背后隐藏信息的自动挖掘。 相似文献
3.
本文根据模糊数学理论,以相关系数为基础,讨论了模糊聚类法及其与经典聚类分析在元素分类中的应用关系。通过3个实例,对一些元素分析资料的计算,模糊聚类获得较好的效果,与经典聚类分析对比,方法快速、精确、简单。 相似文献
4.
本文以杜热草场水化学资料为例,运用FUZZY ISODATA聚类方法对地下水水化学类型的划分进行了初步研究,并与传统的舒卡列夫法和基于模糊关系聚类法所得结果进行了对比,说明了本方法的可靠性。文中运用该法对研究区水化学成份划分的五种类型,基本符合本区地下水化学成份形成与分布规律,分类合理,计算简便,特别是对水化学成份差别不大的地区更为适用。 相似文献
5.
6.
系统聚类分析法在统筹区域土地利用分区研究中的应用 总被引:2,自引:0,他引:2
借鉴系统聚类分析法,以广东省汕尾市为例,通过选取相关特征指标作为土地利用分区基础,利用社会经济统计软件SPSS的分层聚类((Cluster)功能,进行了Q型分类,并最终确定了汕尾市土地利用分区结果以及土地利用调控目标和管制规则。 相似文献
7.
为了在较少地类的基础上,深入研究土地利用变化过程,可把较多的地类合并成较少的具有重要变化特征的地类.本文运用基于行为聚类的方法,将净增加和净增加的地类合并或净减少和净减少的地类合并,但不能将净增加和净减少的地类合并.主要分为3个阶段实现:第1个阶段是完全不变阶段,聚类结果是形成综合的完全不变地类;第2个阶段是完全减少和完全增加阶段,该阶段将完全减少地类和完全增加地类分别进行合并;第3个阶段是转变阶段,该阶段计算了每一对有相同净变化方向地类的相互转变信息.基于行为聚类的算法在每一步的计算过程中都会保留净变化面积为常数,转变变化面积保留最大化.本文对3个聚类原则进行了数学证明,定义了6种聚类行为,以云南省土地利用分类体系为例,从面积变化和强度变化2个角度阐述了行为聚类方法的可行性和优势性.最后,与刘纪远等建立的土地利用遥感监测分类系统进行比较,结果表明:行为聚类算法聚类到9种类型时,类型总变化面积达到5.10%,比原始类型的总变化面积下降了0.06%;而基于遥感监测分类系统的6个一级分类将总变化减少至4.7%,与聚类算法比较,总变化面积减少了0.4%.实践证明,行为聚类的算法可更好地保留土地利用动态变化信息,证明了该聚类方法的有效性. 相似文献
8.
狄莉莎 《大地测量与地球动力学》2000,20(3):89-93
以近 2 3年来湖北西部地区 ML≥ 4.0级地震前内符检验有一定震兆异常显示的 6项地震活动性参数作为指标 ,估计样本有震或无震类别 (1— 0 )的从属度 ,判定预报样本所属类别。根据模糊聚类分析方法对鄂西地区的地震进行综合预测研究 ,统计结果认为 :模糊聚类方法对鄂西地区 ML≥ 4.0级地震的预测具有一定的效能。 相似文献
9.
地下水是一种复杂的溶液,水质的好坏及污染的轻重受多种因素制约,是灰色的。本文通过对南阳市174km~2,189眼水井的水质分析资料,用灰色系统理论中的灰色聚类法,对该区地下水污染现状较详细地给以综合评价,其评价结果较客观地反映出了该区地下水的污染现状,为今后制定防治对策提供了科学依据。 相似文献
10.
11.
词频反文档频率是文档特征权值表示的常用方法,用以评估单词对于语料库中的其中一份文件的重要程度。通过合理映射病例库与语料库的词汇关系,对词频反文档频率模型进行改进,并将改进后的词频反文档频率模型应用到针灸处方疾病症状权重挖掘中,计算出疾病所对应的各种症状权重。实验统计了106种疾病,其中与临床诊疗经验相符合的有84种,准确率达79.2%,实验表明改进的模型能得到较好的疾病症状权重鉴别效果。 相似文献
12.
网络爬虫是搜索引擎的重要组成部分。针对目前聚焦爬虫搜索策略的不足,提出了一种新的搜索策略解决方案。在搜索过程中对适应度高于或低于种群平均适应度的个体采用不同的交叉概率和变异概率来扩大爬虫的爬取范围、增加新个体,并通过改进遗传算子,提高聚焦爬虫的搜索效率。实验证明,基于自适应遗传算法的聚焦爬虫在一定程度上解决了传统遗传算法的"早熟"问题,而且能够爬取到更多主题相关的网页和相关度高的网页。 相似文献
13.
主要目的是解决工作流引擎回退方法无法灵活配置问题;通过在生成可回退活动节点之前动态读取关系二维配置表的方式进行测试分析;得到工作流引擎生成可回退节点之前读取二维表配置信息可生成符合要求的回退节点的结果;通过多次分析测试结果,形成的工作流引擎控件可通过引入二维表的形式改造,得出可回退节点通过松散的耦合关系与业务活动节点关联,生成符合业务要求的回退节点的结论。 相似文献
14.
当前的操作系统和应用软件对复杂文本的少数民族文字处理相当有限,不利于信息的交流.通过对QT图形库下的复杂文本引擎的分析,得出基于OpenType字库技术复杂文本显示技术一般过程,对需要支持少数民族文字的操作系统和软件设计有一定的帮助作用,可用于指导支持民族文字的软件设计. 相似文献
15.
在人员搜寻过程中,地理信息技术的应用能帮助缩小搜寻的空间范围、合理分配搜救资源,从而提高搜救效率、节约时间和资金投入。本文首先探讨了户外搜救过程中,地理信息技术在协助划定搜寻的空间范围和分配应急资源方面的应用;在此基础上,将时间作为连续变化的因素进行分析,以时间地理学对人员搜寻的时空范围进行优化;利用时空棱柱工具表达失踪对象和搜救资源各自的时空约束,继而确定他们各自随着时间变化的潜在活动范围;通过求解搜救资源和失踪对象的时空交集,来确定每个搜救资源最优的搜寻范围的外边界;通过将各资源的最优搜索范围的外边界进行综合分析,来求解在多个资源协作情况下的最小搜寻范围和各资源对应的搜索起点,实现对搜救资源的合理分配;最后,在ArcGIS平台上对该方法进行了实现和模拟。搜救案例展示该方法划定的人员搜寻范围在空间上更小,时间上更为精确,有助于分配救援资源和提高搜救效率。 相似文献
16.
农产品质量溯源系统的研究 总被引:2,自引:0,他引:2
主要针对传统农产品质量追溯系统存在的广度较窄、精度不细致等问题,依托"热带特色农产品溯源系统"项目,利用无线射频识别技术,设计并实现农产品质量溯源系统,给出农产品质量溯源系统总体架构以及主要设计流程,并对标签转换、数据同步等关键技术进行阐述。 相似文献
17.
从仪器原理、传递函数和观测数据等方面分析目前在网进行1 Hz采样的VP型垂直摆倾斜仪在2~60 s周期内的频率特性,认为该仪器可以观测到频带内的信号变化,但因处于过渡带,观测幅度较真实幅度削弱约20~40 dB。对VP型垂直摆倾斜仪观测频带进行拓展,使2~60 s周期内的观测信号由之前的过渡带进入到仪器的通频带,结果与相同采样率的其他定点形变仪器的观测效果相同,将地倾斜观测量转换为加速度表达后,其幅频特性符合全球地震背景噪声模型。改进后的VP型垂直摆倾斜仪对于远距离震级不大的同震体波震相记录效果略优于改进前,但受地脉动影响,在识别非地脉动信号时需要采用更精细的方法和手段来提高识别效果。 相似文献
18.
运用专家系统的知识获取和推理机设计原理与方法,探讨了ALCGEIS系统的基本结构、知识分级、知识获取过程和实现程序,推理机的基本原理和控制策略及其程序实现的算法,以及推理知识的搜索策略;论述了 AIEGEIS推理规则的设计方法及其推理算法。 相似文献
19.
云是自然场景最常见的自然现象,然而其不规则的外观和复杂的运动使云的模拟难度很大。在分析和研究了元胞自动机建模方法的基础上,采用元胞自动机生成云的初始模型,通过billboard的自转简化云的运动算法,并将单向散射与多重散射相结合的方式构造云的光照模型。通过该方法提高了云渲染的效率,同时满足了云场景的真实性。实验结果表明,该算法能以较高的帧率实现云的仿真效果同时不失真实性。 相似文献