首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于文本挖掘词频反文档频率方法的疾病症状权重挖掘研究
引用本文:宋,艳,何,嘉,舒红平,郑皎凌,梁繁荣,任玉兰,文立玉.基于文本挖掘词频反文档频率方法的疾病症状权重挖掘研究[J].成都信息工程学院学报,2014(1):52-58.
作者姓名:        舒红平  郑皎凌  梁繁荣  任玉兰  文立玉
作者单位:[1]成都信息工程学院计算机系,四川成都610225 [2]成都信息工程学院软件工程系,四川成都610225 [3]成都中医药大学,四川成都610075
基金项目:国家重点基础研究(973)计划子课题资助项目(2012CB518500);国家自然科学基金资助项目(61202250,61203172);四川省教育厅青年基金资助项目(11ZB088);四川省应用基础计划资助项目(2012JY0112);四川省科技支撑计划资助项目(2011SZZ027);感谢成都市科技计划项目(12DXYB100JH-002);成都信息工程学院中青年学术带头人科研基金(J201208,J201101);成都信息工程学院引进人才项目KYTZ201110,KYTZ201111)对本文的资助
摘    要:词频反文档频率是文档特征权值表示的常用方法,用以评估单词对于语料库中的其中一份文件的重要程度。通过合理映射病例库与语料库的词汇关系,对词频反文档频率模型进行改进,并将改进后的词频反文档频率模型应用到针灸处方疾病症状权重挖掘中,计算出疾病所对应的各种症状权重。实验统计了106种疾病,其中与临床诊疗经验相符合的有84种,准确率达79.2%,实验表明改进的模型能得到较好的疾病症状权重鉴别效果。

关 键 词:计算机应用技术  词频  反文档频率  疾病症状  症状权重

The Research of Disease Symptoms Weighting Mining based on Text Mining Method MAPTF-IDF
SONG Yan,HE Jia,SHUHong-ping,ZHENGJiao-ling,LANGFan-rong,RENYu-lan,WEN Li-yu.The Research of Disease Symptoms Weighting Mining based on Text Mining Method MAPTF-IDF[J].Journal of Chengdu University of Information Technology,2014(1):52-58.
Authors:SONG Yan  HE Jia  SHUHong-ping  ZHENGJiao-ling  LANGFan-rong  RENYu-lan  WEN Li-yu
Institution:1. School of Computer Science, Chengdu University of Infomation Technology, Chengdu 610225, China;2. School of Software Engi neering,Chengdu University of Infomation Technology, Chengdu 610225, China; 3. Chengdu University of TCM, Chengdu 610075, Chi na)
Abstract:
Keywords:technology of computer application  term frequency  inverse document frequency  disease symptom  symptom weight
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号