首页 | 本学科首页   官方微博 | 高级检索  
     检索      

文本特征提取的研究进展
引用本文:曾明睿,袁梦奇,邵曦,鲍秉坤,徐常胜.文本特征提取的研究进展[J].南京气象学院学报,2019,11(6):706-715.
作者姓名:曾明睿  袁梦奇  邵曦  鲍秉坤  徐常胜
作者单位:南京邮电大学 通信与信息工程学院, 南京, 210044,南京邮电大学 通信与信息工程学院, 南京, 210044,南京邮电大学 通信与信息工程学院, 南京, 210044,南京邮电大学 通信与信息工程学院, 南京, 210044,南京邮电大学 通信与信息工程学院, 南京, 210044;中国科学院自动化研究所 模式识别国家重点实验室, 北京, 100190
基金项目:国家自然科学基金(61572503,61872424,6193000388,61872199);南京邮电大学高层次人才启动基金(NY218001);模式识别国家重点实验室开放课题(201900015)
摘    要:文本理解是人工智能的一个重要分支,其技术推动了人与计算机之间在自然语言上的有效交互.为了让计算机准确地理解和感知文本数据,文本特征提取是最为基础和关键的步骤之一.基于此,本文介绍文本特征提取研究的发展历史,以及近年来主流特征提取的方法,并对未来的研究方向进行展望.首先,介绍语义最底层的词级表示;接着,总结在词级表示基础上衍生出的句级表示上的研究进展;随后,介绍比词级表示和句级表示更高层的篇分析;最后,通过文本特征提取的一个典型应用——问答系统的介绍,阐述文本特征提取的最新方法和技术在问答系统上的应用,并对未来的研究方向做了展望.

关 键 词:自然语言处理  文本特征提取  问答系统
收稿时间:2019/10/15 0:00:00

Research progress on text feature extraction
ZENG Mingrui,YUAN Mengqi,SHAO Xi,BAO Bingkun and XU Changsheng.Research progress on text feature extraction[J].Journal of Nanjing Institute of Meteorology,2019,11(6):706-715.
Authors:ZENG Mingrui  YUAN Mengqi  SHAO Xi  BAO Bingkun and XU Changsheng
Institution:School of communication and information engineering, Nanjing University of Posts and Telecommunications, Nanjing 210044,School of communication and information engineering, Nanjing University of Posts and Telecommunications, Nanjing 210044,School of communication and information engineering, Nanjing University of Posts and Telecommunications, Nanjing 210044,School of communication and information engineering, Nanjing University of Posts and Telecommunications, Nanjing 210044 and School of communication and information engineering, Nanjing University of Posts and Telecommunications, Nanjing 210044;Institute of Automation, Chinese Academy of Sciences Institute of Automation, Chinese Academy of Sciences, Beijing 100190
Abstract:Text understanding is an important research branch in artificial intelligence,which avails the effective interaction between human and computer with natural language.Text feature extraction is one of the basic and key steps for computers to understand and perceive the textual data.In this paper,we introduce the development history of text feature extraction and the mainstream feature extraction methods in recent years,and prospects the future research directions of text feature extraction.The three semantic hierarchies,namely word representation,sentence representation and discourse relationship mining are elaborated,then a case is given to show the typical application of text feature extraction on question answering system.
Keywords:natural language processing  text feature extraction  question answering system
点击此处可从《南京气象学院学报》浏览原始摘要信息
点击此处可从《南京气象学院学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号