首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 406 毫秒
1.
社交媒体数据可以为台风灾害追踪、灾时救援和灾情评估提供及时有效的信息。现有研究常采用主题建模和情感分析等技术对台风期间社交媒体平台(如新浪微博等)舆论话题和情感变化进行研究。在省域范围内以小时为时间粒度的多维度有效性论证尚有欠缺,且在舆情分析时未能区分用户群体差异。本文以台风“利奇马”为例,在浙江省域范围内,以新浪微博数据为研究对象,首先从词频分析、台风关注度时空变化以及特定灾害事件响应3个角度探讨了微博数据对台风灾情响应的有效性;其次采用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型技术挖掘微博文本主题信息,并根据Louvain算法对主题社团进行划分;然后开发了一种基于自定义情感词典的情感分析方法用于情感指数计算,与SnowNLP相比情感倾向性预测精度得到了提高;最后分析了台风期间官方和民众在新浪微博平台上的话题关注以及情感演变差异。结果表明:① 在省级范围内,微博数据能有效反映台风动态和灾害时空分布;② 台风事件微博文本的主题变化反映了灾情不同阶段舆论关注点的动态变化;③ 官方微博文本比民众微博文本具有更明确的主题社团结构;④ 台风事件相关微博文本中的消极情绪在台风登陆后显著增加,其中民众微博文本对台风灾害的情绪响应更及时,官方微博文本中的情感表达始终相对积极。  相似文献   

2.
从社交媒体中挖掘灾害应急信息,能够有效帮助传统灾害管理获取实时、主题丰富的灾害信息,从而成为灾害应急管理的新手段。得益于深度学习在自动特征提取上的成就,本文研究了一种利用卷积神经网络对社交媒体中的灾害应急信息进行自动实时提取与分类的方法。首先,利用社交媒体数据和Word2vec模型,构建与灾害类事件相关的语料库并获得相应的词向量;其次,将词嵌入文本和相应的灾情类别作为卷积神经网络的输入,经过多分类学习得到分类模型,用以提取近实时灾害信息。以2012年“7.21北京特大暴雨”事件为案例,通过分类模型获得常见灾情类别的暴雨灾害社交媒体信息。该模型在测试集上的精度达到了90%以上,并且将模型运用于新爬取的2016年暴雨数据集上也得到了较好的表现,说明该模型在近实时自动提取灾害信息方面具有可行性。在对2012年分类结果进行时空分析结果表明,通过社交媒体获得的暴雨灾害主题信息符合灾害发展的规律,说明了利用深度学习提取社交媒体数据中的灾害应急信息的有效性和可行性,能够为实时灾害应急管理提供新的思路。  相似文献   

3.
社交媒体数据对反映台风灾害时空分布的有效性研究   总被引:1,自引:0,他引:1  
当灾害事件发生时,与之相关的社交媒体数据不断产生,其中包含了丰富的灾情信息和签到地理位置信息,这为灾情态势的及时感知提供了一种新的数据源,但是因社交媒体用户量的地区差异及网络空间中信息传播模式的特点,给社交媒体签到数据所代表的空间点过程的模式分析带来了一些新的问题,如签到点密度与实际灾害点事件密度之间的对应关系、签到点之间的空间关系、点格局的空间异质性及其影响因素等。本文以2016年14号台风"莫兰蒂"为例,以"台风"和"莫兰蒂"为关键词,在新浪微博平台上采集了2016年9月14-17日的微博数据,使用文档主题生成模型(Latent Dirichlet Allocation,LDA)和支持向量机(Support Vector Machine,SVM)对微博文本进行分类,构建了含有签到位置信息的灾情点事件数据库。在此基础上,针对社交媒体用户分布的空间异质性提出了一种基于签到点用户活跃度的加权模型。以全局自相关统计量Moran′s I为指标,对加权前后的签到微博数据进行对比,发现这些在社交网络中产生的签到微博数据在现实地理空间中存在明显的空间自相关性;基于"雨"、"停电"等关键词,利用上述加权处理后的微博数据库进行灾害制图,结合真实灾情资料进行时空对比分析,结果表明系列图谱能够反映台风灾害的时空过程趋势。  相似文献   

4.
灾害期间的舆情引导有助于维护社会稳定。社交媒体是舆论传播的重要渠道,通过微博评论了解用户的网络情感及关注的话题,可以帮助相关舆情监测部门掌握公众的关注热点,从而选择适当的干预节点来应对网络舆情,并对公众情绪进行疏导,这对于应急管理具有现实意义。现有的研究大多是利用有监督的机器学习方法进行情感分类,这需要人工进行语料的标注,工作量大。本文根据微博评论文本的特点,综合考虑情感词以及表情符号等多重情感源,构建了台风灾害领域情感词典。在此基础上,提出了一种基于情感词语义规则的情感倾向计算方法,以及基于词向量的话题聚类方法。首先,采集了近年5次台风灾害期间共计40多万条微博评论文本,基于大连理工情感词汇本体库进行扩展构建了台风灾害领域情感词典,结合PMI法构建表情符号词典,根据语义规则确定情感倾向,并使用3500条评论文本验证了该方法的有效性。然后,本文基于词向量、TF-IDF与K-means的聚类方法探索灾害期间热点话题。最后,以2020年4号台风“黑格比”为例,基于台风期间的5万余条微博评论文本进行了舆情情感分析,并识别出6类与台风相关的话题。通过时空分析发现,随着时间的推移,微博评论文本的数量发生一定变化,评论数量多的地区大都集中在沿海地区和经济水平高的地区,台风登陆当天浙江省的恐惧情感达到最高。结果表明,基于语义规则和词向量的台风灾害网络情感分析方法,能在类似灾害事件发生时为政府部门掌握和引导网络舆情提供辅助。  相似文献   

5.
“一带一路”沿线为自然灾害高发地区,且多为经济欠发达、抗灾能力弱的发展中国家。灾害发生时,挖掘和分析相关推特数据有助于开展应急救援、灾情评估、减灾防灾等工作,为中国国际救援与救助工作提供重要支撑。主题模型能在没有经验语料库的情况下,从海量灾害相关推文中快速聚合出对灾害救援、评估有价值的信息。本文采用BTM模型和LDA模型,对2013年海燕台风相关推文进行细粒度的主题聚类,分析2个模型的精度并测试它们对近似灾害主题的区分能力,并基于“需求相关”主题类的推文,通过地名匹配,分析了海燕台风发生过程中菲律宾物资、医疗等需求程度的空间分布。结果表明: ① 在区分主题近似的短文本时,BTM总体精度为0.598,LDA的总体精度仅为0.321,说明在海燕台风灾害推文的主题识别中,BTM模型的精度高于LDA模型;② BTM能够较好识别出“灾害地点相关”、“祈福相关”等较为精细的灾害主题;③ 经初步验证,基于“需求相关”主题文本生成的物资、医疗等需求的需求程度空间分布与实际需求情况基本相符。  相似文献   

6.
蕴含地理事件微博客消息的自动识别方法   总被引:1,自引:0,他引:1  
微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。  相似文献   

7.
全球气候变化加剧了海洋环境灾害的影响力与破坏力,实时灾情信息获取与分析成为灾害应急处置中的关键环节。与具有延迟性的传统对地观测网络相比,基于互联网的众包地理信息以其实时性在受灾情况评估与灾害应急处置中得到广泛重视。为获取互联网文本中隐含的海洋环境灾害信息,探究灾害对人群行为活动的影响,本文着重关注海洋环境灾害发展的时空过程特性,从灾害链的角度分析灾害发生发展过程中所涉及的诸多要素,在收集整理海洋环境灾害相关知识的基础之上,采用五元组(概念、关系、属性、规则和实例)进行本体的逻辑结构表达,构建了用于信息抽取的海洋环境灾害链本体,其包含描述海洋环境灾害知识体系的海洋环境灾害本体、受到海洋环境灾害作用的地理对象本体以及在灾害发生、发展、结束的时空过程中产生的相应的人类应急处置本体。最后,本文以台风灾害为例,通过台风灾害链知识建模,实现互联网灾害信息抽取与时空变化过程分析。结果表明:基于海洋环境灾害链的互联网文本信息抽取可以获取隐藏在互联网文本中的灾害描述信息,能够分析灾害的发展变化过程及其对人群行为活动的影响,为灾害防治与应急救援提供一定科学支持。  相似文献   

8.
强暴雨淹没耕地形成灾害的同时,对耕地作物的生长也产生着极大的影响,而暴雨灾害对耕地作物生长的影响是一个渐变过程,需要由时空动态的观测进行监测。多源卫星遥感观测技术具有捕捉地面瞬间状态和刻画过程的优势。论文利用Terra/MODIS、Landsat和Sentinel卫星观测数据,挖掘多源卫星遥感观测数据,提出了一种利用NDVI变化的特征值进行灾情动态信息提取方法;并以2016年发生暴雨灾害的巢湖地区为实验区进行了方法的应用和讨论。结果表明,基于MODIS多时相NDVI变化结果提取的信息能够获得受灾害影响开始时期和持续时长等丰富的时空动态信息,根据这些信息可以统计得出大范围区域中受灾害影响的面积。另外,结合利用30 m和10 m的Landsat和Sentinel观测数据提取的水淹区,可为在暴雨致灾范围方面提供准确的参考信息。多源遥感作为评估灾情信息的依据之一,其获取的灾情动态信息能够为灾后耕地的恢复情况以及国家灾后损失评估和救助决策提供科学的数据依据。  相似文献   

9.
构建自然灾害综合风险防范信息服务业务技术体系是支撑新时代防灾减灾救灾工作的必然要求。文章聚焦全链条、多主体、多灾种综合风险防范信息服务需求,建立了自然灾害综合风险防范信息服务的技术体系框架,构建了涵盖常态减灾和灾前预防、灾中救援、灾后恢复重建等非常态救灾全过程的综合风险防范信息服务产品体系,建立了信息产品开发、行业数据协同、网络大数据挖掘、信息服务平台集成等方面的关键技术。其中,信息产品体系构建从灾害管理过程、主要业务类型和工作任务方面进行三级分类。信息产品开发方面研发了基于致灾、灾情、救灾3类标准灾害信息要素的灾害信息产品制作、表达和动态定制技术;行业数据协同方面研发了双向自适应的部门微服务数据共享新机制及多部门多源异构数据接入、融合处理技术;网络大数据挖掘领域研发了基于网页、移动通信、社交网络、物联网等网络大数据的致灾、灾情、救灾要素信息挖掘与融合分析技术;信息服务集成平台搭建领域研发了基于云服务架构的时空分布式大数据管理、业务工具模型集成、“云+端”多渠道信息服务技术。该技术体系解决灾害信息服务时效性不高、完备性不足等问题,为开辟与政府部门统计并行的灾害信息数据获取新途径提供了技术支撑。  相似文献   

10.
互联网页面和社交网络文本中蕴含丰富的道路交通信息,是其他交通信息采集平台的有效补充。然而,自然语言文本形式的交通信息多以线性参考或地标方位描述交通事件空间位置,且大量存在事件元素缺失或隐含现象,对交通信息的自动化抽取有着较大影响。考虑到交通信息的自然语言表达方式虽然自由随意,但表达模式相对固定,提出一种从互联网文本中抽取道路交通信息的模式匹配方法。首先,基于道路交通事件描述的语言特征构建模式库;然后,以特征词词性序列的形式表达互联网文本和抽取模式,利用DTW距离度量序列相似度,实现抽取模式匹配;最后,在匹配抽取模式和填补规则指导下获取结构化的道路交通信息。由上海市城市交通相关门户网站和微博客平台的实验过程显示,本文所提出的模式匹配方法,抽取道路交通信息的准确率和召回率分别达到90%和80%以上,表明该方法能有效抽取互联网文本蕴含的道路交通信息,且实现过程相对简单,易于扩展,具有可用性。  相似文献   

11.
高分辨率遥感影像已逐步成为地震灾害快速评估的主要数据源之一,但现有的遥感地震灾害信息提取方法存在对研究人员目视解译经验依赖性强和利用高分辨率影像提取结果精度不高的问题。因此,本文提出了一种基于目标特征库的高分辨率遥感灾害信息快速提取方法,用于提升遥感影像灾害信息提取的效率和自动化程度,并对基于目标特征库进行地震灾情快速评估的几项关键技术(目标特征库构建、样本匹配方法和自动分类方法)进行了阐述,最后,以云南鲁甸地震龙头山镇地区为研究区,基于高分辨率遥感影像在目标特征库支持下开展了地震灾情快速评估实验。通过与灾后调查数据的对比分析发现,基于高分辨率遥感灾害目标特征库的地震灾情快速评估结果在精度上可以满足灾情快速评估的业务需要,同时还具有更好的时效性。  相似文献   

12.
随着气候变暖加剧,全球极端天气事件频发,重大气象灾害的发生频率与日俱增。研究气候变化与气象灾害发生频率的关系,对于气候变化背景下的防灾减灾具有重要意义。文献资料及泛在网络数据中蕴含了海量的气象灾害时空事件,为此,本文基于自然语言处理技术研发了文本气象灾害时空事件自动抽取方法。① 提出了基于专业文献的由粗到精的气象灾害标注语料训练库构建方法。首先针对不同文献资料存在的歧义和不兼容等问题,构建了面向文本事件统一的气象灾害知识体系。然后构建了基于章节结构的粗标注方法,分别针对长文本(现代文)和短文本(文言文)研发了基于Labeled LDA模型及基于TF-IDF和N-gram模型的精细标注语料筛选方法,解决了语料库的快速构建问题;② 基于BERT-CNN模型研发了融合上下文语义特征和多粒度的局部语义特征的、面向长短文本一体化处理的气象灾害时空事件自动分类方法;③ 利用该方法分别从文言文和泛在网络数据中自动抽取了灾害时空事件,其宏F1值分别达到89.09%和80.06%,主要气象灾害时空事件分布与专业统计数据相关性较高;④ 基于以上结果,重建了我国各历史时期灾害时空演变过程,发现各时期灾害数据量整体呈现出逐步上升趋势,暴雨灾害、洪涝灾害与干旱灾害是影响我国的主要灾种。本方法既可实现网络长文本事件的自动发现,也可实现文言文短文本事件的自动检测,为文本数据便捷应用于气象灾害研究和监测提供了新的技术方法。  相似文献   

13.
大数据时代海量网络文本中蕴含的灾害事件信息是防灾减灾研究和应用的重要资源。从异构的Web文本中快速、准确抽取灾害事件时空信息和属性信息,分析其时空动态变化模式与趋势并进行可视化表达,是当前地理信息与灾害信息领域关注的热点。本文从Web文本挖掘的整体技术框架、灾害主题页面抓取、灾害事件信息解析与抽取、灾害事件信息空间展示分析、以及防灾减灾应用系统等方面调研和综述了相关进展。针对防灾减灾领域的Web文本信息获取未来趋势,分析概括了全流程的Web文本灾害事件信息提取适用技术,并指出未来研究趋势:① 重点开展全球灾害信息全景式获取分析,实现全球灾害事件信息的自动化获取、分析及可视化展示;② 向联合国可持续发展目标(SDGs)和中国“一带一路”倡议,加强典型热点区域的Web灾害事件信息获取分析应用研究并形成示范系统;③ 按照数据、信息、知识的应用层次,建立以大数据挖掘和分析技术支撑的新型防灾减灾知识服务系统。  相似文献   

14.
社交用户的文本具有地理差异性,并且社交关系密切的用户之间居住位置更近,因而文本和社交网络均可用于推断用户常驻位置。现有基于文本和社交网络的用户常驻位置预测方法对文本的位置指示性特征挖掘不充分,而用户文本中地名等位置指示信息却提供了最有用的位置信号。因此,本文提出一种基于地理命名实体识别(GER)和图卷积神经网络(GCN)的社交用户位置预测方法。首先,通过地理命名实体识别方法对用户文本进行过滤以凸显位置指示性特征;其次,基于提及关系和关注与被关注关系抽取社交网络;再次,结合社交网络和用户文本内容,采用基于图卷积神经网络的方法进行用户常驻位置预测;最后,将GER-GCN与GCN以及最新研究成果进行比较,并探究该模型的小样本学习能力及其影响因素。基于Geotext数据集和2个微博数据集的实验表明:① GER文本过滤方法可显著提升用户位置预测精度;② 在所有实验中,GER-GCN的预测精度最高,并在基准数据集GeoText上比最新研究成果提升1%~2%;③ 在最小监督的现实场景中,本文印证了GER-GCN模型的小样本学习能力,并发现社交网络质量对其小样本学习能力起到决定性作用。实验结果验证了GER-GCN方法的先进性,且该方法符合社交媒体现实场景的应用需求。  相似文献   

15.
本文针对我国目前灾情直报、灾情核查评估、灾害应急响应、遥感影像地面解译等重大灾害现场应急工作需求,提出了一种面向任务的移动灾情快速采集直报技术,并以这种技术的业务化应用为目标,详细阐述了自然灾害移动信息平台的整体建设方案。该技术以现场灾情采集工作图层为载体,以现场工作任务规划为核心,系统解决了现场灾情采集工作中多元灾情信息的一体化采集、快速集成、即时上报、实时监控、团队协作等技术难题。相对于目前广泛采用的"卫星定位+底图标绘+移动通信"技术模式,该技术具有4个方面的优势:灵活兼容任何现场灾情信息采集任务;避免了卫星导航系统定位精度不高导致的大量后期数据处理工作;实现了多元灾情信息的一体化采集与快速上报;能够支持多个现场小组协同工作。该技术开发的自然灾害移动信息平台,由终端子系统、后方服务子系统和支撑数据库组成,能够依托智能移动终端设备提供现场多元灾情数据的一体化采集、快速上报、实时在线集成、快速共享等功能。该技术应用于青海玉树地震结古镇倒房评估,现场评估工作组利用4台移动终端在3天内完成了685个斑块房屋倒损程度、房屋间数、单位造价、户数及人口等灾情指标的调查统计,采集的数据可直接用于数据分析,辅助决策支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号