首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 875 毫秒
1.
社交媒体数据可以为台风灾害追踪、灾时救援和灾情评估提供及时有效的信息。现有研究常采用主题建模和情感分析等技术对台风期间社交媒体平台(如新浪微博等)舆论话题和情感变化进行研究。在省域范围内以小时为时间粒度的多维度有效性论证尚有欠缺,且在舆情分析时未能区分用户群体差异。本文以台风“利奇马”为例,在浙江省域范围内,以新浪微博数据为研究对象,首先从词频分析、台风关注度时空变化以及特定灾害事件响应3个角度探讨了微博数据对台风灾情响应的有效性;其次采用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型技术挖掘微博文本主题信息,并根据Louvain算法对主题社团进行划分;然后开发了一种基于自定义情感词典的情感分析方法用于情感指数计算,与SnowNLP相比情感倾向性预测精度得到了提高;最后分析了台风期间官方和民众在新浪微博平台上的话题关注以及情感演变差异。结果表明:① 在省级范围内,微博数据能有效反映台风动态和灾害时空分布;② 台风事件微博文本的主题变化反映了灾情不同阶段舆论关注点的动态变化;③ 官方微博文本比民众微博文本具有更明确的主题社团结构;④ 台风事件相关微博文本中的消极情绪在台风登陆后显著增加,其中民众微博文本对台风灾害的情绪响应更及时,官方微博文本中的情感表达始终相对积极。  相似文献   

2.
灾害期间的舆情引导有助于维护社会稳定。社交媒体是舆论传播的重要渠道,通过微博评论了解用户的网络情感及关注的话题,可以帮助相关舆情监测部门掌握公众的关注热点,从而选择适当的干预节点来应对网络舆情,并对公众情绪进行疏导,这对于应急管理具有现实意义。现有的研究大多是利用有监督的机器学习方法进行情感分类,这需要人工进行语料的标注,工作量大。本文根据微博评论文本的特点,综合考虑情感词以及表情符号等多重情感源,构建了台风灾害领域情感词典。在此基础上,提出了一种基于情感词语义规则的情感倾向计算方法,以及基于词向量的话题聚类方法。首先,采集了近年5次台风灾害期间共计40多万条微博评论文本,基于大连理工情感词汇本体库进行扩展构建了台风灾害领域情感词典,结合PMI法构建表情符号词典,根据语义规则确定情感倾向,并使用3500条评论文本验证了该方法的有效性。然后,本文基于词向量、TF-IDF与K-means的聚类方法探索灾害期间热点话题。最后,以2020年4号台风“黑格比”为例,基于台风期间的5万余条微博评论文本进行了舆情情感分析,并识别出6类与台风相关的话题。通过时空分析发现,随着时间的推移,微博评论文本的数量发生一定变化,评论数量多的地区大都集中在沿海地区和经济水平高的地区,台风登陆当天浙江省的恐惧情感达到最高。结果表明,基于语义规则和词向量的台风灾害网络情感分析方法,能在类似灾害事件发生时为政府部门掌握和引导网络舆情提供辅助。  相似文献   

3.
2020年初,新型冠状病毒肺炎(COVID-19)疫情席卷全国,疫情发展变化引发了社会各界的广泛关注。社交媒体平台作为网络舆情的重要载体,如何从中全面、准确挖掘分析网络舆情特征是疫情防控过程中的重要问题。本研究首先从舆情本体与客体时空关联的角度构建了疫情期间网络舆情多维分析模型,获取了2020年1月17日—3月17日多个媒体平台中新冠肺炎疫情相关的网络舆情数据;其次以疫情蔓延的视角,运用比较研究法、Spearman相关系数等方法探索了武汉市、湖北省及全国尺度下的网络舆情态势时空演变及语义特征;最后使用HowNet情感词典和情感词汇本体进行了舆情情感分析,并使用可交互信息图表对其进行可视化。结果表明:① 武汉市、湖北省、全国尺度下的每日舆情数据数量与每日新增病例数之间存在正相关关系;② 舆情数据数量的空间分布与疫情分布存在正相关关系,舆情数据数量多的地区多为疫情较为严重的地区; ③ 研究时段内不同媒体平台的舆情中立情感最多,新闻平台与论坛、微信、微博相比,整体情绪更为正面;④ 在疫情发展的不同阶段,微博热搜数据情感特征有较大差异,总体上呈现正面情绪多于负面。研究表明,基于本文提出的多维分析模型可以直观展现疫情期间多尺度下的舆情态势、舆情焦点和情绪变化,从而为政府及相关部门有效引导与控制网络舆情提供理论基础支撑和参考借鉴。  相似文献   

4.
2019年12月以来,新冠肺炎疫情迅速席卷全球,截至北京时间2020年5月10日16时40分,全球累计确诊病例4 115 662例,已成为全球聚焦的主要话题。微博等社交媒体平台成为此次疫情相关信息传播的重要渠道和公众情绪的有效传感器之一。对微博信息进行深入挖掘分析不但能研判舆情特点,更有助于政府对公众的情绪进行针对性疏导,合理管控舆情。因此,本文采集了2020年1月18日到2020年1月28日期间关于新冠肺炎的33万余条新浪微博数据,基于Louvain和Kmeans的空间聚类、改进的BTM主题词提取等算法,将用户关注热点信息和情感特征作为地域标签,构建了反映情感特征、地域关联与热点关注在内的舆情评价方法,实现了基于位置的信息融合,能够分析不同区域的舆情特点与关注主题差异。研究表明:基于BERT词向量的BTM主题词提取方法可以有效弥补传统主题词提取的计算量大、数据冗余等缺点,在热点挖掘时具有更强的表达能力;不同区域关注热点具有一定的差异性,结合省级、市级及基于Louvain-Kmeans的空间聚类的多尺度舆情分析方法,可以全方位展现不同区域舆情特点。本文提出的舆情分析方法可以有效反映不同区域的舆情特征,为重大公共卫生事件的舆情分析提供参考。  相似文献   

5.
网络舆情分析在突发事件科学管理及应急响应中作用显著。本文以2021年发生的我国首例野象大跨度北移事件为案例,采用事件抽取和扩展BosonNLP的情感分析方法,研究新闻及社交媒体关于野象北移的情感关切响应及事件级联效应,并用地理探测器等空间统计分析方法揭示其影响机制,进而探讨此类突发事件与其他舆情的传播及演化差异。结果表明:(1)野象北移舆情起始期较长而爆发期较短,且其信息扩散受空间距离衰减规律的影响较小,而主要取决于地区互联网资源供给及传播媒介分布情况,有别于公共卫生、自然灾害等跨区域重大突发事件舆情演进规律;(2)北移象群逼近人口密集的城区时易引爆舆情;期间,新闻媒体全面关注野象迁移动态且积极意向明显,成为推动公众舆情趋向正面社会建构的重要话语力量;(3)微博舆情情感在全国及省域尺度均存在显著空间集聚性;事源地云南及其邻域为低-低集聚型情感冷区,国内媒体及微博用户主要分布地(北京、山东、江苏等)为高-高集聚型情感热区;突发事件主要影响区(昆明和玉溪)亦为高-高集聚型情感热区,而我国野象传统分布区(普洱和西双版纳)却为情感冷区;决策部门及新闻媒体应差异化响应舆情情感冷热区的民众关切并精...  相似文献   

6.
2019年和2020年四川省发生了两起大型森林火灾,受到政府高度重视,也在网络上引发了广泛讨论.为了呈现森林火灾后微博文本中蕴含的舆情信息,有效地了解舆情,掌握规律,对四川凉山前后两起重特大森林火灾发生后的舆情进行了数据挖掘和对比分析.使用核密度、地理探测器方法对两起森林火灾舆情时空扩散和空间分异进行了研究,使用LDA主题提取模型、朴素贝叶斯、词云方法对两起火灾舆情进行主题提取、情感分析和可视化表达.研究结果表明:时空扩散和主题分布上,四川省两起重大森林火灾舆情具有较强相似性;空间分异上,两起火灾舆情空间分异与区域经济发展水平显著相关;情感演变上,重复发生同类灾害事故对于网民的情绪冲击明显.  相似文献   

7.
疫情地理传播与网络舆情之间的时空关系对于开展突发疫情应对具有重要意义,是国家新型城镇化与发展全球化的重要课题。利用H7N9突发疫情感染人数、网络舆情关注数、网民人数、地理行政区划等数据,应用大数据分析与地理可视化方法,对疫情地理传播与网络舆情时空关系进行了研究。结果表明,疫情地理空间传播与网络舆情传播之间存在潜在的时空关系,主要表现为突发疫情引起的网络舆情的空间分布与现实疫情事件的地理空间分布特性具有总体相似一致性和局部偏差性。疫情传播与其引起的网络舆情传播的数量特性、时间特性、地理区域特性具有整体一致性;网络舆情反映疫情地理分布具有局部偏差性。  相似文献   

8.
社交媒体数据对反映台风灾害时空分布的有效性研究   总被引:1,自引:0,他引:1  
当灾害事件发生时,与之相关的社交媒体数据不断产生,其中包含了丰富的灾情信息和签到地理位置信息,这为灾情态势的及时感知提供了一种新的数据源,但是因社交媒体用户量的地区差异及网络空间中信息传播模式的特点,给社交媒体签到数据所代表的空间点过程的模式分析带来了一些新的问题,如签到点密度与实际灾害点事件密度之间的对应关系、签到点之间的空间关系、点格局的空间异质性及其影响因素等。本文以2016年14号台风"莫兰蒂"为例,以"台风"和"莫兰蒂"为关键词,在新浪微博平台上采集了2016年9月14-17日的微博数据,使用文档主题生成模型(Latent Dirichlet Allocation,LDA)和支持向量机(Support Vector Machine,SVM)对微博文本进行分类,构建了含有签到位置信息的灾情点事件数据库。在此基础上,针对社交媒体用户分布的空间异质性提出了一种基于签到点用户活跃度的加权模型。以全局自相关统计量Moran′s I为指标,对加权前后的签到微博数据进行对比,发现这些在社交网络中产生的签到微博数据在现实地理空间中存在明显的空间自相关性;基于"雨"、"停电"等关键词,利用上述加权处理后的微博数据库进行灾害制图,结合真实灾情资料进行时空对比分析,结果表明系列图谱能够反映台风灾害的时空过程趋势。  相似文献   

9.
网络文本中所包含的相关信息目前已成为公共安全事件紧急救援与影响评估的重要信息源。现有的方法虽然可定向地提取文本信息中事件的各类要素信息,但由于缺乏面向事件的整体建模与解析框架,难以从网络文本中获取系统的事件要素的结构化信息,即所提取的事件要素信息要么不够完整,要么与目标事件不匹配,由此产生的遗漏与谬误难以支撑针对公共安全事件信息的系统分析。为解决该问题,本文提出了面向公共安全事件的网络文本大数据结构化理论框架,首先,建立了公共安全事件的语义框架,并以地震事件为例构建了相应的结构化表结构;其次,应用训练语料的关联标注解决了事件要素与事件无法匹配的难点;最后,通过使用可融合关联信息的文本解析算法,系统提取了事件类型、事件名称、事件时间、事件位置及其他属性,基本实现了网络文本中不同事件信息的结构化。本文以云南邵通鲁甸地震为例,展示了地震事件的网络文本信息的结构化过程与结果,为分析地震所受的关注程度以及救援状况提供了重要参考。在上述研究的基础上,开发了面向公共安全事件的网络文本信息挖掘系统,展示了地震事件文本的结构化解析以及由此实施的事件关注度分析。  相似文献   

10.
社交用户的文本具有地理差异性,并且社交关系密切的用户之间居住位置更近,因而文本和社交网络均可用于推断用户常驻位置。现有基于文本和社交网络的用户常驻位置预测方法对文本的位置指示性特征挖掘不充分,而用户文本中地名等位置指示信息却提供了最有用的位置信号。因此,本文提出一种基于地理命名实体识别(GER)和图卷积神经网络(GCN)的社交用户位置预测方法。首先,通过地理命名实体识别方法对用户文本进行过滤以凸显位置指示性特征;其次,基于提及关系和关注与被关注关系抽取社交网络;再次,结合社交网络和用户文本内容,采用基于图卷积神经网络的方法进行用户常驻位置预测;最后,将GER-GCN与GCN以及最新研究成果进行比较,并探究该模型的小样本学习能力及其影响因素。基于Geotext数据集和2个微博数据集的实验表明:① GER文本过滤方法可显著提升用户位置预测精度;② 在所有实验中,GER-GCN的预测精度最高,并在基准数据集GeoText上比最新研究成果提升1%~2%;③ 在最小监督的现实场景中,本文印证了GER-GCN模型的小样本学习能力,并发现社交网络质量对其小样本学习能力起到决定性作用。实验结果验证了GER-GCN方法的先进性,且该方法符合社交媒体现实场景的应用需求。  相似文献   

11.
COVID-19疫情是进入21世纪以来最为严重的全球公共卫生事件,并成为不同学科共同关注的热点。根据文献计量学分析结果,从疫情开始直至近期,关于COVID-19疫情的文章已经超过13 000篇,相关研究除从医学及生物学角度探讨病毒致病机理、特效药物和疫苗研制之外,更多的是探索疫情的非药物防控方法。本文针对后者,从传播关系识别、疫情时空模式分析、疫情预测模型、疫情传播模拟、疫情风险评估和疫情影响评价6个方面梳理近期研究进展。传播关系识别的研究主要包括:聚集性疫情和传播关系的识别,其中,个体轨迹大数据已成为此类研究的关键。针对疫情的时空模式分析发现,疫情分布具有显著的时空异质性,而时空传播则呈现出典型的网络特征。针对疫情的预测仍主要依赖于动力学模型,而从宏观到微观的预测模型,人群流动的影响不容忽视,并成为模型预测精度的关键要素之一。针对疫情的情景模拟主要侧重于通过模拟手段评估交通限制、社区防控和医疗资源调配等措施的效果。在非药物的干预中,交通阻断和社区防控措施被证明是目前最有效的手段;医疗资源的保障和优化调配则是防控的基础;而复工复产的情景模拟显示,在防控措施到位的情况下,复工进程必须有序有节。针对疫情风险评估的研究,目前主要关注生物因素、自然因素和社会因素。具体地,疫情感染风险与个体是否具有基础性疾病关系密切,而感染病毒后的死亡率存在性别差异;在自然因素中,如温度、降水、气候等会影响疫情的传播,但影响有限;而社会因素中,除了人群流动和人口密度的影响外,社会不公平性所导致的就医条件差异也会对感染率产生显著影响。针对疫情对未来的影响,本文主要关注公众心理、自然环境和经济发展3个方面,即疫情对公众心理和经济的影响主要以负面为主,而对自然环境的影响则起正向作用。通过对现有研究的系统梳理,可以看出,大数据尤其是个体轨迹和群体大数据在非药物干预的各个方面均发挥了重要的作用;重大疫情的防控已经不是单一学科和手段所能解决的问题,需要多学科的交叉以及不同领域人员的协作;疫情期间各种防控措施的效果、影响因素等均已被明确的揭示,但疫情的空间溯源、精准预测以及对未来的影响仍然是未解的难题。  相似文献   

12.
随着智能移动终端和社交网络应用的普及,越来越多的人愿意通过社交网络平台进行交流和表达自己的情感,因此产生了大量含有地理位置、文本内容等多种信息的用户生成数据,为大数据时代的城市研究及特定时空间内个体感知和行为活动研究提供新的数据源。本文基于2012-2014年约54万条微博用户数据,探测民众对包括春节、元宵节、清明节、端午节和中秋节在内的中国传统节日的情感表达和关注热点,以期发现在城市化与全球化影响下,人们对中国传统节日的认知变化和区域特征。通过Python 3.6进行词频分析及LDA主题模型分析可知:① 春节是中国人主题感知最为强烈的节日,且多为对新年美好祝愿的表达,其次是中秋节,以回家团聚为主,另外情人节也成为一个显性的节日;② 传统节日期间,出行方式以飞机和汽车为主,机场和高速成为与节日活动密切相关的场所;③ 共识性岁时习俗整体感知较好,但各地域特色节庆活动及饮食习俗在表现形式上有所差异,且差异在逐渐减小;④ 词频分析较好地反映了微博用户对中国传统节日的普遍感知及具有地方特色的区域差异,而LDA主题模型分析能够反映一定的传统节日主题聚类结果,但对不同节日的主题聚类效果并不十分明显。  相似文献   

13.
在新冠疫情的冲击下,国际关系错综复杂、瞬息万变,不稳定性不确定性剧增。全面及时地分析“全球-中国”国际关系变化特征,对于中国的外交发展规划具有重要的参考价值。复杂的国际关系可以分解为一系列事件单元,新闻数据中蕴含了时间、地点、人物、事物等关键信息,是构建事件的最直接、最全面的信息来源。本文以GDELT(Global Database of Events, Language, and Tone)新闻事件数据库为数据源,基于“全球-中国”的视角,利用2020年1—5月全球疫情相关新闻数据,研究新冠疫情事件背景下的国际关系的变化。本文首先以事件数量、事件强度值和事件被提及数作为关键变量,提出了国际关系的分类表达和计算模型,解决了国际关系表达模糊和难以计算的问题。然后从时空可视化角度展示疫情下国际关系的变化特征,并结合疫情期间的国际重要事件,进一步分析引起国际关系变化的原因。研究表明,采用本文方法能精确掌握新冠疫情下“全球—中国”国际关系的发展程度,发现“全球-中国”国际关系的变化规律和变化原因,具有重要的应用价值。本文的研究可以为大数据时代的国际关系研究提供一个新的视角,同时也为新闻数据的分析提供参考。  相似文献   

14.
新冠肺炎疫情期间,疫情数据成为民众关注的重点,涌现出了大量可视化图件,及时地向公众传达着疫情的数量信息和时空分布及变化,帮助大众快速了解疫情当前状况、推断发展趋势。本文从疫情数据可视化表达内容的维度出发,分析不同可视化的表达形式以及其对疫情数据的加工程度,结合示例把可视化分为“1阶”、“2阶”和“多阶”,并分析各自表达的数据类型、表达方式、设计特点和信息传递。同时,针对疫情可视化中的不足,探讨了数据统计中制图单元多级选择、数据分类中的极值处理问题,以及疫情可视化手段中不同颜色的内涵、质底法地图中区域面积和统计单元的影响、符号地图中符号压盖处理、热力图中比例尺的影响、统计图表和标注信息等在疫情可视化中的设计问题,指出疫情可视化设计中的视觉效果误用、设计过于复杂的误区,最后指出疫情信息可视化应具备讲故事的能力、问题针对性的特点,以图面简洁、高效信息传递为根本,为制图者合理设计图表和用户理性阅读疫情地图提供参考。  相似文献   

15.
2019年新冠肺炎(COVID-19)的全球爆发引起了公众对生物气溶胶的广泛关注。生物气溶胶是大气气溶胶的重要组成部分。生物气溶胶由于具有普通气溶胶的理化性质和本身特有的生物学特性,在全球生态系统、气候变化、空气质量和公共卫生等领域均扮演十分重要的角色。然而,目前学术界对生物气溶胶的研究主要集中在采样监测、消杀防护以及其环境与健康效应等方面,关于源特性研究相对滞后。基于此,聚焦大气中微生物的来源现状,综述了最近20年来生物气溶胶的自然源和人为源排放特性研究进展,并阐述了影响源排放和输送过程的主要因素(如生物地理区域、土地利用类型和环境因素等),探讨了当前生物气溶胶的各种源解析方法。最后,给出了生物气溶胶来源下一步的研究展望,以期为深入理解生物气溶胶的来源、输送与变化机理,更好地评估大气微生物污染水平与监控病原体的气溶胶传播提供参考。  相似文献   

16.
突发性重大公共传染性疫情在地级城市层面政府严格防控时期的时空演变特征能够有效反应我国综合应急防控能力。基于中国2020年1月24日—3月5日312个城市的COVID-19累计确诊数、现有确诊数、治愈数等统计数据,采用ESDA、优化的热点分析、空间马尔科夫链、空间面板数据模型等方法分析了政府严控期COVID-19疫情在312个城市的时空变化特征。研究发现:① 全国COVID-19现存确诊数经历了“快速增长扩散、基本控制、逐渐下降、局部地区完全控制”的变化特征并在2月17日达到峰值,上升期的日均增长率为17.5%,下降期的日均下降率为5.1%,绝大部分城市的疫情变化特征与全国总体情况类似;② 春运期间的人口流动性高是导致疫情快速扩张的主要原因,武汉“封城”之前14 d的百度迁徙强度指数与部分城市的累计确诊数显著相关;③ 优化的热点分析方法识别出疫情热点的空间分布具有固定性且主要分布于以武汉为中心、半径约350 km范围内的36个城市,未识别出具有统计显著性的疫情冷点城市;④ 对各城市现有确诊人数的马尔科夫链转移概率矩阵分析结果显示,各种类型维持现状的概率大于0.85,向下转移的平均概率明显高于向上转移的概率,在不同空间滞后类型的影响下各类型转移概率发生明显变化;⑤ 空间面板数据模型估计结果显示312个城市的现存确诊数具有显著的空间和时间自相关性。本研究从地级市层面多角度分析了政府严控期间COVID-19疫情的时空变化特征,疫情防控重点在于降低其时空自相关效应,为我国当前及未来应对突发性重大公共传染性疫情提供决策参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号