首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
社交用户的文本具有地理差异性,并且社交关系密切的用户之间居住位置更近,因而文本和社交网络均可用于推断用户常驻位置。现有基于文本和社交网络的用户常驻位置预测方法对文本的位置指示性特征挖掘不充分,而用户文本中地名等位置指示信息却提供了最有用的位置信号。因此,本文提出一种基于地理命名实体识别(GER)和图卷积神经网络(GCN)的社交用户位置预测方法。首先,通过地理命名实体识别方法对用户文本进行过滤以凸显位置指示性特征;其次,基于提及关系和关注与被关注关系抽取社交网络;再次,结合社交网络和用户文本内容,采用基于图卷积神经网络的方法进行用户常驻位置预测;最后,将GER-GCN与GCN以及最新研究成果进行比较,并探究该模型的小样本学习能力及其影响因素。基于Geotext数据集和2个微博数据集的实验表明:① GER文本过滤方法可显著提升用户位置预测精度;② 在所有实验中,GER-GCN的预测精度最高,并在基准数据集GeoText上比最新研究成果提升1%~2%;③ 在最小监督的现实场景中,本文印证了GER-GCN模型的小样本学习能力,并发现社交网络质量对其小样本学习能力起到决定性作用。实验结果验证了GER-GCN方法的先进性,且该方法符合社交媒体现实场景的应用需求。  相似文献   

2.
社交媒体数据对反映台风灾害时空分布的有效性研究   总被引:1,自引:0,他引:1  
当灾害事件发生时,与之相关的社交媒体数据不断产生,其中包含了丰富的灾情信息和签到地理位置信息,这为灾情态势的及时感知提供了一种新的数据源,但是因社交媒体用户量的地区差异及网络空间中信息传播模式的特点,给社交媒体签到数据所代表的空间点过程的模式分析带来了一些新的问题,如签到点密度与实际灾害点事件密度之间的对应关系、签到点之间的空间关系、点格局的空间异质性及其影响因素等。本文以2016年14号台风"莫兰蒂"为例,以"台风"和"莫兰蒂"为关键词,在新浪微博平台上采集了2016年9月14-17日的微博数据,使用文档主题生成模型(Latent Dirichlet Allocation,LDA)和支持向量机(Support Vector Machine,SVM)对微博文本进行分类,构建了含有签到位置信息的灾情点事件数据库。在此基础上,针对社交媒体用户分布的空间异质性提出了一种基于签到点用户活跃度的加权模型。以全局自相关统计量Moran′s I为指标,对加权前后的签到微博数据进行对比,发现这些在社交网络中产生的签到微博数据在现实地理空间中存在明显的空间自相关性;基于"雨"、"停电"等关键词,利用上述加权处理后的微博数据库进行灾害制图,结合真实灾情资料进行时空对比分析,结果表明系列图谱能够反映台风灾害的时空过程趋势。  相似文献   

3.
文本蕴含大量地理位置描述信息,有效融合地理关联信息以实现文本的精细定位是地理信息服务的难点。本文提出一种融合土地利用/覆被信息的描述地理位置的细粒度定位方法:在文本描述地理关联信息(地理位置实体、土地利用/覆被实体与空间关系)抽取、土地利用/覆被精细分类与地理位置粗粒度匹配定位的基础上,使用自然语言空间关系近似转换模型,确定地理位置的细粒度定位范围;基于土地利用/覆被实体及其周边精细分类信息,在该范围内检索匹配,确定地理位置的细粒度定位坐标。本文以野生亚洲象活动/肇事监测文本为例开展实验,并用匹配率与位置精度评价定位质量,结果表明:本文方法显著提升了地理位置的细粒度定位质量,实验精确匹配率(81.51%)、位置误差距离的均值(65.97 m)及其≤50 m的比例(70.50%)均优于国内主流在线地理编码与地名检索服务结合空间关系或其单独使用结果。该方法有助于完善地理位置定位方法体系、提升地理信息空间化质量,并可服务于野生动物活动/肇事监测预警等精细定位任务。  相似文献   

4.
社交媒体数据可以为台风灾害追踪、灾时救援和灾情评估提供及时有效的信息。现有研究常采用主题建模和情感分析等技术对台风期间社交媒体平台(如新浪微博等)舆论话题和情感变化进行研究。在省域范围内以小时为时间粒度的多维度有效性论证尚有欠缺,且在舆情分析时未能区分用户群体差异。本文以台风“利奇马”为例,在浙江省域范围内,以新浪微博数据为研究对象,首先从词频分析、台风关注度时空变化以及特定灾害事件响应3个角度探讨了微博数据对台风灾情响应的有效性;其次采用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型技术挖掘微博文本主题信息,并根据Louvain算法对主题社团进行划分;然后开发了一种基于自定义情感词典的情感分析方法用于情感指数计算,与SnowNLP相比情感倾向性预测精度得到了提高;最后分析了台风期间官方和民众在新浪微博平台上的话题关注以及情感演变差异。结果表明:① 在省级范围内,微博数据能有效反映台风动态和灾害时空分布;② 台风事件微博文本的主题变化反映了灾情不同阶段舆论关注点的动态变化;③ 官方微博文本比民众微博文本具有更明确的主题社团结构;④ 台风事件相关微博文本中的消极情绪在台风登陆后显著增加,其中民众微博文本对台风灾害的情绪响应更及时,官方微博文本中的情感表达始终相对积极。  相似文献   

5.
随着智能移动终端和社交网络应用的普及,越来越多的人愿意通过社交网络平台进行交流和表达自己的情感,因此产生了大量含有地理位置、文本内容等多种信息的用户生成数据,为大数据时代的城市研究及特定时空间内个体感知和行为活动研究提供新的数据源。本文基于2012-2014年约54万条微博用户数据,探测民众对包括春节、元宵节、清明节、端午节和中秋节在内的中国传统节日的情感表达和关注热点,以期发现在城市化与全球化影响下,人们对中国传统节日的认知变化和区域特征。通过Python 3.6进行词频分析及LDA主题模型分析可知:① 春节是中国人主题感知最为强烈的节日,且多为对新年美好祝愿的表达,其次是中秋节,以回家团聚为主,另外情人节也成为一个显性的节日;② 传统节日期间,出行方式以飞机和汽车为主,机场和高速成为与节日活动密切相关的场所;③ 共识性岁时习俗整体感知较好,但各地域特色节庆活动及饮食习俗在表现形式上有所差异,且差异在逐渐减小;④ 词频分析较好地反映了微博用户对中国传统节日的普遍感知及具有地方特色的区域差异,而LDA主题模型分析能够反映一定的传统节日主题聚类结果,但对不同节日的主题聚类效果并不十分明显。  相似文献   

6.
近年来,国内外类似街旁、人人、Foursquare、Gowalla等基于地理位置的移动社交网络(LBSN)发展迅猛,大量用户通过这些服务以签到的方式记录时空行为轨迹,这些个体行为轨迹数据为我们研究用户行为模式以及探究其内在规律提供了巨大的机会和挑战。然而,LBSN用户的相似性并没有从地理位置以及用户轨迹加以考虑,本文提出了基于格网划分的方式对用户空间出行进行相似性分析,通过用户轨迹建模以及相似序列匹配,探索用户出行轨迹的空间相似性度量方法并评估相似权重,最后通过用户好友关系与相似性权重的比对,证明了该方法的有效性。  相似文献   

7.
互联网页面和社交网络文本中蕴含丰富的道路交通信息,是其他交通信息采集平台的有效补充。然而,自然语言文本形式的交通信息多以线性参考或地标方位描述交通事件空间位置,且大量存在事件元素缺失或隐含现象,对交通信息的自动化抽取有着较大影响。考虑到交通信息的自然语言表达方式虽然自由随意,但表达模式相对固定,提出一种从互联网文本中抽取道路交通信息的模式匹配方法。首先,基于道路交通事件描述的语言特征构建模式库;然后,以特征词词性序列的形式表达互联网文本和抽取模式,利用DTW距离度量序列相似度,实现抽取模式匹配;最后,在匹配抽取模式和填补规则指导下获取结构化的道路交通信息。由上海市城市交通相关门户网站和微博客平台的实验过程显示,本文所提出的模式匹配方法,抽取道路交通信息的准确率和召回率分别达到90%和80%以上,表明该方法能有效抽取互联网文本蕴含的道路交通信息,且实现过程相对简单,易于扩展,具有可用性。  相似文献   

8.
当前社交网络的信息传播模型主要是对病毒SIR模型的改进而形成的,因其主体不同而具有不完善性,为更好地揭示不良信息在社交网络中的传播规律,从而寻找预防和控制不良信息传播的最优方法。根据社交网络中信息传播的方式和特点,与传染病动力学理论结合构建出SEIR模型来研究不良信息在社交网络中的传播。模型定义了4种传播规则,分析不良信息在不同状态用户之间的传播过程,并且应用扩散核函数和空间协方差方程对相关参数进行了分析。最后通过对比实验说明调节控制率γ的大小对虚假信息在网络中的传播有一定的控制作用。  相似文献   

9.
针对OD流向聚类中语义信息考虑不足和流向语义提取困难的问题,本文提出了一种基于隐含狄利克雷分布模型(Latent Dirichlet Allocation,LDA)和优化蚁群的OD流向语义聚类算法。算法首先以流向终点的POI类别为词汇构建流向文档,采用LDA主题模型提取流向语义,量化OD流向间的语义相似度,融合时间、空间和语义相似度构建流向时空语义相似度;接着以流向为节点,以流向时空语义相似度为边构建流向图,利用高斯函数映射以及图连通分量,剔除不相似的流向,实现数据精简;之后借鉴了密度峰值聚类算法思想,利用节点的介数中心性优化蚁群初始位置选取;最后基于多路切图准则(Multiway Normalized Cut, MNCUT)强化蚁群搜索的目的性,优化蚁群搜索的聚类效果,实现OD流向的时空语义聚类。以厦门市出租车公开数据集与厦门市高德地图POI数据为例进行分析与验证,结果表明本文基于LDA模型的语义提取方法可以有效提取流向的语义信息,构建有效的流向相似度度量;基于高斯函数和图连通分量特性的映射策略可以有效剔除了流向数据中的噪音,有效节省无向图构建的计算开支,大约节省了88.5%~88.8%的运行时间;基于介数中心性和多路切图准则优化的蚁群搜索聚类算法,可以有效进行流向语义聚类。相比已有方法本文方法能够更好地衡量流向间的语义相似程度,可实现按主题进行聚类划分,划分更加精细,更方便有效地进行流向语义的相关分析。  相似文献   

10.
利用社交媒体的位置潜语义特征提取与分析   总被引:1,自引:0,他引:1  
社交媒体及时、大量、广泛地记录了城市中居民的观点和情感,尤其是具有位置标记的签到文本,将人们所处的空间和城市设施与其相应的认知态度结合起来,成为以人为核心主导的对空间位置特征的直接表达,是场所语义信息的集中体现。以微博签到数据为研究对象,引入自然语言处理领域的潜语义分析的方法,结合空间分析中因子分析、空间自相关分析和聚类分析的手段,提取并分析其中隐含的位置语义特征。本研究主要侧重于对位置之间语义相关程度的度量,首先提取研究区域隐含的概念主题结构,分析不同主题在空间上的分布特征。然后对特定地块进行潜语义空间上的相似性索引,在此基础上,采用先验的百度百科词条描述对位置间语义相似性进行扩展,通过空间自相关的分析,得到不同功能类型的热点区域。  相似文献   

11.
基于社交媒体的签到数据,运用社会网络分析方法,选取长三角26个地级市作为研究对象,以从百度地图获得的时间距离作为各城市间距离,结合游客微博签到数据计算了长三角城市联系网络的网络密度、中心度等指标,分析了城市联系的网络特征。同时利用2015年各城市统计年鉴数据与从百度地图获得的城市间的距离,利用经济引力模型计算了城市间的理论联系强度。以社交媒体签到数据为地区实际联系强度,以计算出的经济联系指数为理论联系强度,探讨实际联系强度与理论联系强度之间的耦合协调度,得到各城市理论与实际的协调状况,为相关决策提供支持。  相似文献   

12.
从社交媒体中挖掘灾害应急信息,能够有效帮助传统灾害管理获取实时、主题丰富的灾害信息,从而成为灾害应急管理的新手段。得益于深度学习在自动特征提取上的成就,本文研究了一种利用卷积神经网络对社交媒体中的灾害应急信息进行自动实时提取与分类的方法。首先,利用社交媒体数据和Word2vec模型,构建与灾害类事件相关的语料库并获得相应的词向量;其次,将词嵌入文本和相应的灾情类别作为卷积神经网络的输入,经过多分类学习得到分类模型,用以提取近实时灾害信息。以2012年“7.21北京特大暴雨”事件为案例,通过分类模型获得常见灾情类别的暴雨灾害社交媒体信息。该模型在测试集上的精度达到了90%以上,并且将模型运用于新爬取的2016年暴雨数据集上也得到了较好的表现,说明该模型在近实时自动提取灾害信息方面具有可行性。在对2012年分类结果进行时空分析结果表明,通过社交媒体获得的暴雨灾害主题信息符合灾害发展的规律,说明了利用深度学习提取社交媒体数据中的灾害应急信息的有效性和可行性,能够为实时灾害应急管理提供新的思路。  相似文献   

13.
历史名人是我国几千年优秀文化的创造者之一,因此传播历史名人文化具有重要的教育意义和文化传承价值。以“民国清流”为对象的历史名人文化是我国文化体系中优秀的组成部分,有关内涵记述多存在于泛文学化的叙述逸闻等文学作品中,缺乏对名人遗存旧址、生平行迹、社交关系等名人文化主题数据的系统化梳理。本文基于异构名人文化数据,构建名人文化数字化框架,并以“民国清流”为例,着重解决名人文化数据的组织与可视化问题。基于名人文化数字化框架,利用文本挖掘提取群体传记中关键信息,动态地展示名人的二维生平行迹、三维故居点位和名人知识图谱,以实现相关信息的智能化查询分析。可视化分析结果揭示了名人群体的中心人物和活动聚集地变化、名人社会关系、名人间交往的亲疏程度及产生交集的原因。因此,本文所提出的方法不仅能让普通民众直观且多维度地了解民国人物特质,还能帮助文学研究者深入梳理和分析人物的生平及社交关系,为传承和宣传名人主题文化开创新模式。  相似文献   

14.
随着在线电子地图应用的普及,地名信息检索已成为相关研究领域的热点,并取得了丰富的研究成果。然而,这些研究主要侧重于检索效率和文本关键词匹配质量的提高,并未顾及实际应用需求和地名信息检索方法的矛盾。本文通过分析地理实体和地名的特征及关系,提出将二者相融合来研究地名信息检索的形式和方法,从数据特征和应用场景的角度出发,提出顾及地理实体的地名信息检索模式,并实现对其的结构化表达,在该检索模式中将地理实体的属性特征和空间关系作为检索特征项;以检索模式为基础提出了基于地理实体相似度计算的地名信息检索模型,并深入研究了文本型属性与数值型属性综合的属性相似度计算方法,以及定性空间过滤与定量距离计算综合的空间关系相似度计算方法;最后,通过实验验证了顾及地理实体的地名信息检索方法的可行性和检索质量。实验结果表明,该检索方法既能实现精细化和空间化的检索需求,也能保证检索结果的准确度。  相似文献   

15.
2019年和2020年四川省发生了两起大型森林火灾,受到政府高度重视,也在网络上引发了广泛讨论.为了呈现森林火灾后微博文本中蕴含的舆情信息,有效地了解舆情,掌握规律,对四川凉山前后两起重特大森林火灾发生后的舆情进行了数据挖掘和对比分析.使用核密度、地理探测器方法对两起森林火灾舆情时空扩散和空间分异进行了研究,使用LDA主题提取模型、朴素贝叶斯、词云方法对两起火灾舆情进行主题提取、情感分析和可视化表达.研究结果表明:时空扩散和主题分布上,四川省两起重大森林火灾舆情具有较强相似性;空间分异上,两起火灾舆情空间分异与区域经济发展水平显著相关;情感演变上,重复发生同类灾害事故对于网民的情绪冲击明显.  相似文献   

16.
蕴含地理事件微博客消息的自动识别方法   总被引:1,自引:0,他引:1  
微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。  相似文献   

17.
提出基于WiFi/PDR的初始位置融合解算方法。以检测到步数后0.2 s内WiFi定位坐标为集合,将PDR中估算的相邻两步距离和航向角作为参照,通过距离阈值和角度阈值筛选相邻两步WiFi定位坐标,以距离和角度综合偏离度选择最优定位坐标。结果表明,该方法解算的初始位置精度为1.2~1.8 m,比WiFi指纹定位误差缩小50%。  相似文献   

18.
随着中国网络的快速发展和社交网络的迅速流行,除了给人们的生活带来更多的便利之外,也带来了诸如垃圾信息泛滥、个人隐私泄露和钓鱼网站横行等安全问题,因此对网络安全的研究也变得愈加重要。在分析几种常见的Web攻击方法基础上,将跨站脚本攻击与钓鱼网络攻击结合,并演示了其攻击的过程及在社交网络中的传播。而在当前人们利用网络进行理财和购物变得越来越流行时,这种攻击方式的危害便被无限放大。同时,提出了针对社交网络中可能存在的攻击方法的防范措施。  相似文献   

19.
“一带一路”沿线为自然灾害高发地区,且多为经济欠发达、抗灾能力弱的发展中国家。灾害发生时,挖掘和分析相关推特数据有助于开展应急救援、灾情评估、减灾防灾等工作,为中国国际救援与救助工作提供重要支撑。主题模型能在没有经验语料库的情况下,从海量灾害相关推文中快速聚合出对灾害救援、评估有价值的信息。本文采用BTM模型和LDA模型,对2013年海燕台风相关推文进行细粒度的主题聚类,分析2个模型的精度并测试它们对近似灾害主题的区分能力,并基于“需求相关”主题类的推文,通过地名匹配,分析了海燕台风发生过程中菲律宾物资、医疗等需求程度的空间分布。结果表明: ① 在区分主题近似的短文本时,BTM总体精度为0.598,LDA的总体精度仅为0.321,说明在海燕台风灾害推文的主题识别中,BTM模型的精度高于LDA模型;② BTM能够较好识别出“灾害地点相关”、“祈福相关”等较为精细的灾害主题;③ 经初步验证,基于“需求相关”主题文本生成的物资、医疗等需求的需求程度空间分布与实际需求情况基本相符。  相似文献   

20.
自个性化推荐系统出现以来,逐渐成熟并成功应用于多种互联网商品推荐,成为解决信息过载问题的有效手段。目前,各种移动终端可实时接入网络并获取用户位置,使得考虑位置的推荐进入人们的视野,但是现有的应用主要关注单一目标下的用户选择,很少考虑用户位置移动时后续活动对当前选择的影响。本文通过对连续多个选择建模,在传统推荐算法的基础上,将未来活动的影响及空间关系的影响引入传统个性推荐算法,提出空间级联模式下的推荐模型。通过实验将传统的推荐算法与空间级联模型算法作对比,综合考虑2种推荐结果的用户偏好度及空间距离变化,提出距离-偏好损益指标,同时基于百度API实现可视化。实验所得的距离-偏好损益指标和可视化结果显示,在综合考虑用户偏好和空间关系方面,空间级联模式的个性化推荐模型可得到更加合理的推荐结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号