首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 546 毫秒
1.
在基于位置的应用领域中,如自然灾害监测、流感趋势预测、定向广告推广等,用户地理位置的推测起到重要的作用。现有方法主要利用文本内容和社交网络进行位置推测,一方面未能充分挖掘和融合2种信息,另一方面推测社交网络中孤立用户的位置比较困难。因此,本文提出一种融合文本主题和社交关系图神经网络的社交网络用户住所位置推测方法(Social Relationship Graph Convolutional Network, SRGCN)。主要方法包括:首先,从文本内容中获取混合特征,利用TF-IDF获得文本特征向量,根据用户之间的提及信息建立初始社交关系图;其次,针对用户社交关系图中存在孤立用户并难以估计其位置的问题,建立主题模型,根据主题向量相似度为孤立用户建立联系,补充社交关系图;最后,基于图卷积神经网络处理社交关系图数据,对文本特征和网络结构进行联合建模,以有效推测用户的地理位置。在真实世界基准数据集GeoText上探究了主题相似度阈值对推测性能和图规模的影响,实验结果表明本文方法能够增加可定位用户的比例并将大部分属于同一类的用户节点聚集;SRGCN在平均距离误差、距离误差中位数、推测准确度方面...  相似文献   

2.
命名实体识别(NER)是自然语言处理众多研究基础,其可以被定义为分类任务,旨在从非结构化文本中定位出命名实体,同时将命名实体分类成预定义类别。与英文相比,中文构词灵活、不具有边界性,且缺乏高质量中文NER数据集,导致中文命名实体识别难度较大。细粒度实体是粗粒度实体的细分类型,中文细粒度命名实体尤其是地理命名实体识别难度更大。中文地理命名实体识别无法同时兼顾精度和召回率,改善中文细粒度地理命名实体识别性能至关重要。因此,本文提出2种联合词汇增强模型的中文细粒度地理命名实体识别模型。首先,将词汇作为“知识”注入模型,基于词汇增强方式探究适合细粒度命名实体识别方法,并找出适合细粒度命名实体识别方法BERT-FLAT以及LEBERT;其次,为进一步提升细粒度地理命名实体识别性能,针对上述2种方法在预训练模型、对抗训练以及随机权重平均3个方面进行改进,形成联合词汇增强模型RoBERTa-wwm-FLAT以及LE-RoBERTa-wwm;最后,对联合词汇增强模型进行消融实验,探究不同改进策略对于地理命名实体识别性能影响。基于CLUENER数据集和1个微博数据集的实验表明:(1)与无词汇增强功能模型...  相似文献   

3.
文本数据为地理知识服务提供了海量资源。面向文本数据的地理实体关系抽取是地理知识图谱构建的核心技术,直接影响地理知识推理与服务的质量。由于文本数据不可避免地含有噪声,从文本中抽取的地理实体关系需要质量评价和信息过滤。本文提出一种基于通用知识库的地理实体关系过滤方法,针对已抽取的地理实体关系从中筛选出高质量的结果:先利用“本体知识”、“事实知识”和“同义词知识”构建地理关系知识库,作为信息过滤的参照数据;再基于分布式向量表示模型度量已抽取的地理实体关系与参照数据之间的语义相似性,以提高地理知识图谱的丰度与鲜度。实验结果表明,相比业界流行的“Stanford OpenIE”工具,本文所提出的方法可将置信度区间[0, 0.2]和[0.8, 1]的MSE(Mean Square Error)从59.27%降至3.94%,AUC(Area Under the ROC Curve)从0.51提升至0.89。  相似文献   

4.
城市热点时空预测是城市管理和智慧城市建设的一项长期而富有挑战性的任务。准确地进行城市热点时空预测可以提高城市规划、调度和安全保障能力并降低资源消耗。现有的区域级深度时空预测方法主要利用基于地理网格的图像、给定的网络结构或额外的数据来获取时空动态。通过从原始数据中挖掘出潜在的自语义信息,并将其与基于地理空间的网格图像融合,也可以提高时空预测的性能,基于此,本文提出了一种新的深度学习方法地理语义集成神经网络(GSEN),将地理预测神经网络和语义预测神经网络相叠加。GSEN模型综合了预测递归神经网络(PredRNN)、图卷积预测递归神经网络(GC-PredRNN)和集成层的结构,从不同的角度捕捉时空动态。并且该模型还可以与现实世界中一些潜在的高层动态进行关联,而不需要任何额外的数据。最终在3个不同领域的实际数据集上对本文提出的模型进行了评估,均取得了很好的预测效果,实验结果表明GSEN模型在不同城市热点时空预测任务中的推广性和有效性,利用该模型可以更好地进行城市热点时空预测,解决一系列如犯罪、火灾、网约车预订等等现代城市发展中亟需解决的相关问题。  相似文献   

5.
随着我国城市化进程的加快,城市内涝灾害愈加频繁,人民的生命和财产安全受到了严重的威胁。然而,城市内涝灾害在愈加频繁的同时,产生了诸如信息获取不及时、制图时效性低、地图信息冗余等问题,难以为救援提供及时响应。基于此,本文提出了一种面向城市内涝场景下的微地图制作方法。首先,调用微博API获取任意时间段内特定主题下的社交媒体文本数据,对数据进行清洗与预处理;接着,选取BiLSTM-CRF模型提取社交媒体中有关城市内涝的地名地址信息;然后,结合Dijkstra算法为用户推荐避开危险路段的最优路径;最后,结合灾害信息与实际场景,制作城市内涝场景下的微地图。实验结果表明:(1)该方法能够有效识别城市内涝点,总体准确率达到92.7%;(2)对比官方发布的积水点,本文提取的积水点与官方积水点大部分重叠,能够有效为传统监测方法提供补充信息;(3)根据所得内涝点生成道路网级别的城市内涝地图,能够克服在海量地理空间信息中可视化冗余的不足,即有效缓解地理信息冗余的问题。由此可知,实时显示城市内涝信息,能够为用户掌握灾害现场的信息提供便利,调动他们参与制作微地图的积极性。与此同时,结合最优路径推荐,能够提高灾害...  相似文献   

6.
网络文本蕴含地理实体关系抽取技术,需要高时效、强鲁棒的关键词提取方法。与监督学习方法相比,无监督学习方法能捕获文本的动态变化特征并发现新增的关系类型,因此备受关注。其中,基于频率的关键词提取方法获得广泛研究,然而,网络文本蕴含的地理实体关系分布稀疏,基于频率的方法难以直接应用于地理实体关系的关键词提取。为解决该问题,本文基于公开访问的网络资源,提出一种语境增强的关键词提取方法。首先,基于在线百科和开放的同义词词典,通过语境合并和语义融合创建增强的语境,以降低语境中词语的稀疏性。接着,Domain Frequency和Entropy频率统计方法从增强语境中自动构建一个大规模语料。然后,基于该语料选择词法特征并统计其权值,用于扩大语境中词语间的差异。最后,使用选择的词法特征度量增强语境中词语的重要性,将权值最大的词语作为描述地理实体关系的关键词,并基于大规模真实网络文本开展实验。实验结果表明:对于地理实体关系的关键词识别,本文方法的平均精度为85.5%,比Domain Frequency和Entropy方法分别提高41%和36%;对于新增关键词识别,本文方法的精度达到60.3%。语境增强的关键词提取方法能有效地处理地理实体关系分布的稀疏性,可服务于网络文本蕴含地理实体关系的抽取。  相似文献   

7.
位置预测技术可以提前预知用户下一时刻的位置,在基于位置的服务(Location-based Service,LBS)领域中发挥着极其重要的作用。现有的位置预测技术大多仅使用用户的地理轨迹,仅使用地理轨迹挖掘出来的用户移动模式易受地理特性的限制缺乏深层次的语义信息。本文基于某商场群体用户的室内轨迹数据和语义信息预测用户下一个时刻语义位置。语义位置预测包括停留区域识别、停留区域语义匹配、语义位置建模。在停留区域识别阶段,为减少室内停留时间不固定对停留区域识别的影响,本研究提出了一种新型的时空凝聚层次聚类算法(Spatial-Temporal Agglomerative Nesting, ST-AGNES),该算法具有思想简单、超参数少、自动生成聚类个数等优点。在语义匹配阶段,引入了吸引度规则,充分利用停留区域所有轨迹点与室内高密度的商铺名称信息做匹配。最后,采用长短型记忆神经网络模型(Long Short-Term Memory,LSTM)挖掘群体用户的语义位置模式并预测用户未来的语义位置,实验预测正确率达到61.3%。  相似文献   

8.
建立适用于专题地图产品检索的用户偏好推荐模型是提高专题地图质量的有效方式之一,在专题地图产品推荐场景中,存在严重的内容冷启动和评论数据稀疏问题,现有的推荐算法无法为特定类用户推荐不同特征的专题地图产品,导致用户从专题地图中获取偏好信息受到限制。因此,本文构建基于负采样的连续词袋模型和基于Word2Vec的Item2Vec相结合的用户偏好推荐方法,用于专题地图产品推荐。① 计算用户行为日志文件中交互行为数据的隐性评分,以代替专题地图推荐信息流场景中稀疏的用户评论数据;② 基于负采样的连续词袋模型提取目标专题地图的前后地图序列感知特征信息,通过控制正负样本比例为1:2,提升目标专题地图潜在评分的预测精度;③ 通过Item2Vec将带有用户行为特征信息的专题地图映射到向量空间,计算用户对专题地图的相似度矩阵,根据用户偏好程度完成推荐。在构建的专题地图评分实验数据集Thematic CMaps和4个公开验证数据集MovieLens上的测试结果表明:与LFM、Personal Rank、Content Based和SVD 4种传统推荐算法相比,本文所提方法可有效提高潜在评分的预测精度,推荐性能最高达到27.85%;与以霍夫曼采样方式的Item2Vec基础方法和YouTubeNet 2种神经网络推荐算法相比,评分预测精度有一定提高,且推荐性能不断提升,最高达到2.97%和5.78%。以经典算法奇异值分解(SVD)为例,将MovieLens-20M数据集切分后,在数据量不断增大的数据子集中,本文所用方法的评分预测精度和性能均优于SVD方法。  相似文献   

9.
地理命名实体分类体系的设计与应用分析   总被引:2,自引:0,他引:2  
自然语言是一种重要的空间数据来源,从自然语言中获取地理空间信息是地理信息科学的重要研究议题。完善的地理命名实体分类体系,有助于实现自然语言中地理空间信息的解析、存贮、组织、管理、分析及共享应用。现有的基础地理要素分类体系、地名分类体系和组织机构分类体系,分别侧重于不同的应用领域,只能表达自然语言中的部分地理命名实体,没有考虑时空关联特性。本文在参照大量相关标准的基础上,根据大量自然语言文本的标注结果,以地理命名实体所指代的空间位置、地理特征和属性作为分类标准,采用主分表和复分表相结合的方式,设计了地理命名实体分类体系(简称"GNEC")。采用定量和定性相结合的方法,分析了GNEC与GB/T18521-2001,GB/T13923-2006,CHG IS的地名分类体系、ADL的FTT词表之间的兼容性,并以中文文本的地理命名实体解析和地图服务为例,验证了GNEC的应用性能。多样性是自然语言中地理实体描述的重要特征,而分类体系主要实现地理命名实体的概念化操作。因此,在GNEC基础上构建本体,将成为解决这一问题的有效途径。  相似文献   

10.
随着在线电子地图应用的普及,地名信息检索已成为相关研究领域的热点,并取得了丰富的研究成果。然而,这些研究主要侧重于检索效率和文本关键词匹配质量的提高,并未顾及实际应用需求和地名信息检索方法的矛盾。本文通过分析地理实体和地名的特征及关系,提出将二者相融合来研究地名信息检索的形式和方法,从数据特征和应用场景的角度出发,提出顾及地理实体的地名信息检索模式,并实现对其的结构化表达,在该检索模式中将地理实体的属性特征和空间关系作为检索特征项;以检索模式为基础提出了基于地理实体相似度计算的地名信息检索模型,并深入研究了文本型属性与数值型属性综合的属性相似度计算方法,以及定性空间过滤与定量距离计算综合的空间关系相似度计算方法;最后,通过实验验证了顾及地理实体的地名信息检索方法的可行性和检索质量。实验结果表明,该检索方法既能实现精细化和空间化的检索需求,也能保证检索结果的准确度。  相似文献   

11.
社交媒体数据可以为台风灾害追踪、灾时救援和灾情评估提供及时有效的信息。现有研究常采用主题建模和情感分析等技术对台风期间社交媒体平台(如新浪微博等)舆论话题和情感变化进行研究。在省域范围内以小时为时间粒度的多维度有效性论证尚有欠缺,且在舆情分析时未能区分用户群体差异。本文以台风“利奇马”为例,在浙江省域范围内,以新浪微博数据为研究对象,首先从词频分析、台风关注度时空变化以及特定灾害事件响应3个角度探讨了微博数据对台风灾情响应的有效性;其次采用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型技术挖掘微博文本主题信息,并根据Louvain算法对主题社团进行划分;然后开发了一种基于自定义情感词典的情感分析方法用于情感指数计算,与SnowNLP相比情感倾向性预测精度得到了提高;最后分析了台风期间官方和民众在新浪微博平台上的话题关注以及情感演变差异。结果表明:① 在省级范围内,微博数据能有效反映台风动态和灾害时空分布;② 台风事件微博文本的主题变化反映了灾情不同阶段舆论关注点的动态变化;③ 官方微博文本比民众微博文本具有更明确的主题社团结构;④ 台风事件相关微博文本中的消极情绪在台风登陆后显著增加,其中民众微博文本对台风灾害的情绪响应更及时,官方微博文本中的情感表达始终相对积极。  相似文献   

12.
在位置服务领域,用户所处环境的上下文信息在分析、处理请求,以及推送相应的位置信息服务方面发挥着至关重要的作用。目前,如何存储和管理上下文位置信息缺乏统一的模型和标准,本文对此提出了一种全新的位置服务的上下文信息模型。利用User Context(< User >,< Time >,< Location >,< Surroundings >,< Demand >)5元素模型描述位置服务上下文信息中5个信息元素(用户信息、时间信息、位置信息、环境信息、用户需求信息),这5个信息元素均是直接因素,彼此独立且获取方便,人为干预少;同时,利用数据库技术可将5元素模型抽象成5元素表形式存储于数据表中,以便高效检索。最后,通过分析5元素模型中的不同信息元素,可推理出基于搜索关键词的用户需求偏好及基于时间和位置信息的用户轨迹(用户行为、热点区域、用户兴趣)。  相似文献   

13.
历史名人的行为轨迹反映了当时的历史文化背景,通过历史名人行为轨迹的空间化和可视化,可以对历史社会状态进行探索和分析。对历史名人的社交关系网络进行可视化研究,有利于剖析当时的政治背景与人物关系。目前,基于GIS的空间人文社会科学深层次分析方法和工具还很少,根据地理位置对历史人物的社交网络进行分时段的研究也很少。本文以玄奘和欧阳修为例,探索了基于WebGIS的历史人物轨迹空间可视化分析方法,基于核密度估计与标准差椭圆的空间分析方法,分析历史名人轨迹点的空间分布特征,统计迁徙指数、首都距、家乡距、成长地距以分析基于距离的轨迹点移动特点;分时段构建了历史名人的空间社交网络,并结合历史背景、名人事迹、名人作品和空间化结果进行了综合分析。分析结果表明: ① 历史名人的迁移轨迹与当时的历史人口迁移趋势基本是一致的,受社会变动影响较大;② 历史名人在事业上升期有更大的社交网络圈,而在人生没落阶段社交网络圈减小。本文对历史名人轨迹的空间可视化与分析方法进行了探索,可以为空间人文社会科学相关领域的分析研究提供参考。  相似文献   

14.
微博中蕴含台风灾害损失信息识别和分类方法   总被引:1,自引:0,他引:1  
社交媒体在灾害信息的实时发布与传播中发挥着越来越重要的作用。在灾害发生过程中,社交媒体中蕴含的实时灾损信息对灾情及时响应和评估有重要意义。然而,这些涉灾文本具有信息破碎度高、文本特征稀疏、标注语料库匮乏等缺点,使得传统的基于监督学习的方法难以有效提取其中的灾损信息。为此,本文提出了一种通过扩展上下文特征和匹配特征词的方法来快速识别和分类社交媒体中蕴含的不同类别的灾损信息。本方法首先基于中文语法规则,抽取小规模不同灾损类别下微博文本中的涉灾关键词构建特征词搭配对。然后,利用词向量模型和已有词库对这些特征词搭配对进行补充和扩展。同时,根据中文词语共现规则,引入外部语料库优化特征词间的语义搭配关系。最终,以此为基础构建台风灾损分类知识库对灾情文本中蕴含的不同类别灾损信息进行识别和分类。本文以2016年9月15日台风“莫兰蒂”登陆事件作为研究案例,以评估本文方法在灾损信息识别和分类上的效果。结果表明,本文方法对微博文本中蕴含的不同类别风灾损失信息的识别和分类效果显著(各类别综合评价指标都达到了0.74以上)。基于灾损信息分类结果,本文绘制了台风影响的时空分布图,从而进一步说明本文方法在灾害损失评估和减灾救灾方面的效用。  相似文献   

15.
基于手机信令数据的城市小活动空间人群空间分布特征   总被引:1,自引:0,他引:1  
小活动空间人群是指日常活动范围较小的居民群体,他们对城市公共资源的需求主要集中在家庭位置附近的区域,分析其活动的时空规律特征,有助于更好地实现城市公共资源的均等化和精准化配置。然而目前研究中对此类人群关注较少,为此,本文提出一种基于手机信令数据的小活动空间人群识别及其空间分布的研究方法。首先识别用户家庭位置和停留点位置,构建基家最大距离指标,度量用户以家庭位置为中心的活动空间范围,并据此筛选小活动空间人群;其次根据用户与家庭位置间的距离信息构建“时间-距离”框架下的用户轨迹,在此基础上构建基于面积的轨迹相似性方法;然后利用逐级合并的层次聚类算法,根据用户轨迹的相似性对其进行聚类,挖掘小活动空间人群中典型活动模式;最后根据用户的家庭位置,进一步分析不同活动模式人群的时空分布特征。本文以上海市手机信令数据为例对该方法进行了测试,结果表明:① “时间-距离”框架下构建的基于面积的轨迹相似性方法,可反映用户基于家庭位置进行活动的时空特征,而逐级合并的层次聚类算法对典型活动模式挖掘的效率有明显提高,有助于研究城市居民的移动模式;② 上海市小活动空间人群分布呈现出圈层结构,主要分布在中心城区,郊区的工厂和大学城以及各区的商业中心附近,在郊区过渡区相对较少。本文提出的方法能够用于分析城市小活动空间人群的时空分布特征,可以为目前各大城市提出建设社区生活圈的决策提供方法支撑。  相似文献   

16.
研究网络地理信息服务用户的访问行为,有利于了解用户地理信息兴趣、实现按需服务.本文基于全空间信息系统建模的理论,构建用户-访问城市关系网络,研究用户访问的空间聚集性.顾及到关系网络中行为关系强度的表达需要同时考虑用户访问行为、城市关联关系和城市结构,仅用单一的用户访问行为数据会存在偏差,本文提出了基于矩阵分解的数据融合...  相似文献   

17.
利用终端位置时空转移概率预测通讯基站服务用户规模   总被引:1,自引:0,他引:1  
基站服务用户数的预测对通信基站的空间位置选取、通讯服务带宽的配置优化等有重要作用,并为城市公共安全管理方面中的人群聚集预警与群体事件预防提供辅助决策支持。本文利用海量手机轨迹数据,运用时空转移概率定量化描述城市内不同区域间人群流动的时空特性,结合马尔可夫链和贝叶斯定理,构建手机用户群体在基站间的时空转移概率模型,并以此提出一种城市区域尺度上的基站服务用户数预测方法。利用湖北省某城市长达30 d的手机轨迹数据进行模型训练与预测方法验证,实验结果表明:在时间粒度为60 min时,本文提出的方法对8-22时各时段基站服务用户数预测准确率都大于94.8%;在不同时间粒度下对比本文方法、Castro模型、移动平均法,发现在时间粒度大于20 min时,本文方法预测准确率高于另外两种方法。  相似文献   

18.
利用社交媒体的位置潜语义特征提取与分析   总被引:1,自引:0,他引:1  
社交媒体及时、大量、广泛地记录了城市中居民的观点和情感,尤其是具有位置标记的签到文本,将人们所处的空间和城市设施与其相应的认知态度结合起来,成为以人为核心主导的对空间位置特征的直接表达,是场所语义信息的集中体现。以微博签到数据为研究对象,引入自然语言处理领域的潜语义分析的方法,结合空间分析中因子分析、空间自相关分析和聚类分析的手段,提取并分析其中隐含的位置语义特征。本研究主要侧重于对位置之间语义相关程度的度量,首先提取研究区域隐含的概念主题结构,分析不同主题在空间上的分布特征。然后对特定地块进行潜语义空间上的相似性索引,在此基础上,采用先验的百度百科词条描述对位置间语义相似性进行扩展,通过空间自相关的分析,得到不同功能类型的热点区域。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号