首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于网络爬虫的Web服务抓取解析器的设计与实现
引用本文:陈晓慧,陈荣国,卫文学.基于网络爬虫的Web服务抓取解析器的设计与实现[J].地理信息世界,2010,8(3):64-68.
作者姓名:陈晓慧  陈荣国  卫文学
作者单位:1. 山东科技大学,信息科学与工程学院,山东,青岛,266510
2. 中国科学院,地理科学与资源研究所,北京,100101
基金项目:国家863高技术研究发展计划重点基金项目,国家科技支撑计划基金项目,中科院知识创新工程重要方向基金项目 
摘    要:随着Web服务和网络技术的发展,越来越多的Web服务得以开发并发布到网络上.由于网络上存在的Web服务相互之间没有内在的必然联系,用户很难快速有效地获取和利用这些服务.本文设计了一种Web服务抓取解析器框架,包括URL抓取器、WSDL文档解析器和用于结构化存储Web服务信息的数据库等.该抓取解析器采用网络爬虫程序对互联网中的URL进行搜索,通过搜索发现分布在网络上的Web服务,并最终建立起一个关于Web服务的信息库,为共享Web服务提供条件.

关 键 词:Web服务  服务抓取  服务解析  网络爬虫  服务共享

Design and Realization of Web Service Snatch and Parse Engine Based on Web Crawler
CHEN Xiao-hui,CHEN Rong-guo,WEI Wen-xue.Design and Realization of Web Service Snatch and Parse Engine Based on Web Crawler[J].Geomatics World,2010,8(3):64-68.
Authors:CHEN Xiao-hui  CHEN Rong-guo  WEI Wen-xue
Institution:CHEN Xiao-hui1,CHEN Rong-guo2,WEI Wen-xue1 (1.College of Information Science , Engineering,Sh,ong University of Science , Technology,Qingdao 266510,China,2. Institute of Geographic Sciences , Natural Resources Research,Chinese Academy of Sciences,Beijing 100101,China)
Abstract:With the development of web service and network technology, more and more web service are developed and published to the Web. As there is no intrinsic and inevitable relation among the web services on the web, it is difficult for the users to access and use those services quickly and efficiently. In this paper, a web service snatch and parse engine frame is designed, including URL snatcher, WSDL document parser and database for storing web service information structurally. The engine adopts a web crawler pr...
Keywords:web services  service snatch  service parse  web crawler  service share  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号