摘要: 针对目前通用搜索引擎搜索到的结果过多、 与主题相关性不强的现状, 提出一种基于网页分块技术的主题爬行器实现方法, 并实现了一个原型系统Crawler1. 实验结果表明, 本系统性能较好, 所爬网页的相关度在55%以上.
中图分类号:
李晓亚, 赫枫龄, 左万利. 基于网页分块技术主题爬行器的实现[J]. J4, 2007, 45(06): 959-965.
LI Xiaoya, HE Fengling, ZUO Wanli. Realization of Focused Crawler Based on Page Segmentation[J]. J4, 2007, 45(06): 959-965.