摘要:
提出一种改进的基于树路径匹配的网页结构相似度算法, 该算法定义了树路径的序列相似度和位置相似度, 找出网页的树路径集合, 通过网页间的最佳树路径匹配计算结构相似度. 实验结果表明, 用改进后的算法计算网页结构相似度比传统树路径匹配方法更符合实际, 更合理有效.
中图分类号:
廖浩伟, 杨燕, 贾真, 尹红风. 一种改进的基于树路径匹配的网页结构相似度算法[J]. J4, 2012, 50(06): 1199-1203.
LIAO Gao-Wei, YANG Yan, GU Zhen, YIN Gong-Feng. An Improved Web Structure Similarity Based on MatchingAlgorithm of Tree Paths[J]. J4, 2012, 50(06): 1199-1203.