摘要:
为了挖掘XML(Extensible Markup Language)文档在历史变化过程中不经常发生变化的结构所蕴含的知识,给出了发现冰冻结构的方法,使用一组冰冻结构组成的文档向量模型代表一个XML文档,并使用加权Jaccard系数作为相似度,利用基于XML文档历史变化过程中相对稳定的冰冻结构对XML文档进行聚类。经过实验证明,基于冰冻结构能够将XML进行有效的聚类,聚类后每簇中的XML文档具有相似的不经常变化结构。
中图分类号:
李 巍,孙 涛,叶苑苑,李雄飞,李 楠. 基于冰冻结构的XML文档聚类研究[J]. J4, 2009, 27(06): 611-.
LI Wei,SUN Tao,YE Yuan-yuan,LI Xiong-fei|LI Nan. XML Domument Clustering Research Based on Weighted Cosine Similarity[J]. J4, 2009, 27(06): 611-.