摘要:
为克服半结构化数据存储复杂的缺点, 提出一种基于动态树的半结构化的存储模型。对该模型进行模式抽取, 并将其引入到Apriori算法。通过设置最小支持度阀值过滤掉不必要的信息, 输出最长频繁路径的集合, 以实现半结构化数据的提取。实验结果表明, 该算法能同时有效地处理分支及环路问题, 避免了死循环的出现。
中图分类号:
李颖, 张晓贤, 孙佳慧. 基于频繁模式半结构化数据的模式抽取[J]. J4, 2012, 30(5): 540-.
LI Ying, ZHANG Xiao-xian, SUN Jia-hui. Semi-Structured Data Model Extraction Based on Frequent Patterns[J]. J4, 2012, 30(5): 540-.