摘要: 针对FBCM(基于矩阵压缩FUP(fast update algorithm))算法在项集挖掘过程中存在频繁扫描原频繁项集库, 并生成大量候选集的问题, 提出一种通过提取数据库中最频繁项的方法, 以降低对原频繁项集库的扫描次数; 并通过候选集剪枝思想, 减少算法整体运行过程中的候选集生成, 以提高频繁项集的挖掘速度. 实验结果表明, 在相同实验条件下, 该算法的效率比FBCM算法效率提高15%以上, 最高达60%.
中图分类号:
杨勇, 张磊, 曲福恒, 刘俊杰, 陈强. 基于最频繁项提取和候选集剪枝的THIMFUP算法[J]. 吉林大学学报(理学版), 2021, 59(3): 635-642.
YANG Yong, ZHANG Lei, QU Fuheng, LIU Junjie, CHEN Qiang. THIMFUP Algorithm Based on the Most Frequent Item Extraction and Candidate Set Pruning[J]. Journal of Jilin University Science Edition, 2021, 59(3): 635-642.