吉林大学学报(信息科学版) ›› 2023, Vol. 41 ›› Issue (2): 329-337.
刘文杰, 杨海军
LIU Wenjie, YANG Haijun
摘要: 由于在现有的闭频繁项集挖掘算法中, 剪枝策略相对单一, 大都是针对 1项集进行剪枝, 对 2项集和 n项集(n逸3)的剪枝策略相对匮乏, 而有效的剪枝策略可以提前发现并剪掉大量没有希望的项集, 因此改进闭 频繁项集的剪枝策略对此类算法效率的提升具有很大的帮助。 为此在 ESCS(Estimated Support Cooccurrence Structure)结构基础上, 提出针对 2项集的 ESCS 剪枝策略, 并应用其将经典闭频繁项集挖掘算法 DCI_Closed (Direct Count Intersect Closed)改进为 DCI_ESCS(Direct Count Intersect Estimated Support Cooccurrence Structure) 算法, 同时对 ESCS 剪枝策略的效果加以验证。 在多个公开数据集上、 不同最小支持度阈值下, 对改进前后 算法时间性能进行比较实验。 实验结果表明, 改进的 DCI_ESCS 算法在事务和项集较长的、 较稠密的数据集上 表现良好, 时间效率均有一定程度的提高。
中图分类号: