王红梅, 胡明, 赵守峰
WANG Hongmei, HU Ming, ZHAO Shoufeng
摘要:
针对Eclat算法连接和剪枝操作耗时的缺点, 按照项集之间的可连接性, 将数据集划分为等价类并分段存储, 采用末项剪枝策略, 在常量时间内完成连接和剪枝操作. 针对Eclat算法求长集合的交集操作需要大量计算的缺点, 采用多维数组分段存储项集的事务集, 将长集合的求交集操作转换为分段求短集合的交集, 并提出期望支持度的概念, 在求交集的过程中预测支持度, 从而减少求交集的比较次数. 实验结果表明, 该算法在时间性能方面优于Eclat算法, 尤其适用于挖掘长模式稀疏数据集.
中图分类号: