摘要: 为解决从数据库中挖掘长模式可能遇到较高的计算复杂度问题, 提出一种新的算法FFSPAN. 传统上, 要判断一个序列是否频繁, 需要在原数据库中判断整个序列是否频繁; 而算法FFSPAN是通过在序列数据库中寻找一个频繁项或一个频繁项集来代替寻找一个完整的频繁序列, 而且FFSPAN算法每次扫描的数据库都是迅速减小的, 这使得算法在挖掘的序列模式越长时越有效. 在标准测试数据集上的实验结果表明, FFSPAN算法非常有效.
中图分类号:
管恩政, 常晓宇, 王喆, 周春光. 快速频繁序列模式挖掘算法[J]. J4, 2005, 43(06): 768-772.
GUAN En-zheng, CHANG Xiao-yu, WANG Zhe, ZHOU Chun-guang. Fast Frequent Sequential Pattern Mining Algorithm[J]. J4, 2005, 43(06): 768-772.