吉林大学学报(信息科学版) ›› 2023, Vol. 41 ›› Issue (1): 174-179.
施一飞
SHI Yifei
摘要: 针对在对分布式、 多维数据流频繁模式挖掘算法研究时, 没有删除多维数据流中的非频繁项集, 存在平均处理时间长的问题, 提出分布式多维数据流频繁模式挖掘算法。 该方法根据人工神经网络特点, 建立了人工神经网络模型, 并对多维数据流训练, 以达到提升挖掘效率的目的; 并基于训练结果构造数据流频繁模式信息树, 即频繁模式树(FR-tree: Frequent Pattern tree)。 由于 FR-tree 中存在较多过期的多维数据流, 所以需要对 FR-tree 剪枝, 并删除非频繁项集, 从而加快频繁模式计算速度, 并采用分布式挖掘算法对全局 FR-tree挖掘, 从中取得多维数据流的频繁项集完全集, 实现分布式多维数据流频繁模式的挖掘。 通过对该方法的平均处理时间测试, 验证了该方法的实用性。
中图分类号: