吉林大学学报(工学版) ›› 2000, Vol. ›› Issue (3): 47-50.

• 论文 • 上一篇    下一篇

关联规则试验数据的人工合成

程晓青1, 苑森淼2   

  1. 1. 吉林工业大学 理学院, 吉林 长春 130025;
    2. 吉林工业大学 信息科学与工程学院, 吉林 长春 130025
  • 收稿日期:1999-12-24 出版日期:2000-07-25
  • 基金资助:
    国家自然科学基金资助项目(69873019)

Synthetic Data Generation on Association Rules

CHENG Xiao-qing1, YUAN Sen-miao2   

  1. 1. College of Sciences, Jilin University of Technology, Changchun 130025, China;
    2. College of Information Science & Engineering, Jilin University of Technology, Changchun 130025, China
  • Received:1999-12-24 Online:2000-07-25

摘要: 给出了一种实验人工数据合成的算法。该算法利用多种概率模型模拟事务长度、潜在强项集长度、项集频度等特征数据,模拟大型超市的事务数据库,生成不同规模、不同特点的数据,用以测试算法的时间曲线及可伸缩性。

关键词: 数据挖掘, 关联规则, 人工数据合成

Abstract: This paper develops algorithms on synthetic data generation based on the mathematic model presented by IBM Almaden Center.Synthetic data generaion is the test foundation of association rule research.To verify that the new algorithm is advanced to the existings on performances and scalibility,the authors need to compare existing algorithms with new algorithms on various kinds of datasets different in size and potentially strong item size.The research makes it releasable and the result is relatively satisfactory.

Key words: data mining, association rules, synthetic data generation

中图分类号: 

  • TP311.131
[1] Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[Z].In Proc.ACM SIGMOD,Washington,D.C.,1993.
[2] Agrawal R,Srikant R.Fast algorithms for mining association rules in large databases[Z].In Proc.20th Int'1 Conf.Vcry Large Data Bases,Santiago,Chile,1994.
[3] Agrawal R,Imielinski T,Swami A.Database mining:a performance perspective[J].IEEE Trans.Knowledge and Data Eng,1993,12:914~925.
[1] 邓剑勋, 熊忠阳, 邓欣. 基于谱聚类矩阵的改进DNALA算法[J]. 吉林大学学报(工学版), 2018, 48(3): 903-908.
[2] 任维武, 胡亮, 赵阔. 基于数据挖掘和本体的入侵警报关联模型[J]. 吉林大学学报(工学版), 2015, 45(3): 899-906.
[3] 王亮, 胡琨元, 库涛, 吴俊伟. 随机采样移动轨迹时空热点区域发现及模式挖掘[J]. 吉林大学学报(工学版), 2015, 45(3): 913-920.
[4] 刘淑芬, 孟冬雪, 王晓燕. 的DBSCAN算法[J]. 吉林大学学报(工学版), 2014, 44(4): 1135-1139.
[5] 刘兆军, 赵浩宇, 王婧, 李雄飞, 李巍. 考虑层数信息的XML文档聚类方法[J]. 吉林大学学报(工学版), 2014, 44(01): 124-128.
[6] 白天, 冀进朝, 何加亮, 周春光. 混合属性数据聚类的新方法[J]. 吉林大学学报(工学版), 2013, 43(01): 130-134.
[7] 刘大有, 杨建宁, 杨博, 赵学华, 金弟. 基于环路紧密度的复杂网络社区挖掘方法[J]. 吉林大学学报(工学版), 2013, 43(01): 98-105.
[8] 张君维, 杨静, 张健沛, 张乐君. 基于滑动窗口的敏感关联规则隐藏[J]. 吉林大学学报(工学版), 2013, 43(01): 172-178.
[9] 李松生, 赵燕伟, 顾熙仁. 改进的FUP算法在五金产品质量分析系统中的应用[J]. 吉林大学学报(工学版), 2012, 42(增刊1): 251-254.
[10] 王建林, 杨印生, 王学玲. 基于可拓数据挖掘的黄河三角洲土地利用评价[J]. 吉林大学学报(工学版), 2012, 42(增刊1): 479-483.
[11] 潘伟涛1,谢元斌2,郝跃2,史江义2. 基于启发式链搜索的频繁子电路提取算法[J]. 吉林大学学报(工学版), 2011, 41(6): 1748-1753.
[12] 倪萍,廖建新,朱晓民,万里,. 流数据增量式多维可扩展可视化挖掘方法[J]. 吉林大学学报(工学版), 2011, 41(03): 817-821.
[13] 田野, 刘大有. 改进的PeertoPeer环境下的聚类算法[J]. 吉林大学学报(工学版), 2010, 40(06): 1639-1643.
[14] 王利民,臧雪柏,曹春红2. 基于广义信息论的决策森林数据挖掘模型[J]. 吉林大学学报(工学版), 2010, 40(01): 155-0158.
[15] 张日明,孙大文 . 数 控 装 备 故 障 模 式 分 析[J]. 吉林大学学报(工学版), 2008, 38(增刊): 123-0125.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!