吉林大学学报(工学版) ›› 2013, Vol. 43 ›› Issue (增刊1): 485-488.

• 论文 • 上一篇    下一篇

基于模糊聚类的Web用户聚类方法与实现

司建波1, 姚燕1, 郭蔚莹2, 杨芳3   

  1. 1. 吉林大学 公共卫生学院流行病与卫生统计学教研室,长春 130021;
    2. 吉林大学 第一医院内分泌代谢科,长春 130021;
    3. 吉林大学 第一医院健康管理中心,长春 130021
  • 收稿日期:2012-08-10 发布日期:2013-06-01
  • 通讯作者: 杨芳(1971-),女,副教授.研究方向:肿瘤健康管理.E-mail:yangfang7164@yahoo.com.cn E-mail:yangfang7164@yahoo.com.cn
  • 作者简介:司建波(1970-),男,博士,在站博士后.研究方向:基因组流行病学.E-mail:tiger_zgy@163.com
  • 基金资助:

    长春市科技局软科学项目(11RY14);吉林省科技厅国际合作项目(3D511Z613428);卫生部临床学科重点项目(2001133).

Web user cluster method and realization based on fuzzy clustering

SI Jian-bo1, YAO Yan1, GUO Wei-ying2, YANG Fang3   

  1. 1. Department of Epidemiology and Biostatistics, School of Public, Jilin University, Changchun 130021, China;
    2. Department of Endocrinology, First Hospital, Jilin University, Changchun 130021, China;
    3. Department of Health Management, First Hospital, Jilin University, Changchun 130021, China
  • Received:2012-08-10 Published:2013-06-01

摘要:

提出了一种基于传递闭包的模糊聚类方法,并应用于Web日志聚类中,实验结果表明,该算法能够有效实现Web用户聚类,并且能够避免陷入局部最优解。最后与模糊C均值算法进行比较,并讨论了算法的运行时间和错分率。

关键词: 模糊聚类, 传递闭包, Web用户聚类

Abstract:

The fuzzy clustering method was proposed based on the transitive closure is and it was applied to web log clustering. The experiments show the algorithm is more effective in web user clustering and avoiding falling into the local optimal solution. It was compared with fuzzy C-means algorithm. The running time and error rate of the algorithm were discussed.

Key words: fuzzy clustering, transitive closure, Web user cluster

中图分类号: 

  • TP301.6

[1] 刘海琳. 基于遗传算法的Web用户聚类模型的研究. 天津:天津理工大学研究生部, 2007. Liu Hai-lin. Research of Web user clustering model based on genetic algorithm. Tianjin: College of Master, Tianjin University of Technology, 2007.

[2] Han Jia-wei,Kamber Micheline.北京:数据挖掘:概念与技术[M].范明,孟小峰等译.北京:机械工业出版社,2003.

[3] 朱小娟. 人工免疫聚类在Web日志挖掘中的应用.南昌:南昌大学信息工程学院,2008. Zhu Xiao-juan. Application of artificial immune clustering in Web log mining. Nanchang: College of Information Engineering, Nanchang University, 2008.

[4] 胡庆林,叶念渝,朱明富. 数据挖掘中聚类算法的综述[J]. 计算机与数字工程,2007,3(1):10-13. Hu Qing-lin, Ye Nian-yu, Zhu Ming-fu. Survey of cluster analysis in data mining[J]. Computer & Digital Engineering, 2007, 3(1):10-13.

[5] 贺玲,吴玲达,蔡益朝. 数据挖掘中的聚类算法综述[J]. 计算机应用研究,2007(1):10-13. He Ling, Wu Ling-da, Cai Yi-chao. Survey of clustering algorithms in data mining[J]. Application Research of Computers, 2007(1):10-13.

[6] 张敏,于剑. 基于划分的模糊聚类算法[J]. 软件学报,2004,15(6):858-868. Zhang Min, Yu Jian. Fuzzy partitional clustering algorithms[J]. Journal of Software, 2004,15(6):858-868.

[7] 郝建斌. 基于模糊理论的Web用户聚类的研究[D]. 北京:北京理工大学计算机学院,2011. Hao Jian-bin. Web user clustering research based on the fuzzy theory[D]. Beijing: College of Computer, Beijing Institute of Technology, 2011.

[8] 王松岩. 基于模糊聚类的汉语教学系统学习用户分类方法研究与实现[D]. 长春:吉林大学计算机科学与技术学院,2012. Wang Song-yan. The research and implementation of learner's classification for Chinese teaching system based on fuzzy clustering[D]. Changchun: College of Computer Science and Technology, Jilin University,2012.

[9] msnbc数据集[EB/OL]. http://kdd.ics.uci.edu/database/msnbc/msnbc.html, 2012-06.

[1] 王喆, 杨柏婷, 刘昕, 刘群, 宋现敏. 基于模糊聚类的驾驶决策判别[J]. 吉林大学学报(工学版), 2015, 45(5): 1414-1419.
[2] 申铉京1,2,王开业1,2,千庆姬3,刘英杰4,李想4. 基于自适应气球力Snake模型的图像分割[J]. 吉林大学学报(工学版), 2011, 41(05): 1394-1400.
[3] 周显国,陈大可,苑森淼. 基于改进模糊聚类分析的医学脑部MRI图像分割[J]. 吉林大学学报(工学版), 2009, 39(增刊2): 381-0385.
[4] 姜桂艳,郭海锋,吴超腾 . 基于感应线圈数据的城市道路
交通状态判别方法
[J]. 吉林大学学报(工学版), 2008, 38(增刊): 37-0042.
[5] 徐新卫,周良,徐晓明,丁秋林 . Web主动服务中基于混合挖掘的用户意图辨识[J]. 吉林大学学报(工学版), 2007, 37(02): 419-0423.
[6] 鹿应荣,杨印生,吕锋 . 基于模糊聚类分析的车辆优化调度[J]. 吉林大学学报(工学版), 2006, 36(增刊2): 147-151.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!