吉林大学学报(工学版) ›› 2010, Vol. 40 ›› Issue (06): 1639-1643.

• 论文 • 上一篇    下一篇

改进的PeertoPeer环境下的聚类算法

田野1,2,刘大有1,2   

  1. 1.吉林大学 计算机科学与技术学院,长春 130012;2.吉林大学 符号计算与知识工程教育部重点实验室,长春 130012
  • 收稿日期:2009-06-30 出版日期:2010-11-01 发布日期:2010-11-01
  • 通讯作者: 刘大有(1942-),男,教授,博士生导师.研究方向:多Agent系统,移动Agent,知识工程与专家系统,数据挖掘以及空间推理.E-mail:liudy@jlu.edu.cn E-mail:E-mail:liudy@jlu.edu.cn
  • 作者简介:田野(1979-),男,博士研究生.研究方向:计算智能,贝叶斯网,数据挖掘.E-mail:tianye924@yahoo.com.cn
  • 基金资助:

    国家自然科学基金项目(60603030;60773099;60873149;60973088);“863”国家高技术研究发展计划项目(2006AA10Z245;2006AA10A309);欧盟项目(Bridging the Gap,155776-EM-1-2009-1-IT-ERAMUNDUS-ECW-L12).

Improved clustering algorithm in peertopeer environments

TIAN Ye1,2,LIU Da-you1,2   

  1. 1.College of Computer Science and Technology,Jilin University,Changchun 130012,China;2.Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education,Jilin University,Changchun 130012,China
  • Received:2009-06-30 Online:2010-11-01 Published:2010-11-01

摘要:

在P2PKMeans算法的基础上,提出了一种改进的数据聚类算法DKMeans。该算法不需要所有节点进行全局同步,只需要在直接相连的节点间进行通信,同时利用本地保存的直接相邻节点聚类信息来减少节点间的通信次数,从而减少整个网络的通信开销。与P2PKMeans算法的实验结果对比表明,改进后的算法通信量要小于P2PKMeans算法的通信量,并且在聚类准确度方面也没有损失,此外,随着节点的增多,DKMeans算法所需通信量的增长速度要明显低于P2PKMeans算法。

关键词: 人工智能, K-Means算法, 分布式数据挖掘, P2P网络

Abstract:

P2PKMeans algorithm is a distributed clustering algorithm in PeertoPeer (P2P) network. An improved data clustering algorithm, DKMeans, was proposed based on P2PKMeans algorithm. The proposed algorithm works in a localized asynchronous manner by communicating with the directly connected nodes without global synchronization. DKMeans decreases communication overhead of P2P network by saving cluster information of direct neighbors, thus reducing the total network communication cost. Compared with P2PKMeans, the traffic is much less using the proposed DKMeans and there is no degradation in accuracy. Furthermore, with the increase in nodes, the traffic growth rate of DKMeans is lower that of P2PKMeans.

Key words: artificial intelligence, K-Means algorithm, distributed data mining, P2P network

中图分类号: 

  • TP181
[1] 董飒, 刘大有, 欧阳若川, 朱允刚, 李丽娜. 引入二阶马尔可夫假设的逻辑回归异质性网络分类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1571-1577.
[2] 顾海军, 田雅倩, 崔莹. 基于行为语言的智能交互代理[J]. 吉林大学学报(工学版), 2018, 48(5): 1578-1585.
[3] 王旭, 欧阳继红, 陈桂芬. 基于垂直维序列动态时间规整方法的图相似度度量[J]. 吉林大学学报(工学版), 2018, 48(4): 1199-1205.
[4] 张浩, 占萌苹, 郭刘香, 李誌, 刘元宁, 张春鹤, 常浩武, 王志强. 基于高通量数据的人体外源性植物miRNA跨界调控建模[J]. 吉林大学学报(工学版), 2018, 48(4): 1206-1213.
[5] 黄岚, 纪林影, 姚刚, 翟睿峰, 白天. 面向误诊提示的疾病-症状语义网构建[J]. 吉林大学学报(工学版), 2018, 48(3): 859-865.
[6] 李雄飞, 冯婷婷, 骆实, 张小利. 基于递归神经网络的自动作曲算法[J]. 吉林大学学报(工学版), 2018, 48(3): 866-873.
[7] 刘杰, 张平, 高万夫. 基于条件相关的特征选择方法[J]. 吉林大学学报(工学版), 2018, 48(3): 874-881.
[8] 王旭, 欧阳继红, 陈桂芬. 基于多重序列所有公共子序列的启发式算法度量多图的相似度[J]. 吉林大学学报(工学版), 2018, 48(2): 526-532.
[9] 杨欣, 夏斯军, 刘冬雪, 费树岷, 胡银记. 跟踪-学习-检测框架下改进加速梯度的目标跟踪[J]. 吉林大学学报(工学版), 2018, 48(2): 533-538.
[10] 刘雪娟, 袁家斌, 许娟, 段博佳. 量子k-means算法[J]. 吉林大学学报(工学版), 2018, 48(2): 539-544.
[11] 曲慧雁, 赵伟, 秦爱红. 基于优化算子的快速碰撞检测算法[J]. 吉林大学学报(工学版), 2017, 47(5): 1598-1603.
[12] 李嘉菲, 孙小玉. 基于谱分解的不确定数据聚类方法[J]. 吉林大学学报(工学版), 2017, 47(5): 1604-1611.
[13] 邵克勇, 陈丰, 王婷婷, 王季驰, 周立朋. 无平衡点分数阶混沌系统全状态自适应控制[J]. 吉林大学学报(工学版), 2017, 47(4): 1225-1230.
[14] 王生生, 王创峰, 谷方明. OPRA方向关系网络的时空推理[J]. 吉林大学学报(工学版), 2017, 47(4): 1238-1243.
[15] 马淼, 李贻斌. 基于多级图像序列和卷积神经网络的人体行为识别[J]. 吉林大学学报(工学版), 2017, 47(4): 1244-1252.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!