吉林大学学报(理学版) ›› 2021, Vol. 59 ›› Issue (6): 1455-1460.
李长明1, 张红臣1, 王超2, 李晓光2, 陆洋3, 钱超越3
LI Changming1, ZHANG Hongchen1, WANG Chao2, LI Xiaoguang2, LU Yang3, QIAN Chaoyue3
摘要: 针对传统阴阳k-means算法未利用数据结构导致计算效率较低的问题, 提出一种高效阴阳k-means聚类算法. 该算法根据数据相似性将原始数据进行逐层分解, 并建立满m叉树结构存储各层数据, 以树结构各叶子节点中存储的数据信息建立加权数据, 运行加权阴阳k-means算法得到收敛中心. 在原始数据中以加权数据收敛中心为初始化条件运行传统阴阳k-means算法进一步优化目标函数值. 在5组UCI数据集上与k-means、传统阴阳k-means及另外两种加速算法进行对比实验, 实验结果表明, 该算法具有较高的加速比, 且求解精度与传统阴阳k-means聚类基本相同.
中图分类号: