吉林大学学报(信息科学版) ›› 2024, Vol. 42 ›› Issue (4): 726-732.
韩云娜
西北大学现代学院 基础部, 西安 710130
HAN Yunna
Basic Department, Modern College of Northwest University, Xi蒺an 710130, China
摘要:
针对在不均衡流数据在检索过程中, 由于数据流中存在不均衡性, 且易受差异性数据、边缘数据的影响,导致数据检索性能下降的问题, 提出了基于多相似度模糊 C 均值聚类的不均衡流数据检索方法。该方法计算出不均衡流数据之间的多相似度, 针对不同相似度的数据, 采用模糊C 均值算法对其聚类处理。 通过构建八叉树检索模型, 对聚类后的数据进行存储、编码和判断, 完成不均衡流数据的检索。实验结果表明, 所提方法的检索时间低于20 s, 查全率和查准率保持在 80% 以上, 且 NDCG ( Normalized Discounted Cumulative Gain) 数值高。
中图分类号: