吉林大学学报(信息科学版) ›› 2022, Vol. 40 ›› Issue (1): 71-76.
杨 晖
YANG Hui#br# #br#
摘要: 针对传统云存储存在去冗效率和召回率低的问题, 提出了基于皮尔森相关算法的云存储层次化去冗优化方法。 根据云存储层次化结构中冗余信息的属性分布相似性度量值, 构建了冗余信息的距离矩阵; 通过计算冗余信息之间的相似度, 对云存储层次化冗余信息进行分类; 通过分析不同类别冗余信息的结构, 利用数据降维约束条件和中心极限原理, 在云存储层次化结构中, 构建冗余信息特征空间压缩的目标函数, 提取出云存储层次化冗余信息特征; 基于去冗优化超平面, 计算冗余信息样本点到正负类超平面的距离; 利用皮尔森相关算法定义模糊因子, 据此定义云存储层次化结构中特征有效度, 构建了冗余信息特征的有效度函数, 实现了云存储层次化的去冗优化。 实验结果表明, 设计方法在提高去冗效率的同时, 在召回率上也具有很好的性能。
中图分类号: