|
|
基于泛化中心聚类的时间序列缺失数据填补方法
于艳朋, 惠向晖
吉林大学学报(理学版). 2025 (4):
1137-1142.
摘要
(
115 )
PDF(559KB)
(
14
)
针对填补时间序列中的缺失值通常依赖于已有数据的预测, 由于时间序列的复杂性和不确定性导致预测结果常存在误差的问题, 为保证数据填补效果, 提出一种基于泛化中心聚类的时间序列缺失数据填补方法. 首先, 计算对象与类之间、 类与类之间的距离, 量化数据点与聚类中心之间的相对位置关系, 得到数据间的空间关系. 其次, 利用信息瓶颈算法对空间中的泛化中心进行聚类处理, 将含有缺失数据的时间序列数据集划分到同一类中. 最后, 计算簇半径, 对泛化中心聚类后产生的离群点数据再次进行可用、 弱可用随机损坏数据划分, 设置波动阈值, 将位于波动阈值内的随机损坏数据与聚类中统一属性值进行字符串对比, 实现时间序列缺失数据填补. 实验结果表明, 该方法在聚类过程中有较高的标准化互信息和命中率, 在缺失数据填补时, 可保证数据补齐率在80%以上, 说明该方法可有效改善时间序列数据的完整性.
相关文章 |
计量指标
|