吉林大学学报(信息科学版) ›› 2024, Vol. 42 ›› Issue (2): 312-317.
刘晓燕, 翟建国
LIU Xiaoyan, ZHAI Jianguo
摘要: 针对不完整大数据因其自身结构具有不规则性, 导致在进行缺失值插补时计算量大、 插补精度低的 问题, 提出空间自回归模型下不完整大数据缺失值插补算法。 利用迁移学习算法在动态权重下过滤出原始数 据中冗余数据, 区分异常和正常数据, 提取残缺数据, 采用最小二乘回归对残缺数据实施修补。 将缺失值插补 分为 3 种类型, 分别为一阶空间自回归模型插补、 空间自回归模型插补和多重插补法。 根据实际情况将修补后 数据插补到合适的位置, 实现不完整大数据缺失值插补。 实验结果表明, 所提方法具有良好的缺失值插 补能力。
中图分类号: