吉林大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (4): 1374-1383.doi: 10.13229/j.cnki.jdxbgxb.20230690

• 计算机科学与技术 • 上一篇    下一篇

基于EMD-LSTM的分子谱线数据预处理容器负载分组预测算法

冶鑫晨1,2,3(),张海龙1,2,3,4(),王杰1,3,李大磊1,张萌5,张亚州1,2,杜旭1,2,李嘉1,王万琼1   

  1. 1.中国科学院 新疆天文台,乌鲁木齐 830011
    2.中国科学院大学,北京 100049
    3.国家天文科学数据中心,北京 100101
    4.中国科学院 射电天文重点实验室,南京 210008
    5.曲阜师范大学 网络空间安全学院,山东 曲阜 273165
  • 收稿日期:2023-07-03 出版日期:2025-04-01 发布日期:2025-06-19
  • 通讯作者: 张海龙 E-mail:yexinchen@xao.ac.cn;zhanghailong@xao.ac.cn
  • 作者简介:冶鑫晨(1991-),男,博士研究生. 研究方向:天文大数据.E-mail: yexinchen@xao.ac.cn
  • 基金资助:
    国家重点研发计划项目(2021YFC2203502);国家重点研发计划项目(2022YFF0711502);国家自然科学基金项目(12173077);国家自然科学基金项目(12003062);中国科学院“西部之光”人才培养引进计划项目(xbzg-zdsys-202410);“天山英才培养”计划项目(2022TSYCCX0095);“天山英才培养”计划项目(2023TSYCCX0112);中国科学院科研仪器设备研制项目(PTYQ2022YZZD01);国家天文科学数据中心项目;中国科学院天文台站设备更新及重大仪器设备运行专项项目;新疆维吾尔自治区自然科学基金项目(2022D01A360)

EMD-LSTM-based group prediction algorithm of container resource load in preprocessing molecular spectral line data

Xin-chen YE1,2,3(),Hai-long ZHANG1,2,3,4(),Jie WANG1,3,Da-lei LI1,Meng ZHANG5,Ya-zhou ZHANG1,2,Xu DU1,2,Jia LI1,Wan-qiong WANG1   

  1. 1.Xinjiang Astronomical Observatory,Chinese Academy of Sciences,Urumqi 830011,China
    2.University of Chinese Academy of Sciences,Beijing 100049,China
    3.National Astronomical Data Center,Beijing 100101,China
    4.Key Laboratory of Radio Astronomy,Chinese Academy of Sciences,Nanjing 210008,China
    5.School of Cyber Science and Engineering,Qufu Normal University,Qufu 273165,China
  • Received:2023-07-03 Online:2025-04-01 Published:2025-06-19
  • Contact: Hai-long ZHANG E-mail:yexinchen@xao.ac.cn;zhanghailong@xao.ac.cn

摘要:

集群环境中容器资源分配不均衡是当前亟待解决的问题,针对容器负载预测及资源分配策略,本文设计了基于经验模态分解-长短期记忆网络的天文数据处理容器负载分组预测算法,提出了基于预测负载信息的自适应推荐值生成算法,可根据负载波动程度自动分配容器计算资源。利用模拟数据及真实天文观测数据进行了负载预测准确度验证,实验结果表明本文提出的算法相较于三重指数方法和单一长短期记忆网络模型具有更高的预测准确度。在天文数据实时预处理测试中,相较于默认策略,本文提出的推荐值生成算法可有效提升计算资源的使用效率。

关键词: 天文信息技术, 容器, 负载预测, 长短期记忆网络, 负载均衡

Abstract:

Unequal allocation of container resources in a cluster environment is currently a pressing issue. In response to container load prediction and resource allocation strategies, this paper proposes an empirical mode decomposition-long short-term memory (EMD-LSTM)-based algorithm for predicting container resource load groups in the preprocessing of astronomical data. An adaptive recommendation value generation algorithm based on load prediction information is introduced, which automatically allocates container computing resources according to the degree of load fluctuation. The accuracy of load prediction was verified using simulated data and real astronomical observation data. Experimental results demonstrate that the proposed algorithm outperforms the triple exponential smoothing method and a single LSTM network model in terms of prediction accuracy. In real-time preprocessing of astronomical data, compared to the default strategy, the recommended value generation algorithm proposed in this paper effectively improves the utilization efficiency of computing resources.

Key words: astroinformatics, container, load prediction, long short-term memory, load balancing

中图分类号: 

  • TP301.6

图1

VPA架构图"

图2

LSTM单元"

图3

EMD-LSTM分组预测算法架构"

表1

Python库信息"

编号库名称功能
1Numpy数据处理
2PyEMDEMD分解
3Keras构建LSTM预测模块

图4

重构后VPA架构图"

图5

模拟负载数据预测对比"

表2

预测信息与原始数据相关系数"

编号方法相关系数
1三重指数平滑0.988 59
2LSTM0.992 00
3基于LSTM的分组0.997 34

表3

节点硬件配置"

名 称信息
中央处理器Intel i9-10 900 K
内存64 GB
软件TEMPO2 2020.04.1
OSDebian 10.10.0
网络接口10 GbE
硬盘1 TB NVMe SSD

表4

NSRT甲醛分子巡天数据信息"

参数
望远镜NSRT
文件格式Fits
VEGAS终端模式MODE9
基带带宽450 MHz
量化精度8 bits

图6

CPU负载数据预测对比"

图7

内存负载数据预测对比"

表5

CPU负载预测信息与实际负载相关系数"

编号方法相关系数
1二重指数平滑0.819 87
2LSTM0.838 94
3基于EMD-LSTM的分组0.850 09

表6

内存负载预测信息与实际负载相关系数"

编号方法相关系数
1二重指数平滑0.604 30
2LSTM0.654 67
3基于EMD-LSTM的分组0.721 10

图8

CPU资源伸缩情况对比"

图9

内存资源伸缩情况对比"

[1] 陈红松, 陈京九. 基于统计的物联网分布式拒绝服务攻击检测[J]. 吉林大学学报: 工学版, 2020, 50(5): 1894-1904.
Chen Hong-song, Chen Jing-jiu. Statistical based distributed denial of service attack detection research in internet of things[J]. Journal of Jilin University (Engineering and Technology Edition), 2020, 50(5): 1894-1904.
[2] Morris D, Voutsinas S, Hambly N C, et al. Use of Docker for deployment and testing of astronomy software[J]. Astronomy and Computing, 2017, 20: 105-119.
[3] Molenaar G, Makhathini S, Girard J N, et al. Kliko—the scientific compute container format[J]. Astronomy and Computing, 2018, 25: 1-9.
[4] Herwig F, Andrassy R, Annau N, et al. Cyberhubs: virtual research environments for astronomy[J]. The Astrophysical Journal Supplement Series, 2018, 236(1): 2.
[5] Truyen E, van Landuyt D, Preuveneers D, et al. A comprehensive feature comparison study of open-source container orchestration frameworks[J]. Applied Sciences, 2019, 9(5): 931.
[6] Niu J R, Zhu W W, Zhang B, et al. FAST observations of an extremely active episode of FRB 20201124A. Ⅳ. Spin Period Search[J]. Research in Astronomy and Astrophysics, 2022, 22(12): No.124004.
[7] Wang Y B, Wen Z G, Yuen R, et al. The multiple images of the plasma lensing FRB[J]. Research in Astronomy and Astrophysics, 2022, 22(6): No. 065017.
[8] Chen Z H, You S P, Yu X H, et al. An RFI mitigation pipeline for CRAFTS multi-beam data based on signal cross-correlation function and sum threshold algorithm[J]. Research in Astronomy and Astrophysics, 2023, 23(5): No.055014.
[9] Dai V D, Kim Y H. Predictive approach for vertical autoscaling in Kubernetes[J]. Proceedings of the Korean Society of Telecommunications, Korean,2021: 896-897.
[10] Xie Y, Jin M, Zou Z, et al. Real-time prediction of docker container resource load based on a hybrid model of ARIMA and triple exponential smoothing[J]. IEEE Transactions on Cloud Computing, 2020, 10(2): 1386-1401.
[11] Rzadca K, Findeisen P, Swiderski J, et al. Autopilot: workload autoscaling at google[C]∥Proceedings of the Fifteenth European Conference on Computer Systems, Heraklion, Greece, 2020: 1-16.
[12] Shanmugam A S. Docker container reactive scalability and prediction of CPU utilization based on proactive modelling[D]. Dublin: National College of Ireland, 2017.
[13] Bandara K, Bergmeir C, Smyl S. Forecasting across time series databases using recurrent neural networks on groups of similar series: a clustering approach[J]. Expert Systems with Applications, 2020, 140: No.112896.
[14] 冯金巧, 杨兆升, 张林, 等. 一种自适应指数平滑动态预测模型[J]. 吉林大学学报: 工学版, 2007, 37(6): 1284-1287.
Feng Jin-qiao, Yang Zhao-sheng, Zhao Lin, et al. Adaptive exponential smoothing model for dynamic prediction[J]. Journal of Jilin University(Engineering and Technology Edition), 2007, 37(6): 1284-1287.
[1] 张海龙,杜旭,张萌,张亚州,王杰,冶鑫晨,王万琼,李嘉,吴涵,张婷. 基于Vitis HLS的FIR滤波器设计及其性能分析[J]. 吉林大学学报(工学版), 2025, 55(3): 1072-1081.
[2] 丁海兰,祁坤钰. 基于TextRank算法和相似度的中文文本主题句自动提取[J]. 吉林大学学报(工学版), 2025, 55(3): 1001-1008.
[3] 朱国庆,刘显成,田从祥. 基于长短期记忆网络的公共建筑短期能耗预测模型[J]. 吉林大学学报(工学版), 2024, 54(7): 2009-2014.
[4] 张海龙,张萌,张亚州,王杰,冶鑫晨,王万琼,李嘉,杜旭,张婷. 基于临界采样多相滤波器组的宽带信号信道化[J]. 吉林大学学报(工学版), 2023, 53(8): 2388-2394.
[5] 高金武,贾志桓,王向阳,邢浩. 基于PSO-LSTM的质子交换膜燃料电池退化趋势预测[J]. 吉林大学学报(工学版), 2022, 52(9): 2192-2202.
[6] 李先通,全威,王华,孙鹏程,安鹏进,满永兴. 基于时空特征深度学习模型的路径行程时间预测[J]. 吉林大学学报(工学版), 2022, 52(3): 557-563.
[7] 王学智,李清亮,李文辉. 融合迁移学习的土壤湿度预测时空模型[J]. 吉林大学学报(工学版), 2022, 52(3): 675-683.
[8] 张笑东,夏筱筠,吕海峰,公绪超,廉梦佳. 大数据网络并行计算环境中生理数据流动态负载均衡[J]. 吉林大学学报(工学版), 2020, 50(1): 247-254.
[9] 钱志鸿, 冯冬, 王雪, 厉茜. 基于负载均衡的M2M网络多径路由算法[J]. 吉林大学学报(工学版), 2016, 46(3): 934-940.
[10] 王继红,石文孝,尚硕,许银龙,李玉信,王春悦. 无线Mesh网络负载与干扰感知传输时间路由度量[J]. 吉林大学学报(工学版), 2015, 45(1): 297-303.
[11] 焦毅, 易克初, 马懋德, 马英红, 董旭. 基于服务质量感知的异构无线网络负载均衡算法[J]. 吉林大学学报(工学版), 2013, 43(03): 794-800.
[12] 石文孝, 张阁, 王继红, 赵颖. 基于网格的异构无线网络负载均衡算法[J]. 吉林大学学报(工学版), 2013, 43(03): 788-793.
[13] 王德民, 何立东, 刘菲菲, 苏男, 刘昕. 基于消息的加权负载均衡算法[J]. 吉林大学学报(工学版), 2012, 42(01): 140-144.
[14] 刘凤丹, 薛龙均, 李歆, 尹子振. 纳米门炭结构及超级电容特性[J]. 吉林大学学报(工学版), 2011, 41(增刊2): 327-330.
[15] 刘浩1,张连明2,朱同林3. 基于Cayley图的P2P覆盖网络模型[J]. 吉林大学学报(工学版), 2011, 41(05): 1414-1420.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 李寿涛, 李元春. 在未知环境下基于递阶模糊行为的移动机器人控制算法[J]. 吉林大学学报(工学版), 2005, 35(04): 391 -397 .
[2] 李红英;施伟光;甘树才 .

稀土六方Z型铁氧体Ba3-xLaxCo2Fe24O41的合成及电磁性能与吸波特性

[J]. 吉林大学学报(工学版), 2006, 36(06): 856 -0860 .
[3] 张全发,李明哲,孙刚,葛欣 . 板材多点成形时柔性压边与刚性压边方式的比较[J]. 吉林大学学报(工学版), 2007, 37(01): 25 -30 .
[4] 杨树凯,宋传学,安晓娟,蔡章林 . 用虚拟样机方法分析悬架衬套弹性对
整车转向特性的影响
[J]. 吉林大学学报(工学版), 2007, 37(05): 994 -0999 .
[5] 冯金巧;杨兆升;张林;董升 . 一种自适应指数平滑动态预测模型[J]. 吉林大学学报(工学版), 2007, 37(06): 1284 -1287 .
[6] 车翔玖,刘大有,王钲旋 .

两张NURBS曲面间G1光滑过渡曲面的构造

[J]. 吉林大学学报(工学版), 2007, 37(04): 838 -841 .
[7] 刘寒冰,焦玉玲,,梁春雨,秦卫军 . 无网格法中形函数对计算精度的影响[J]. 吉林大学学报(工学版), 2007, 37(03): 715 -0720 .
[8] .

吉林大学学报(工学版)2007年第4期目录

[J]. 吉林大学学报(工学版), 2007, 37(04): 0 .
[9] 李月英,刘勇兵,陈华 . 凸轮材料的表面强化及其摩擦学特性
[J]. 吉林大学学报(工学版), 2007, 37(05): 1064 -1068 .
[10] 冯浩,席建锋,矫成武 . 基于前视距离的路侧交通标志设置方法[J]. 吉林大学学报(工学版), 2007, 37(04): 782 -785 .