吉林大学学报(信息科学版) ›› 2023, Vol. 41 ›› Issue (2): 381-386.
• • 上一篇
冯 伟, 姜远飞
FENG Wei, JIANG Yuanfei
摘要: 为解决高性能集群监控管理中, 系统异常监测受时间、 地点限制, 集群管理员无法及时发现集群异常 从而影响集群系统正常运行等问题, 利用企业微信的开放功能和消息传送机制, 结合 Linux(GNU/ Linux)操作 系统集群监控管理方法, 开发了适合中小型集群的简单易用, 并极易扩展的集群监控管理系统, 实现了手机端 预警信息呈现功能。 阐述了系统需求、 系统框架和功能设计、 技术框架和数据流, 以及系统部署与开发实现的 具体过程。 目前系统已开发完毕, 应用于吉林大学原子与分子物理研究所的日常集群管理中。 集群管理员和 用户可以在不登录集群节点的情况下, 通过手机端 APP(Application)监控到集群系统的软硬件性能和作业完成 状态, 便于及时进行后续处理工作。 尤其在疫情期间, 居家办公, 集群访问不便捷的情况下, 该功能的实施 辅助了吉林大学原子与分子物理研究所科研工作的高效进行。
中图分类号: