摘要:
针对传统安全管理主要依赖人工监控与事后处理、效率低下且难以及时发现异常行为的问题, 设计了一套多模态智能安全管理系统。该系统主体由基于华为 Atlas 200I DK A2 开发套件运行的视觉识别算法、基于单片机的语音报警装置及配套软件构成。通过视觉处理算法与音频关键词检测实现行为智能识别, 当发生危险情况时, 可经软件自动将信息及时反馈给管理人员, 有效保障现场人身安全。针对视觉算法部分, 通过优化 YOLOv5(You Only Look Once version 5)网络结构, 引入 CA(Coordinate Attention)注意力机制以增强对小目标与复杂场景的检测能力, 并修改损失函数, 添加对 EIoU(Efficient IoU)损失函数的支持, 使模型更好地适应场景变化, 从而实现对打架与摔倒行为的高效识别。实验结果表明, 本方法在多种场景下的平均精度均值(mAP@ 0. 5)均有明显提升, 检测速度满足实时性要求, 可为公共场所的安全管理提供智能化解决方案。
中图分类号:
陈 冲, 朱晓旭, 万林葳, 付凯宇, 黄自彬, 王文雅, 车浩源.
融合深度学习技术的多模态安全管理应用
[J]. 吉林大学学报(信息科学版), 2025, 43(6): 1430-1440.
CHEN Chong, ZHU Xiaoxu, WAN Linwei, FU Kaiyu, HUANG Zibin, WANG Wenya, CHE Haoyuan.
Application of Multimodal Security Management Integrating Deep Learning Technology
[J]. Journal of Jilin University (Information Science Edition), 2025, 43(6): 1430-1440.