吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (1): 65-76.
蔡泽宇, 刘远兴, 李文炽, 吴湘宁, 杨 翼, 胡远江
CAI Zeyu, LIU Yuanxing, LI Wenzhi, WU Xiangning, YANG Yi, HU Yuanjiang
摘要:
针对无人机航拍具有多角度、 大视角、 大规模场景的特点, 使无人机航拍图像存在小目标对象较多、背景复杂和特征提取困难的问题, 提出了一种新的模型 CA-NWD-YOLOv5 ( Coordinate Attention-NormalizedWasserstein Distance-You Only Look Once v5)。 该模型以 YOLOv5 模型为基础, 在头部网络添加了多尺度检测层以提取小目标特征, 同时在骨干网络加入了 CA 注意力机制, 避免模型忽略目标的位置信息。 最后, 使用归一化 Wasserstein 距离损失函数代替基于交并比的损失函数, 加强了模型对微小目标的敏感程度。 在VisDrone2019数据集上的实验表明, 相比改进前的 YOLOv5 模型, CA-NWD-YOLOv5 模型可有效提升无人机航拍图像中小目标的检测精度, 改进后算法的 mAP_0. 5 达到了 50% , 可以有效应用于航拍小目标的检测。
中图分类号: