摘要:手和工具的交互是区分车间人员作业行为的关键信息。 为防止泵件装配工序错漏,达到实时监测的目的,提出基于空 间特征融合的车间作业工具检测算法。 首先,为了提高对目标的定位能力和检测精度,基于帧差法分割前景中的手部运动区 域,获得具有运动空间特征的纹理图像,结合装配过程的 RGB 图像构成目标检测网络的双通道输入。 设计空间感知模块实现 双通道输入的空间特征融合,获得全局空间信息。 利用特征增强模块融合全局空间信息和深层语义信息,加强显著位置的特征 响应。 然后,采用 ESNet(enhance shuffleNet)重构主干网络,基于深度可分离卷积实现多尺度特征提取,提高检测速度。 最后, 针对图像背景中局部元素变化问题,采用 CutOut 数据增强方法,提高模型抗干扰能力。 实验结果表明,本文所提算法有效降低 了误检率,较传统 YOLOv5s 的 mAP 提高 6. 4%,能够快速准确检测车间人员作业时使用的工具。