摘要:连续动态手语动作包含丰富的空间信息(如手部形状、位置)和时间信息(如动作顺序、速度),导致空间和时间特征的冗余度较高,降低了手语识别的准确性。因此,提出基于SlowFast网络的视频连续动态手语识别算法。通过双相机立体视觉系统拍摄手语视频并校正图像,利用优化排序的Hough梯度法检测关节点特征。采用基于仿射变换的马氏距离算法匹配立体对应点,应用金字塔光流的动态线性模型法实现关节点的连续跟踪。设计强化版SlowFast网络架构,通过双路径分别捕捉手语视频的空间语义和时间动态特征,并融合时空信息。利用注意力机制和关键帧提取方法,结合改进的损失函数,完成连续手语的动态识别。SlowFast网络通过独特的双路径架构和时间-空间特征提取能力,可以有效解决时间-空间特征冗余度较高的问题。实验结果表明,基于SlowFast网络的方法在平均端点误差(EPE mean)测试中表现最佳,误差较低,同时其时间-空间特征冗余度最高不超过0.50,在视频连续动态手语识别中展现出更高的准确性和稳定性。