摘要:为了实现机器人语音控制,并避免环境噪音的干扰,研究提出了基于Mel频率倒谱系数特征提取和深度神经网络的机器人语音控制指令识别方法。实验结果显示,相较于其他语音增强方法,基于深度神经网络和谐波增强技术的语音增强方法分段信噪比和语音质量感观评价均更高。同时相比于其他特征,研究提出的基于改进Mel频率倒谱系数特征能显著降低语音识别的字错误率,通过辅以改进深度神经网络-隐马尔科夫模型能进一步降低字错误率。在20dB条件下,该特征和改进深度神经网络-隐马尔科夫模型的平均字错误率分别为24.9%和22.1%,均低于其他方法。上述结果表明,研究提出的语音识别方法能实现带噪声语音的准确识别,提高机器人的语音控制指令识别能力。