ESPnet: 端到端语音处理工具集

主要侧重于端到端语音识别和端到端的文本到语音转换。 ESPnet使用chainer和pytorch作为主要的深度学习引擎,并遵循Kaldi风格的数据处理,特征提取/格式和配方,为语音识别和其他语音处理实验提供完整的设置。