首页 > 系统教程语音识别实验报告

语音识别实验报告

系统教程190 更新时间：2024-07-06 18:47:19

2024年6月5日发(作者：)

文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.

语音识别实验报告

篇一：语音识别报告

“启动”的时域波形

1、语音预加重：

由于语音信号在高频部分衰减，在进行频谱分析时，频

率越高，所占的成分越小，进行语音预加重，可以提升语音

高频部分，使频谱变得平坦，以方便进行频谱的分析和处理。

通常的措施是采用数字滤波器进行预加重，传递函数是：

H(z)?1??z?1，其中?一般去0.92-0.98之间，所以在计算的

时候取0.9375。

预加重后的波形

2、分帧加窗

语音信号具有较强的时变特性，其特性是随时间变化的，

但是语音的形成过程与发音器官的运动有关，这种物理运动

比起声音振动的速度十分缓慢，在较短的时间内，语音信号

的特征可以被认为是保持不变的，通常对语音处理是通过截

取语音中的一段进行处理的，并且短段之间彼此经常有一些

叠加，这一段语音成为一帧语音，语音段的长度称为帧长，

对每一帧处理的结果可用一组数来表示。一般取帧长为10

—30ms。采样频率是8000Hz，所以取的帧长是256，帧移是

178。分帧之后加汉明窗。

3、端点检测

1文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.

文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.

端点检测从背景噪声中找出语音的开始和终止点。

短时能量就是每帧语音信号振幅的平方和。

En??[s(m)]；

m?0N?1

短时能量曲线

短时过零率是每帧内信号通过零点的次数，是信号采样

点符号的变化次数。

1N?1

Zn??sgn[x(m)]?sgn[x(m?1)]；

2m?0

“启动”的过零率曲线

在实验室的安静的环境下，依靠短时能量和短时过零率

就可进行语音信号的起止点判断。当背景噪声较小时，没有

语音信号的噪声能量很小，而语音信号的短时能量增大到了

一定数值，可以区分语音信号的开始点和终止点。当背景噪

声较大时，可以用短时平均过零率和短时能量结合来判断。

基于能量一过零率的端点检测一般使用两级判决法，

在开始进行端点检测之前，首先为短时能量和过零率分别确

定两个门限。整个语音信号的端点检测可以分为四段：静音、

过渡音、语音段、结束时的静音段，

（1）如果能量或过零率超越了低门限，就应该开始标

记起点，进入过渡段。在过渡段中，由于参数的数值比较小，

2文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.

本文发布于:2024-06-05，感谢您对本站的认可！

本文链接:http://www.fzithome.com/xitong/1717598074a660605.html

版权声明:本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。

语音信号进行

发布评论取消回复

评论列表（有0条评论）