语音信号处理之采样,量化和混叠

连续的模拟语音信号进行数字化预处理包括采样,量化等
采样:将时间上连续的信号变成时间上离散的信号
量化:将幅度上连续的信号变成离散的信号
采样要符合采样定律,即采样频率要大于信号频率的2倍,采样过程才不会丢失信息,且由采样信号可精确的重构原信号。
量化就是将语音信号的幅度值分割为有限区间,落入同一区间的信号赋予相同的值。

预处理还包括反混叠滤波,预加重等。
混叠
当采样频率设置不合理时,即采样频率低于2倍的信号频率时,会导致原本的高频信号被采样成低频信号。如下图所示,红色信号是原始的高频信号,但是由于采样频率不满足采样定理的要求,导致实际采样点如图中蓝色实心点所示,将这些蓝色实际采样点连成曲线,可以明显地看出这是一个低频信号。在图示的时间长度内,原始红色信号有18个周期,但采样后的蓝色信号只有2个周期。也就是采样后的信号频率成分为原始信号频率成分的1/9,这就是所谓的混叠:高频混叠成低频了。
语音信号处理之采样,量化和混叠
对连续信号进行等时间采样时,如果采样频率不满足采样定理,采样后的信号频率就会发生混叠,即高于奈奎斯特频率(采样频率的一半)的频率成分将被重构成低于奈奎斯特频率的信号。这种频谱的重叠导致的失真称为混叠,也就是高频信号被混叠成了低频信号。

信号带宽不明确时,采样前应先接入反混叠滤波(低通滤波),将信号带宽限制在一定的范围内,否则,不满足采样定理将产生频谱混叠,信号中的高频成分将失真。

参考:
https://zhuanlan.zhihu.com/p/23923059