Mel频率倒谱系数如何工作?

问题描述:

我媒体链接有FFT和音高+在从麦克风输入的实时计算的绝对频率。 现在我想计算音色。Mel频率倒谱系数如何工作?

我看到梅尔频率倒谱系数 - 的MFCC,但我不明白它非常好。 有人可以给我一些提示,在这个..

的MFCC结合人的听觉方面的考虑(对数频率感知的mel scale)和乐器的物理学(这些系统通常具有明确定义的色彩是harmonic - 这是为什么MFCC使用FFT的FFT),给出了仪器的音色(其中基本频率和响度被分解出来)的简化表示。

,可以写上这个话题无休止的网页,并有许多可用在网络上,让您明明白白想知道将是有益的,如何解释一个更具体的问题。计算MFCC的算法列在wikipedia page的顶部。

+0

TKS的答案。 所以,如果我想获得音色,MFCC是正确的方式? – 2009-10-25 18:30:39

+1

是的,我认为是这样,特别是作为对这个问题的第一次攻击。它很容易实现,有很多关于它的书面文章,这是一个与其他方法进行比较的标准(并且在这些比较中它通常很好),所以这是一个不错的选择。 – tom10 2009-10-25 18:58:33

+0

在维基该算法是: 1.使傅立叶变换的信号(的窗口化摘录)的。 2.使用三角形重叠窗口将上面获得的谱图的能量映射到梅尔尺度上。 3.记录每个mel频率的功率记录。 4.对梅尔日志能量列表进行离散余弦变换,就好像它是一个信号。 5. MFCC是结果频谱的幅度。 我明白了一切,但第2步:使用三角形重叠窗口 我应该怎么做,通过频率梅尔规模,但是这是什么三角形重叠窗口? – 2009-10-25 20:53:29