.NET中的语音识别

问题描述:

如何在.NET中实现语音识别?.NET中的语音识别

我有一堆.mp3与计算机生成的声音相对较高的质量。在每个.mp3声音说一些随机文本,然后在英语中的6-7位数字序列。我想提取这些数字作为文本。

是否有可能在.NET中实现这样的事情?

您可以使用微软的语音到文本引擎。其易于使用的

有些样品here

您可以使用Microsoft SAPI SDK:
http://www.microsoft.com/downloads/details.aspx?FamilyID=5e86ec97-40a7-453f-b0ee-6583171b4530&DisplayLang=en
查核在SAPI SDK的C#示例。

这里有一个链接到the System.Speech.Recognition namespace,可以帮助你。

+0

是的,这是最好的方法。自3.0版以来,语音识别/ TTS已成为.NET BCL的一部分。 – Noldorin

使用语音识别时,最好的办法是在Windows Vista或Windows 7中工作,因为他们有Microsoft SAPI(Speech API)5.3(并且很快会有5.4),并且与SAPI 5.1相比,性能有很大的不同从Windows XP。

现在,here你有一个视频和源代码(用C++编写,但你可以将它传递给另一种语言)的应用程序,几乎做你想做的。

为了更好地识别单词,他们用他们想识别的单词创建一个语法文件。你可以看到这个视频,你会发现,制作你想要的东西会很容易。

祝你好运!