网络语音命令

问题描述:

我只是对这种情况感兴趣。假设您正在构建Web应用程序,并且希望接收语音命令并根据语音到文本的结果执行操作。网络语音命令

任何可能使这个杀手级应用的主要障碍?

+0

看看SALT和VoiceXML 2.0 – 2009-07-19 08:56:11

我能想到的第一件事情可能是音频传输的质量很大程度上取决于用户的上传带宽。带宽越少,质量越差,语音到文本算法能够检测到的内容越少。

低采样音频可用于s2t算法。我的问题:

  1. 获取音频到服务器并处理它(Flash或Java或东西)
  2. 让客户端轮询所需的行动
  3. 使这一可扩展的后端
  4. 与处理范围广泛互联网支持的语言,方言,变形和重音
  5. 确保它是无阻碍并且可用的回退可用
  6. 投诉从可用性的人打交道

有万吨以上的IM肯定,但除此之外,去了。

我们将在哪里无人去“我们要去月球”然后这样做。去吧...

如果它尚未完成,如果你失败或成功,那么你可能会学到一些很酷的东西。