亚马逊云计算平台------AWS(四)语音转文本服务Transcribe-----控制台操作

AWS————Transcribe

AWS Transcribe 服务于利用机器学习来识别语音文件中的声音,然后将其转化为文本。目前支持英语和西班牙文语音。必须将语音文件保存在S3中,输出结果也会被保存在S3中。

  • 输入声音文件,支持 flac、mp3、mp4 和 wav 文件格式。长度不能超过2小时。
  • 指定语言。

几个特色功能:

  • 发音者识别(speaker identification):Transcribe 能区别一个语音文件中的多个说话者。支持2到10个发音者。
  • 支持多声道(channel identification): 如果声音文件中有多声道,那么
  • 支持字典(vocabulary):比如不能识别的单词,特定领域不常用的单词

 AWS————控制台操作步骤

 1. 登录自己的AWS账号进入到aws控制管理台, 然后搜索 Transcribe 进入到这个管理后台

亚马逊云计算平台------AWS(四)语音转文本服务Transcribe-----控制台操作

2. 点击 Create job  按钮就可以使用AWS的语音转文本服务

   主要要添加几个基本的参数, 参数根据英语单词进行添加,也就不一一解释了。

    特意说明:Custom vocabulary - optional  这个参数如果不了解直接不用填,下一节将会说明如何 创建自己的词库来语音转换

 亚马逊云计算平台------AWS(四)语音转文本服务Transcribe-----控制台操作

3. 创建成功后,就会生成对mp3音频的文本文件