ASR结果评测软件:NIST sclite的编译、安装与用法介绍

ASR结果评测软件:NIST sclite的编译、安装与用法介绍

NIST sclite介绍

sclite介绍网站:
http://www1.icsi.berkeley.edu/Speech/docs/sctk-1.2/sclite.htm#sclite_name_0

下载

下载网站:
https://www.nist.gov/itl/iad/mig/tools
Speech Recognition Scoring Toolkit (SCTK); includes the SCLITE, ASCLITE, tranfilt, hubscr, SLATreport and utf_filt scoring tools).

下载文件名为:sctk-2.4.10-20151007-1312Z.tar.bz2的文件。
在linux下:tar –xf sctk-2.4.10-20151007-1312Z.tar.bz2解压到当前目录。

编译安装

cd 到sctk目录打开INSTALL文件,按照其内容编译安装,大概内容:
make config
make all
make check
make install
make doc

默认所有生成的可执行文件都放在sctk的bin目录里面。这个安装路径可以在config阶段的profix进行修改指定到其他的目录。如果需要shell终端识别,可以把bin目录的路径加到linux的PATH环境变量里面(去Linux PATH 设置页面)

用法

sclite -r reffile [ fmt ] -h hypfile [ fmt [ title ] ] OPTIONS
详细参数介绍请参考(去sclite options页面)

用例:

假设当前目录是sctk/bin:
reffile.trn的内容为:
今天是晴天(test.wav)
周末去干什么(test1.wav)
hypfile.trn的内容为:
今天四晴天(test.wav)
周末去干什么(test1.wav)
./sclite -i wsj -r reffile.trn -h hypfile.trn -e gb -o all -O tmp/
-e用来指定字符编码,gb代表汉字编码 注意在处理中文时格外注意两个文件的编码格式必须是gb2312,两者一定要相同

./sclite -i wsj -r reffile.trn -h hypfile.trn -e gb -o all -O tmp/ -c NOASCII
需要特别注意-c选项 如果需要字级别的统计汉字需要加上 -c NOASCII
执行结果:
sclite: 2.10 TK Version 1.3
Begin alignment of Ref File: ‘reffile.trn’ and Hyp File: ‘hypfile.trn’
Alignment# 2 for speaker tes

Writing scoring report to 'tmp//hypfile.trn.sys'
Writing raw scoring report to 'tmp//hypfile.trn.raw'
Writing string alignments to 'tmp//hypfile.trn.pra'

Successful Completion

用vi打开tmp/hypfile.trn.sys

ASR结果评测软件:NIST sclite的编译、安装与用法介绍