Tesseract3.05.01dev Windows10 安装记录
1、下载exe文件:
http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.00dev.exe
2、下载需要的字库文件,注意对应的版本
https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
3、安装下载好的exe文件,选择默认安装 C:\Program Files (x86)\Tesseract-OCR
4、把下载好的字库文件复制到C:\Program Files (x86)\Tesseract-OCR\tessdata 下
5、设置环境变量,非常重要
1)系统环境变量中,Path添加“ C:\Program Files (x86)\Tesseract-OCR ”
2)系统环境变量中,添加变量“ TESSDATA_PREFIX ”,变量值为“ C:\Program Files (x86)\Tesseract-OCR\tessdata ”,如下图
6、系统重启,或者在打开终端(cmd 或 PoerShell)的情况下,重启终端。
7、打开cmd,输入:tesseract -v, 结果如下图
8、命令
tesseract [xxx.jpg] [result.txt | stdout] [-l eng | chi_sim]
9、其他
1)在PowerShell 和 cmd 运行命令有些不同,因为PowerShell对命令要求拼写更严格一些;
2)如果要输出到文件result.txt中,需要以管理员身份运行cmd,否则不会生成result.txt文件;
3)最后指定字库的时候,只要字库的前缀,例如eng.traineddata ,只输入并且只能输入eng
10、至此,可以在任意盘下,任意目录下使用tesseract。