Python验证码识别tesseract-ocr安装,报错解决
Tesseract-OCR是一款关于中文的识别,并且是开源的,识别效果比较好的软件包。
接下来给大家介绍Python验证码识别tesseract-ocr安装,报错解决。
工具/原料
-
tesseract-ocr
方法/步骤
-
1
首先需要下载tesseract-ocr
以下是下载地址
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe
下载好后,双击tesseract-ocr-setup-4.00.00dev.exe安装,弹出欢迎界面,如下图所示
-
2
第二步,勾选【同意协议】,点击【next】即可
-
3
选择安装用户,选择勾选【全部用户】
-
4
选择安装功能,其他的默认即可,但是一定要选择这个语言包哦,这个语言包就是简体中文
-
5
选好安装目录后,点击【next】下一步
-
6
默认的点击下一步【next】,下一步【next】进行安装即可
-
7
安装完成后,点击下一步【next】即可,点击【finish】完成即可
-
8
最后一步,如果报错信息如下图所示,怎么办?
其实百度搜索有很多的解决方案,小编想说的是,小编亲自实践解决的一种方法,希望能有所帮助。
text = pytesseract.image_to_string(Image.open('C:\\Users\\123.png'), lang='chi_sim', config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')
在使用的时候,加上以下这段即可
config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'