【机器视觉】tesseract基本使用
1.1tesseract
1.1.1基础知识
主要用来文字图片的识别,验证码的识别等。就是将图像翻译成文字,也就是文字识别,是由googl公司推出的
使用方式
- 百度搜索:tesseract,下载该软件,安装
- 设置该软件的环境变量
- 在含有想要识别的文件中打开cmd,使用命令tesserct 图片名.png 文本文件名
- 如果想要识别中文数据,我们可以通过更改训练数据的包来更改。首先,在tesseract中找到目录tessdata,将该数据集中的eng.traineddata文件替换成我们从网上下载的训练集,名字要和原来的文件的名字一样。
1.1.2tesseract使用案例
需要识别的图片
执行的命令
- tesseract meiwen.png meiwen
识别出的文本
1.2pytesseract库
1.2.1基础知识
如果上述可以成功完成,我们就可以使用代码实现验证码的自动化识别了,首先安装:pip3.6 install pytesseract,然后进行下列代码操作。如果遇到没有找到pytesseract的错误,我们可以重启pycharm解决(原因:你虽然设置了环境变量,但是pycharm并不知道你已经设置了。必须重启pycharm重新加载环境变量。)
- driver.save_screenshot('./poem.png') # 将浏览器对象保存在该路径下
- image=Image.open('./poem.png') # 打开该路径下的图片文件
- result = pytesseract.image_to_data(image) # 解析该图片的信息
- result = pytesseract.image_to_string(image) # 识别该图片的文本内容
- image.show() # 展示打开的图片文件
- driver=webdriver.Chrome(default='python解释器路径') # 创建Chrome对象
- code=driver.page_source # 页面源码获取到的是页面源码