用Python轻松进行图像文本识别!
最近,办公室的同事小李在整理一份报告,很多材料的电子版找不到了,都是纸质版的,纸质版上的许多文字需要他一一录入!
看到他字打得飞快,满头大汗的,但仍然还有许多没弄完,真让人心疼。于是,我快速用Python写了一个图像文本识别程序,提取速度不仅快,而且非常准确,识别出来后,只需要他稍微进行核对和少量的改动就好了,非常方便!
怎么用Python实现一个图像文本识别程序呢?让我们一起来看看。
下面,我将介绍如何用Python轻松进行图像文本识别,希望大家能够受到启发,用Python玩转出属于自己的图像文本识别程序!
用Python进行图像文本识别,主要有3步。
第一步:图像库安装,然后导入相应的库文件包。
(1)安装图像库PIL,可用pip install PIL;安装图像文本识别库pytesseract,可用pip install pytesseract,或先下载pytesseract然后安装。
(2)用import导入相应的库文件包。
第二步:进行图像文本识别。
(1)用Image包的open()函数打开要进行图像文本识别的文件。
(2)用pytesseract包的image_to_string()函数进行图像文本识别。
第三步:保存识别的文本内容。
(1)用文件操作的open()函数打开保存路径。
(2)用文件操作的write()函数写入识别出的文本内容。
(3)用文件操作的close()函数关闭文件。
以上就是用Python进行图像文本识别的方法,下面给出具体的代码,供大家交流!
最终识别的效果是下面的样子,小伙伴们,动手试试吧!