用Python轻松进行图像文本识别!

最近,办公室的同事小李在整理一份报告,很多材料的电子版找不到了,都是纸质版的,纸质版上的许多文字需要他一一录入!

 

看到他字打得飞快,满头大汗的,但仍然还有许多没弄完,真让人心疼。于是,我快速用Python写了一个图像文本识别程序,提取速度不仅快,而且非常准确,识别出来后,只需要他稍微进行核对和少量的改动就好了,非常方便!

 

怎么用Python实现一个图像文本识别程序呢?让我们一起来看看。

 

下面,我将介绍如何用Python轻松进行图像文本识别,希望大家能够受到启发,用Python玩转出属于自己的图像文本识别程序!

 

用Python进行图像文本识别,主要有3步。

 

第一步:图像库安装,然后导入相应的库文件包。

 

(1)安装图像库PIL,可用pip install PIL;安装图像文本识别库pytesseract,可用pip install pytesseract,或先下载pytesseract然后安装。

 

(2)用import导入相应的库文件包。

 

用Python轻松进行图像文本识别!

 

第二步:进行图像文本识别。

 

(1)用Image包的open()函数打开要进行图像文本识别的文件。

 

(2)用pytesseract包的image_to_string()函数进行图像文本识别。

 

用Python轻松进行图像文本识别!

 

第三步:保存识别的文本内容。

 

(1)用文件操作的open()函数打开保存路径。

 

(2)用文件操作的write()函数写入识别出的文本内容。

 

(3)用文件操作的close()函数关闭文件。

 

用Python轻松进行图像文本识别!

 

以上就是用Python进行图像文本识别的方法,下面给出具体的代码,供大家交流!

 

用Python轻松进行图像文本识别!

 

最终识别的效果是下面的样子,小伙伴们,动手试试吧!

 

用Python轻松进行图像文本识别!