Tesseract-OCR入门使用（3）-VS2010编译源码

本系列简单介绍Tesseract-OCR 3.x版本如何上手使用，只适用于入门级别。

1.源码获取

2.编译

3.测试

1.源码获取

1.1获取tesseract-ocr源码

在github中可以根据需要选择不同的版本

Tesseract-OCR入门使用（3）-VS2010编译源码

1.2因为Tesseract依赖Leptonica库，所以还需要编译Leptonica

2.编译

2.1编译Leptonica

step1 将压缩包解压并移动位置如下图

Tesseract-OCR入门使用（3）-VS2010编译源码

step2 在vs2008中找到工程并使用vs2010打开工程

step3 编译

分别对Release和Debug进行编译，一次成功。

2.2编译tesseract-ocr

step1 在vs2008文件夹中找到工程

Tesseract-OCR入门使用（3）-VS2010编译源码

step2 用vs2010转换项目后报错误

错误 1 error C1083: 无法打开包括文件:“allheaders.h”: No such file or directory

这是因为allheaders.h在Leptonica中，而两个工程目录没有协调导致。

解决方法：

调整目录如下图

Tesseract-OCR入门使用（3）-VS2010编译源码

step3 调整目录后重新编译，报错

错误 2 error C2146: 语法错误: 缺少“}”(在标识符“銆”的前面)

这是错误由于文件编码格式引起的。

解决方法：

选择vs2010的菜单“文件 -- 高级保存选项”，在窗口中选择“简体中文（gb2312）-代码页936”，保存后重新编译。

终于成功

Tesseract-OCR入门使用（3）-VS2010编译源码

3.测试

Tesseract-OCR入门使用（3）-VS2010编译源码

参考资料：