快速入手光学字符识别控件Aspose.OCR!学会使用C#以编程方式对图像执行OCR

OCR(光学字符识别)是一种众所周知的技术,可以从图像和扫描的文档中识别和读取文本。在OCR操作中,图像上的字符被扫描,识别并转换为数字形式。可以验证转换后的文本并保存以执行进一步的操作。

在本文中,我将向您展示如何在.NET应用程序中使用C#以编程方式对图像执行OCR。本文的其余部分分为以下几节。

  • 使用C#对图像执行OCR
  • 对具有单行文本的图像执行OCR

目前,.NET版Aspose.OCR升级到v20.4版,使用CPU / GPU改善了性能,调整了新的文本搜索方法,感兴趣的朋友可点击下载

使用C#对图像执行OCR

让我们看看如何在可能是扫描文档页面的图像上执行OCR。以下是执行此操作的步骤。

  • 创建一个AsposeOcr类的实例。
  • 通过传递图像的路径并将结果获取到字符串对象中,以调用AsposeOcr.RecognizeImage(string)方法。

下面的代码示例演示如何使用C#对图像执行OCR。

// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();

// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();

// Recognize image
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// Display the recognized text
Console.WriteLine(result);

用单行文字在图像上执行OCR

在前面的示例中,我们对包含多行文本的图像执行了OCR。但是,图像可能仅包含一行文本。在这种情况下,您可以告诉API仅识别该行。以下是对包含一行的图像执行OCR的步骤。

  • 创建一个AsposeOcr类的对象。
  • 调用AsposeOcr.RecognizeLine(string)方法,并将图像文件的路径传递给它。
  • 将结果放入字符串对象。

下面的代码示例演示如何使用C#在包含一行文本的图像上执行OCR。

// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();

// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();

// Recognize image
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Display the recognized text
Console.WriteLine(result);

对非英语字符执行OCR

Aspose.OCR不限制英语的OCR功能,可以识别其他语言的字符。无论文本使用哪种语言,识别过程和代码都将保持不变。以下是Aspose的OCR API可以识别的字符集。

快速入手光学字符识别控件Aspose.OCR!学会使用C#以编程方式对图像执行OCR


如果您有任何疑问或需求,请随时加入Aspose技术交流群(642018183),我们很高兴为您提供查询和咨询。