开年特献!使用Aspose.PDF在.NET中以编程方式将PDF转换为Excel完整指南

PDF到Excel的转换是当今的一种常见做法,特别是当你需要需要将表格数据从PDF文档导出到Excel电子表格时。在处理大量文档时,手动将数据从PDF复制/导出到Excel可能是一项耗时的工作。那么,为什么不自动化该过程并最大程度地减少时间和精力呢?

接下来,我们将学习如何使用Aspose.PDF在.NET中使用C#以编程方式将PDF转换为Excel常用格式。很高兴的是,Aspose.PDF已经迎来2020第一次更新,增强了多项功能,如果你还没有升级Aspose.PDF最新版测试,可以点击这里下载

在本文中,我们将使用Aspose.PDF在C#中执行以下PDF到Excel的转换:

  • 将PDF转换为XLS格式。
  • 将PDF转换为XLSX格式。
  • 在转换后的Excel工作表中插入空白的第一列。
  • 最小化转换后的Excel电子表格中的工作表数量。

①在C#中将PDF转换为XLS

为了将PDF文档转换为XLS电子表格,可以简单地加载PDF文件并以“ .xls”扩展名保存。下面的代码示例演示如何使用C#将PDF转换为XLS格式的Excel。

// Load PDF document
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions(); 
// Save output file
pdfDocument.Save("Excel.xls", options);

PDF文件

开年特献!使用Aspose.PDF在.NET中以编程方式将PDF转换为Excel完整指南

转换后的Excel文档

开年特献!使用Aspose.PDF在.NET中以编程方式将PDF转换为Excel完整指南

②在C#中将PDF转换为XLSX

默认情况下,Aspose.PDF将PDF文档转换为XLS格式。如果要获取转换后的XLSX格式的Excel电子表格,则可以使用ExcelSaveOptions类进行指定。下面的代码示例演示如何使用C#将PDF文档转换为XLSX格式的Excel。

// Load PDF document
Document pdfDocument = new Document("sampletable.pdf");
// Initialize ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Set output format
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Save output file
pdfDocument.Save("Excel.xlsx", options);

③使用空白的第一列将PDF转换为Excel

我们也可以在转换后的Excel电子表格中插入空白的第一列。可以使用ExcelSaveOptions.InsertBlankColumnAtFirst选项完成此操作,如以下代码示例所示。

// Load PDF document
Document pdfDocument = new Document("sampletable.pdf");
// Initialize ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Set output format
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// To insert blank column as first column to the Worksheet 
options.InsertBlankColumnAtFirst = true;
// Save output file
pdfDocument.Save("Excel.xlsx", options);

④以最少的工作表数量将PDF转换为Excel

默认情况下,输入PDF文档中的每个页面都将转换为单独的工作表。对于具有许多页面的大型PDF文档,转换后的Excel电子表格还将包含许多工作表。在这种情况下,我们可以使用ExcelSaveOptions.MinimizeTheNumberOfWorksheets选项自定义PDF到Excel的转换,并最小化转换后的电子表格中的工作表数。

下面的代码示例演示如何使用C#将PDF到Excel转换中的工作表数量减少到最少:

// Load PDF document
Document pdfDocument = new Document("sampletable.pdf");
// Initialize ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Set output format
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Minimize number of Worksheets
options.MinimizeTheNumberOfWorksheets = true;
// Save output file
pdfDocument.Save("Excel.xlsx", options);