WordML转换为PDF转换

问题描述:

我们收到的wordml文档基本上是由msword文档生成的XML文件,其中也包含所有格式化说明。现在我们有要求将这些文件转换为PDF。我看着iText xmlworker来做这个转换。它所做的只是删除了所有的XML标签,并将所有内容作为PDF中的单个段落提供给我,并且没有格式化。WordML转换为PDF转换

如何确保生成的PDF包含正确格式的文本从这个wordml文档。

+0

你能够从wordml文件中提取文本吗? –

iText的产品XMLWorker需要您手动处理每个XML元素(除非您有HTML作为输入)。 MS Word文档的XML模式非常复杂,所以你需要花费几年的时间才能获得一些看起来甚至远远好的东西。简而言之,XMLWorker不会做你认为它的工作。

如果你想MS Word到PDF转换,你需要另一种解决方案。 XDocReport(MIT许可证)就是其中之一,它具有iText 2(LGPL许可证)和iText 5(AGPL许可证)的插件。结果虽然不完美。