作为最终结果创建ODT和PDF文件

问题描述:

我一直致力于创建各种文档格式的应用程序,而且我的成功有限。作为最终结果创建ODT和PDF文件

理想情况下,我想动态创建一个相当简单的ODT/PDF/DOC文件。我一直关注ODT,因为它是可编辑的,并且足够开放,以至于有几种工具可以将它转换为我需要的任何其他格式。

问题是ODT XML文件不简单,并且没有任何可以找到的优质API(特别是在python中)。到目前为止,我已经成功创建了一个模板ODT文件,然后根据需要在Python中操作DOM。这通常是可以的,但是很快就会变得不够充分,并且每次需要调整其中一个模板时都需要进行太多的调整。

的要求是:

1)制作一个简单的文档,将有列表,段落,并在页面上绘制简单图形的能力(矩形,圆形,等...)

2 )到指定页面大小一般应打印完全相同的输出能力,以及不同格式时,发送到打印机

我的问题:

1)是否有我可以产生ODT/PDF/DOC任何其他方式文件?

2)乳胶可以接受吗?我从来没有真正使用它,有没有人有经验转换成其他格式的LaTeX文件?

3)可以使用HTML吗?网上有很多转换器。从技术上讲,你可以指定以mm/cm为单位的尺寸等,但我担心浏览器/转换器之间的打印输出会有所不同......

任何其他想法?

我想成功,你必须定义你想如何输入一切。你为什么不使用openoffice?它会保存到ODT(PDF文件),PDF和HTML(虽然它不是干净的HTML,但实际上很难看)。

在我最近的经验中,我已经从latex - > xhtml通过LaTeXML(我必须从源代码编译)成功。 LaTeX看起来越来越像终端格式。这对于PDF来说很棒,但是一旦你需要一些灵活性,它就会失败。我还应该注意到,在我的工作流程中没有latex - > dvi,所以我不能评论tex4ht这样的东西,它读出了一个dvi文件(我有太多的图形不能用DVI来切换它们了)。

我很快就会将所有内容都转移到docbook 4.5--我喜欢支持latex,html的docbook-utils软件包,我甚至看到了转换器到ODT。但是docbook在标记上非常沉重,这很烦人,但它会为我提供我需要前进的灵活性。

由于您使用的是python,您刚刚考虑过使用ReStructured Text吗?

我也非常喜欢通过emacs的orgmode发布,这是一个超轻量级标记,可以进入一系列不同的格式。

你试过pandoc?我一直在使用它,将不同的格式转换成彼此的成功。为什么试图发明两次轮子?

云母,你看到了这个DocBook-> ODT转换器在哪里?我也需要这样做。 (Pandoc似乎没有阅读DocBook Lite XML。)

谢谢哈比。我确实看过Pandoc,但它的网站说它不读DocBook XML,它只是写它。它可以“读取markdown和(reStructuredText,HTML和LaTeX的子集)”。

现在,我可以尝试执行DocBook-> HTML,然后HTML-> ODT的路线。我不知道有多少信息会以这种方式丢失。这是值得一试,无论如何...

...好吧,我只是尝试使用他们的在线转换器在http://johnmacfarlane.net/pandoc/try与本书的完整HTML文本produoss.com/en/producingoss.html(注意这个HTML是从DocBook XML母版生成的)。对于dest格式,我选择了“OpenDocument XML”。

500内部服务器错误 超时

好吧,也许这是太大了。让我试试较小:

producingoss.com/en/bug-tracker.html

...这得到了体面的前瞻性OpenDocument的XML输出,仅带有“截断替换的文本的主体!如果你想转换大文件,请下载pandoc。“所以我必须下载并试用它。