将docx转换为mediawiki并保留[[Image:]]

问题描述:

目前,我正在尝试将docx移动到mediawiki文件,并在[[Image:]]标记中保留正确的文件名。出于某种原因,正确的图像文件被吞下(即,通常它会是media/image4.jpg,但它只是空的)。将docx转换为mediawiki并保留[[Image:]]

我试过提取docx并看着docx/word/_rels/document.xml.rels,但我不知道如何找出重复的图像。我做了一个简单的脚本来做一些查找/替换,但在一个文件中我有130 [[Image:]]标签,只有105个图像。

因此,我想有MediaWiki的滤波器输出的正确的图像名称执行此操作时:

soffice --headless --convert-to txt:MediaWiki myfile.docx 

我在Ubuntu 14.10。

这可能吗?

+0

为什么你不能将图像嵌入到文档文件中? (我个人也会使用适当的文档格式,如OpenDocument odt。) – Nemo 2015-10-17 08:06:02

+0

由于这是一项公司任务,因此将大量旧文档转换为mediawiki格式。他们必须照原样转换,并且正确转换,我最终管理的是(见我的回答)。 – Seiyria 2015-10-17 14:29:08

+0

啊。无论是问题还是答案,它都不是很清楚您将文档转换为wikitext页面。 – Nemo 2015-10-17 15:35:25

这似乎不可能,但我写了一个解决方法找到here解决它。它的长短之处在于我转换文件并手动管理图像的上传/链接。