使用python-docx将HTML转换为Word文档?

问题描述:

我想从HTML字段生成Word文档(可以写入文本并将其设置为粗体,斜体,字体颜色大小的字段..)。我用这个Python-docx来生成WOrd文档.Everythink是好的(添加图片,文本,..)唯一的问题是样式。问题是我有Word文档中的内容,但没有风格。使用python-docx将HTML转换为Word文档?

我试图挽救像一个HTML文件中的内容,之后创建像下面这样的蟒蛇-的docx文件:

html_f=open('f_html.html','w') 
html_f.write(u''+contenu) 
html_f.close() 


doc2=docx.Document('f_html.docx') 

但我dont't有一个结果和文档()没有找到该文件。 请任何帮助

Python-docx只接受纯文本。您可以使用pywin32扩展程序来转换您的html文件。我找到一个简单的例子:

import win32com.client 

word = win32com.client.Dispatch('Word.Application') 
doc = word.Documents.Add('example.html') 
doc.SaveAs('example.doc', FileFormat=0) 
doc.Close() 
word.Quit()