使用python-docx将HTML转换为Word文档?
问题描述:
我想从HTML字段生成Word文档(可以写入文本并将其设置为粗体,斜体,字体颜色大小的字段..)。我用这个Python-docx来生成WOrd文档.Everythink是好的(添加图片,文本,..)唯一的问题是样式。问题是我有Word文档中的内容,但没有风格。使用python-docx将HTML转换为Word文档?
我试图挽救像一个HTML文件中的内容,之后创建像下面这样的蟒蛇-的docx文件:
html_f=open('f_html.html','w')
html_f.write(u''+contenu)
html_f.close()
doc2=docx.Document('f_html.docx')
但我dont't有一个结果和文档()没有找到该文件。 请任何帮助
答
Python-docx只接受纯文本。您可以使用pywin32扩展程序来转换您的html文件。我找到一个简单的例子:
import win32com.client
word = win32com.client.Dispatch('Word.Application')
doc = word.Documents.Add('example.html')
doc.SaveAs('example.doc', FileFormat=0)
doc.Close()
word.Quit()