Python 中的 html 到 .doc 转换器？

发布于 2024-10-04 02:06:08 字数 101 浏览 0 评论 0 原文

我正在使用 pisa，它是一个用于 Python 的 HTML 到 PDF 转换库。

Word 文档是否存在同样的东西：Python 的 HTML 到 .doc 转换库？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

世俗缘 2024-10-11 02:06:08

您可以使用 Windows 的 pywin32 python 扩展中的 win32com，让 MS Word 为您转换它。一个简单的例子：

import win32com.client

word = win32com.client.Dispatch('Word.Application')

doc = word.Documents.Add('example.html')
doc.SaveAs('example.doc', FileFormat=0)
doc.Close()

word.Quit()

You could use win32com from the pywin32 python extensions for windows, to let MS Word convert it for you. A simple example:

import win32com.client

word = win32com.client.Dispatch('Word.Application')

doc = word.Documents.Add('example.html')
doc.SaveAs('example.doc', FileFormat=0)
doc.Close()

word.Quit()

回复收藏 0 原文

德意的啸 2024-10-11 02:06:08

虽然我不知道有一个直接模块可以让您进行转换，但是：

您可以首先使用 HTML 转换为纯文本 //www.aaronsw.com/2002/html2text/" rel="noreferrer">html2text 模块。
之后，您可以使用 python-docx 模块将文本转换为 doc 或 docx 文件。

回复收藏 0 原文

疏忽 2024-10-11 02:06:08

如果其他人在这里尝试以相反的方式进行转换，上面的代码可以工作，但您需要修改 FileFormat 值。

http://msdn.microsoft.com/en-us/library/ff839952.aspx

示例：过滤后的 html 为 10，而不是 0。

回复收藏 0 原文

梦境 2024-10-11 02:06:08

使用 python3.x 更新修复此问题：

from htmldocx import HtmlToDocx

new_parser = HtmlToDocx()
new_parser.parse_html_file("html_filename", "docx_filename")
#Files extensions not needed, but tolerated

Update with a python3.x fix this:

from htmldocx import HtmlToDocx

new_parser = HtmlToDocx()
new_parser.parse_html_file("html_filename", "docx_filename")
#Files extensions not needed, but tolerated

回复收藏 0 原文

~没有更多了~