python win32com读取doc文件内容乱码

发布于 2022-09-13 00:02:50 字数 593 浏览 13 评论 0


内容大概是这样,要怎么解决,或者推荐一个python好用的读取doc文件的库也可以

from docx import Document
import win32com.client as wc

word = wc.Dispatch("Word.Application")
doc = word.Documents.Open(r"D:\文件\pythonProject\海运出口货物代运委托单1902 - 副本 - 副本.doc")
for para in doc.paragraphs:
  print(para.Range.text)
doc.SaveAs(r"D:\文件\pythonProject\订舱委托书2103.pdf", 16)#转换后的文件,12代表转换后为docx文件
doc.Close()
word.Quit()

# document = Document("订舱委托书2103.docx")
#
# for paragraph in document.paragraphs:
#     print(paragraph.text)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

甚是思念 2022-09-20 00:02:50

python-docx

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文