python win32com读取doc文件内容乱码
内容大概是这样,要怎么解决,或者推荐一个python好用的读取doc文件的库也可以
from docx import Document
import win32com.client as wc
word = wc.Dispatch("Word.Application")
doc = word.Documents.Open(r"D:\文件\pythonProject\海运出口货物代运委托单1902 - 副本 - 副本.doc")
for para in doc.paragraphs:
print(para.Range.text)
doc.SaveAs(r"D:\文件\pythonProject\订舱委托书2103.pdf", 16)#转换后的文件,12代表转换后为docx文件
doc.Close()
word.Quit()
# document = Document("订舱委托书2103.docx")
#
# for paragraph in document.paragraphs:
# print(paragraph.text)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
python-docx