当前位置：文江博客话题详情

Python PDF text-mining

使用 Python 文本挖掘 PDF 文件？

发布于 2024-08-09 17:23:53 字数 45 浏览 4 评论 0 原文

python 是否有一个包/库可以让我打开 PDF，并在文本中搜索某些单词？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

水水月牙 2024-08-16 17:23:53

使用 PyPdf2 您可以使用 extractText() 方法提取 pdf 文本并对其进行处理。

更新：更改了文本以引用 PyPdf2，感谢 @Aditya Kumar 的提醒。

回复收藏 0 原文

如歌彻婉言 2024-08-16 17:23:53

我不认为你可以一步完成，但你当然可以使用 pdfminer。然后您可以将任何文本搜索应用于恢复的数据。

回复收藏 0 原文

~没有更多了~

关于作者

朱染

暂无简介

文章

25 人气

关注发私信

燃烧我的卡路李先生

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

∞梦里开花

文章 0 评论 0

关注

qq_IklFPL

文章 0 评论 0

关注

迷途知返

文章 0 评论 0

关注

深海不蓝

文章 0 评论 0

友情链接

文江博客

使用 Python 文本挖掘 PDF 文件？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签