有没有办法使用 Java 从 PostScript(.ps、.eps)文件中提取文本?

发布于 2024-08-11 08:02:37 字数 69 浏览 3 评论 0原文

我正在寻找类似于 PDFBox 的 Apache Tika PDF 解决方案,但适用于 PS 文件。

谢谢。

I am looking for a solution similiar to PDFBox for PDFs of Apache Tika, however, for PS files.

thanks.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

捂风挽笑 2024-08-18 08:02:37

正如 James Black 所说,最好只是转换为 PDF 并使用您熟悉的工具。

但是,确实存在 pstotext ,例如, Ubuntu 宇宙在它自己的包中。

Ghostscript 本身还附带了 ps2txt 和 ps2ascii,它们也可以做到这一点。

Like James Black says, it's probably best just to convert to PDF and use your familiar tools.

However, there does exist pstotext which is available in, e.g., the Ubuntu universe in its own package.

Ghostscript itself also comes with both ps2txt and ps2ascii which can also do this.

我乃一代侩神 2024-08-18 08:02:37

您可以使用 Ghostscript 转换为 pdf,http://www.osalt.com/ghostscript,然后有各种库来处理 pdf。

这样做的一个优点是,您只能从 PDF 中提取内容,因此您可以处理其他格式,只要您可以将它们转换为 PDF。

You could use Ghostscript to convert to a pdf, http://www.osalt.com/ghostscript, then there are various libraries to handle a pdf.

This has an advantage in that you are only pulling from PDFs, so you can handle other formats as long as you can convert them to PDFs.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文