如何使用 Perl 从 SGML DTD 中提取文本内容?

发布于 2025-01-08 05:02:38 字数 174 浏览 0 评论 0原文

我正在考虑使用 Perl 从 DTD 中提取所有内容,但我不确定哪种方法是最好的方法。我知道有一些用于处理 XML 的模块,但我不确定是否有任何用于此类处理 SGML 的模块,或者我是否应该尝试为这项工作创建一个正则表达式?

我是 SGML 和 Perl 的新手,除了非常简单的模式匹配之外,对正则表达式没有太多经验。

I'm looking into extracting all the content from a DTD using Perl, but I'm not sure which is the best way to go about it. I know there are modules for working with XML, but I'm not sure if there are any for this type of work with SGML or if I should try to create a regular expression for this work?

I'm new to SGML and Perl along with not having much experience with regex, except for very simple pattern matching.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

能否归途做我良人 2025-01-15 05:02:38

这里有 2 个选项:

如今,XML 工具比 SGML 工具多得多,但是当然您可能会丢失一些信息,因为 XML 中的 DTD 比 SGML 中的 DTD 稍微简单一些

You have 2 options here:

  • use the old perlSGML distribution which I have used in the (remote!) past. This being perl it should still run on modern perl,

  • convert your SGML to XML using osx, which is part of openSP, available for at least Debian/Ubuntu (the package is called opensp)and most likely other platforms, then use XML tools like XML::LibXML, or XML::Twig

There are a lot more XML tools than SGML tools these days, but of course you may loose some information since DTDs are slightly simpler in XML than in SGML

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文