如何使用 Perl 从 SGML DTD 中提取文本内容?
我正在考虑使用 Perl 从 DTD 中提取所有内容,但我不确定哪种方法是最好的方法。我知道有一些用于处理 XML 的模块,但我不确定是否有任何用于此类处理 SGML 的模块,或者我是否应该尝试为这项工作创建一个正则表达式?
我是 SGML 和 Perl 的新手,除了非常简单的模式匹配之外,对正则表达式没有太多经验。
I'm looking into extracting all the content from a DTD using Perl, but I'm not sure which is the best way to go about it. I know there are modules for working with XML, but I'm not sure if there are any for this type of work with SGML or if I should try to create a regular expression for this work?
I'm new to SGML and Perl along with not having much experience with regex, except for very simple pattern matching.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
这里有 2 个选项:
使用旧的 perlSGML 我过去(远程!)使用过的发行版。这是 Perl,它仍然应该在现代 Perl 上运行,
使用
osx
将 SGML 转换为 XML,它是 openSP 的一部分,至少可用于 Debian/Ubuntu(该软件包称为opensp
)以及最有可能的其他平台,然后使用 XML::LibXML 或 XML::Twig等 XML 工具,
如今,XML 工具比 SGML 工具多得多,但是当然您可能会丢失一些信息,因为 XML 中的 DTD 比 SGML 中的 DTD 稍微简单一些
You have 2 options here:
use the old perlSGML distribution which I have used in the (remote!) past. This being perl it should still run on modern perl,
convert your SGML to XML using
osx
, which is part of openSP, available for at least Debian/Ubuntu (the package is calledopensp
)and most likely other platforms, then use XML tools like XML::LibXML, or XML::TwigThere are a lot more XML tools than SGML tools these days, but of course you may loose some information since DTDs are slightly simpler in XML than in SGML