如何使用 Perl 的 WWW::Mechanize 从页面中提取除链接之外的所有链接?
我正在尝试使用 WWW::Mechanize 从 HTML 中提取一些链接使用 find_all_links()
方法的页面。它支持根据以下条件进行匹配:
- text
- text_regex
- url
- url_regex
- url_abs
- url_abs_regex
...
如何提取所有链接除了包含文本“xyz”的链接?
I'm trying to use WWW::Mechanize to extract some links from the HTML page using find_all_links()
method. It supports matching on these criterias:
- text
- text_regex
- url
- url_regex
- url_abs
- url_abs_regex
...
How can I extract all links except one that has text "xyz"?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您可以使用
'text_regex'
标准:请参阅 perldoc perlre 了解更多关于否定前瞻断言。
You can use the
'text_regex'
criteria:See perldoc perlre for more on negative look-ahead assertion.
为什么不获取所有链接,然后使用“grep”跳过那些不需要的链接?
Why not get all links then use 'grep' to skip those you don't need?