当前位置：文江博客话题详情

Perl www-mechanize

如何使用 Perl 的 WWW::Mechanize 从页面中提取除链接之外的所有链接？

发布于 2024-08-26 20:43:19 字数 364 浏览 2 评论 0原文

我正在尝试使用 WWW::Mechanize 从 HTML 中提取一些链接使用 find_all_links() 方法的页面。它支持根据以下条件进行匹配：

text
text_regex
url
url_regex
url_abs
url_abs_regex
...

如何提取所有链接除了包含文本“xyz”的链接？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

少女净妖师 2024-09-02 20:43:19

您可以使用 'text_regex' 标准：

$mech->find_all_links(text_regex => qr/^(?!xyz$).*$/);

请参阅 perldoc perlre 了解更多关于否定前瞻断言。

You can use the 'text_regex' criteria:

$mech->find_all_links(text_regex => qr/^(?!xyz$).*$/);

See perldoc perlre for more on negative look-ahead assertion.

回复收藏 0 原文

两相知 2024-09-02 20:43:19

为什么不获取所有链接，然后使用“grep”跳过那些不需要的链接？

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

1CH1MKgiKxn9p

文章 0 评论 0

ゞ记忆︶ㄣ

文章 0 评论 0

JackDx

文章 0 评论 0

信远

文章 0 评论 0

yaoduoduo1995

文章 0 评论 0

霞映澄塘

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文