anemone 忽略包含特定短语的 url 链接
我正在 ruby 上运行带有 anemone 的网络抓取工具,当服务器访问需要登录的页面时,我给服务器带来了一些问题。
这些页面的网址中都有一个短语,例如“帐户”,我希望程序完全忽略并且不转到包含该字符串的目的地的任何链接。
我该怎么做?
I am running a web scraper with anemone on ruby and I am giving my server some problems when it visits pages that require a logon.
The pages all have a phrase, say, "account" in the url and I want the program to completely ignore and not go to any link with a destination containing this string.
How can I do this?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
Anemone 有一个
skip_links_like
方法:因此添加类似的内容
应该可以解决它:
Anemone has a
skip_links_like
method:So adding something like
should take care of it: