当前位置：文江博客话题详情

查找给定域的每个页面

发布于 2024-11-30 14:19:14 字数 47 浏览 1 评论 0原文

是否有任何用于 Ruby 的工具/库，当给定域名时，将返回该域中所有页面的列表？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

不及他 2024-12-07 14:19:14

你可以使用 Anemone，它是一个 Ruby 网络蜘蛛框架。它需要 Nokogiri 作为依赖项，因为它需要解析 (X)HTML。

回复收藏 0 原文

情话墙 2024-12-07 14:19:14

如果站点不是静态 HTML 页面的集合，则枚举是一项艰巨的任务。一旦您进入任何类型的服务器端脚本，返回的“页面”可能会严重依赖于您的会话状态。一个明显的例子是只有在登录后才能访问的页面或资源。因此，许多自动枚举工具（通常是 Web 应用程序安全审核程序的一部分）会出错并错过站点的大部分内容。我在这里的观点是，枚举通常不仅仅只是运行一个工具。

好消息是，编写自己的枚举器非常容易，只要您只需在网站上浏览即可获得一些知识，该枚举器就能很好地工作。我使用 Mechanize 编写了类似的内容，它可以在您请求页面时轻松跟踪您的历史记录。因此，让 Mechanize 设置您需要的服务器端状态（即登录）然后访问您找到的每个链接是一项非常简单的任务。只需请求首页或您需要的任何“列表”页面并保留一系列链接即可。迭代此链接列表，如果该链接不在历史记录中，则转到该链接并将链接列表存储在该页面上。重复此操作，直到链接列表为空。

但就像我说的，这完全取决于服务器端发生的情况。可能有些页面未链接到您或您无法访问，您将无法通过这种方式发现这些页面。

回复收藏 0 原文

~没有更多了~