用于获取网站中每页链接的快速列表的脚本或代码

发布于 2024-10-19 06:19:38 字数 247 浏览 1 评论 0原文

我如何快速生成以下格式的网站报告：

Page Name.
- Links within the page

Page Name.
- Links within the page

任何编程或脚本语言都可以。

尽管我更喜欢 Windows 上的解决方案，但我们在办公室中提供了以下所有平台：Windows、Mac 和 Linux 平台。

只是寻找一种无需大张旗鼓的方法即可做到这一点。

原文

How can I quickly produce a report of a website in the format:

Page Name.
- Links within the page

Page Name.
- Links within the page

Any programming or scripting language will do.

Although I prefer a solution on Windows, we have all of: Windows, Mac and Linux platforms available in the office.

Just looking for a way to do it without much fanfare.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

薄暮涼年 2024-10-26 06:19:38

可能有一些工具可以为您做到这一点，但您自己组装起来并不难。一种可能的解决方案是...

使用 wget（可在 Windows 中找到）下载所有 HTML 文件，并
使用一些 xpath 工具或带正则表达式的 grep 从页面获取标题和链接。

///詹斯

回复收藏 0 原文

儭儭莪哋寶赑 2024-10-26 06:19:38

有很多链接分析器可以做到这一点。这是我在 Google 中找到的第一个。

对于更有趣的事情，Don Syme 做了一个很棒的 F# 演示，其中他编写了一个非常简单的异步 URL 处理类。我找不到确切的链接，但是这里类似于F# MVP。您需要对其进行调整以拉出链接，如果您想要嵌套，则需要递归地跟踪它们。

回复收藏 0 原文

~没有更多了~

关于作者

物价感观

暂无简介

0 文章

0 评论

23 人气

关注发私信

烙印

文章 0 评论 0

关注

singlesman

文章 0 评论 0

关注

给自己一个微笑

文章 0 评论 0

关注

独孤求败

文章 0 评论 0

关注

晨钟暮鼓

文章 0 评论 0

关注

我是自愿种绣球花的

文章 0 评论 0

友情链接

文江博客

用于获取网站中每页链接的快速列表的脚本或代码

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者