当前位置：文江博客话题详情

wget 用于获取 Facebook 个人资料/朋友页面

发布于 2024-11-26 10:01:39 字数 810 浏览 10 评论 0 原文

我正在尝试使用“wget”获取 facebook 用户的个人资料页面，但不断获取名为“browser.php”的非个人资料页面，该页面与该特定用户无关。我在浏览器中看到的个人资料页面的 URL 恰好采用以下格式：

http://www.facebook.com/user-name

，这就是我一直用作wget 命令：

wget http://www.facebook.com/user-name< /em>

我也有兴趣使用 wget 来获取用户的朋友列表，但即使这样也给了我同样无用的结果（“browser.php”）：

wget http://www.facebook.com/user-name?sk=friends&v=friends

有人可以告诉我我在这里做错了什么吗？换句话说，我是否错过了 wget 命令的一些关键选项，或者 wget 根本不适合这种情况？

任何帮助将不胜感激。

为了向这个查询添加上下文，我需要弄清楚如何使用 wget 从 Facebook 获取这些页面，因为它会帮助我编写一个脚本/程序来从 HTML 源代码中查找朋友的个人资料 URL，然后查找其他一些页面我基本上希望这能帮助我对我没有联系的人进行某种选择性抓取（当然要经过 Facebook 的许可）。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

在梵高的星空下 2024-12-03 10:01:39

首先，Facebook 可能创造了一种条件，使某些用户代理（例如 wget）无法抓取页面。因此，他们将某些用户代理重定向到不同的页面，该页面可能会显示“不支持您的浏览器”之类的内容。他们这样做是为了保护人们不做您正在做的事情。但是，您可以使用 wget 的 -U 参数告诉 wget 将自己标识为不同的代理（请阅读 wget 手册页）。例如 wget -U Mozilla http://....

其次，Facebook 的隐私设置很少允许您读取任何/大量信息，除非您以用户身份登录，并且可能仅以以下用户身份登录：是您要抓取的个人资料的好友。

第三，有一个 Facebook API，您需要使用它来从 facebook 抓取和提取信息 - 您如果您尝试以任何其他方式获取信息，则可能违反可接受的使用政策。

回复收藏 0 原文

二智少女猫性小仙女 2024-12-03 10:01:39

我不知道你为什么要使用 wget ..facebook 提供了一个优秀的 API 。

wget --user-agent=Firefox http://www.facebook.com/markzuckerberg

将公开可用的内容保存到文件中。

你应该考虑使用他们的 API。

Facebook 开发者

I donno why you want to use wget ..facebook offers an excellent API .

wget --user-agent=Firefox http://www.facebook.com/markzuckerberg

will save the publicly available content to a file.

you should consider using their API.

Facebook Developers

回复收藏 0 原文

一笔一画续写前缘 2024-12-03 10:01:39

如果您想保存登录页面，您可以使用 Firefox 登录并选择“保持登录状态”，然后将这些 cookie 复制到文件中并通过 cookiejar 选项使用它们。您仍然会有相当多的动态脚本加载内容，WGET 不会保存这些内容。

有很多方法可以给这只猫剥皮。如果您需要提取特定项目，请查看 API。如果您只是想存档网页浏览器中显示的页面快照，请尝试 CutyCapt。它很像 wget，只不过它像网络浏览器一样解析整个文档并存储页面的图像。

回复收藏 0 原文

花想c 2024-12-03 10:01:39

检查以下开源项目：

facebook-cli，它是与 Facebook API 交互的命令行实用程序。
facebook-friends 可以生成所有的 HTML 页面你的 Facebook 好友。

回复收藏 0 原文

攒眉千度 2024-12-03 10:01:39

您可以轻松地重复使用 Firefox cookie 进行登录，请参阅：

如何使用 wget/curl 从我登录的网站下载？

谁可以看到您的好友列表是可配置的，因此如果有人将其配置为仅限好友，您将无法查看提取该信息。

我还建议使用移动网站，它使用分页而不是 AJAX 加载，并且 HTML 更简单、更小： https://m.facebook.com/USER/friends?startindex=24

以下是（非常严格的）抓取条款：https://www.facebook.com/apps/site_scraping_tos_terms.php

回复收藏 0 原文

季末如歌 2024-12-03 10:01:39

要使用 wget 下载 Facebook 页面，您可以使用 Chrome Web 浏览器中的 DevTools（也适用于 Firefox、Opera 等）。

首先，您需要通过转到网络选项卡（如有必要刷新页面或勾选保留日志将其转换为curl命令em>），找到您感兴趣的页面（您可以过滤列表），右键单击请求/页面，然后选择 复制为 cURL。然后将命令粘贴到终端。

要将 curl 格式转换为 wget，请执行以下转换：

删除 --compress 参数，
更改 -H到所有地方的 --header 。

还可以考虑添加以下 wget 参数：

-k 或 --convert-links，以转换文档中的链接，使其适合本地观看。
-p 或 --page-requirements，下载正确显示页面所需的所有文件。

另请参阅：

回复收藏 0 原文

~没有更多了~

关于作者

执手闯天涯

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

wget 用于获取 Facebook 个人资料/朋友页面

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（6）

关于作者

相关话题

热门标签

推荐作者

此刻的回忆

leejubao

不甘平庸

南巷近海

未蓝澄海的烟

gitee_v1qxdSBNo

友情链接

wget 用于获取 Facebook 个人资料/朋友页面

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（6）

关于作者

相关话题

热门标签

推荐作者

此刻的回忆

leejubao

不甘平庸

南巷近海

未蓝澄海的烟

gitee_v1qxdSBNo

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。