抓取和解析域的谷歌数据,例如页面排名等

发布于 2024-09-16 12:48:31 字数 313 浏览 7 评论 0原文

我需要抓取/解析给定域名(站点)的一些搜索引擎相关数据。

我需要

Google Page Rank(仅针对域名,而不是每个页面)。

索引结果/页面的数量(google、bing)。

反向链接数量(谷歌、必应、雅虎)。

流量排名(Alexa)。

网站缩略图。

您能给我一些建议,让我从哪里开始吗?我试图环顾四周,但我只能找到 Google Ajax API,它只为我提供索引结果的数量。这也需要有效的标题,这意味着我必须在该网站上才能实现该功能。因此,我无法获取任何给定域的数据。

谢谢

I need to scrape/parse some search engines related data for a given domain name(site).

I need

Google Page Rank (only for the domain name, not each pages).

Number of indexed results/pages (google, bing).

Number of Backlinks (google, bing, yahoo).

Traffic Rank (alexa).

Site thumbnail.

Could you provide me some pointers on where can I start? I tried to look around, but I was able to find only Google Ajax API which provides me number of indexed results only. That too expects valid headers which would mean, I have to be on that site, in order to make that work. So, I can't get data for any given domain.

Thanks

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

旧时模样 2024-09-23 12:48:31

他们的搜索 API 故意非常有限,因此您可能需要直接从每个网站抓取这些数据。

Their search API's are intentionally very limited so you will probably need to scrape this data directly from each website.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文