抓取和解析域的谷歌数据,例如页面排名等
我需要抓取/解析给定域名(站点)的一些搜索引擎相关数据。
我需要
Google Page Rank(仅针对域名,而不是每个页面)。
索引结果/页面的数量(google、bing)。
反向链接数量(谷歌、必应、雅虎)。
流量排名(Alexa)。
网站缩略图。
您能给我一些建议,让我从哪里开始吗?我试图环顾四周,但我只能找到 Google Ajax API,它只为我提供索引结果的数量。这也需要有效的标题,这意味着我必须在该网站上才能实现该功能。因此,我无法获取任何给定域的数据。
谢谢
I need to scrape/parse some search engines related data for a given domain name(site).
I need
Google Page Rank (only for the domain name, not each pages).
Number of indexed results/pages (google, bing).
Number of Backlinks (google, bing, yahoo).
Traffic Rank (alexa).
Site thumbnail.
Could you provide me some pointers on where can I start? I tried to look around, but I was able to find only Google Ajax API which provides me number of indexed results only. That too expects valid headers which would mean, I have to be on that site, in order to make that work. So, I can't get data for any given domain.
Thanks
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
他们的搜索 API 故意非常有限,因此您可能需要直接从每个网站抓取这些数据。
Their search API's are intentionally very limited so you will probably need to scrape this data directly from each website.