如何动态查找给定 URL 的入站链接?

发布于 2024-07-10 21:43:53 字数 515 浏览 7 评论 0原文

Technorarati 拥有他们的 Cosmos api,它工作得相当好,但限制您用于非商业用途,并且不能使用每天超过500个查询。

雅虎有一个 Site Explorer InLink Data API,但它定义了任务从字面上看,返回来自博客中的侧边栏小部件的链接,而不仅仅是来自博客内容内部的链接。

是否有其他替代方法来跟踪谁链接到给定的 URL(想想 Techmeme.com< 上的故事下方运行的讨论链接/a>)? 或者我必须自己推出?

Technorarati's got their Cosmos api, which works fairly well but limits you to noncommercial use and no more than 500 queries a day.

Yahoo's got a Site Explorer InLink Data API, but it defines the task very literally, returning links from sidebar widgets in blogs rather than just links from inside blog content.

Is there any other alternative for tracking who's linking to a given URL (think of the discussion links that run below stories on Techmeme.com)? Or will I have to roll my own?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

她说她爱他 2024-07-17 21:43:53

嗯,它不是一个 API,但如果您用 google(例如)搜索:“link:nytimes.com”,返回的搜索结果将显示该网站的入站链接。

我还没有尝试实现您想要的功能,但是 Google 搜索 API几乎可以肯定内置了该功能。

Well, it's not an API, but if you google (for example): "link:nytimes.com", the search results that come back show inbound links to that site.

I haven't tried to implement what you want yet, but the Google search API almost certainly has that functionality built in.

巷子口的你 2024-07-17 21:43:53

这是指向您控制下的 URL 的链接吗?

如果是这样,您可以快速创建一些在 Referrer HTTP 标头中记录条目的方法。

如果您想在不更改应用程序代码的情况下对整个网站执行此操作,您可以为您选择的 Web 服务器实现 ISAPI 过滤器或等效项。

从网络爬虫公开获得的信息总是不完整且不可靠的(并不是说我的解决方案不是......)。

Is this for links to Urls under your control?

If so, you could whip up something quick that logs entries in the Referrer HTTP header.

If you wanted to do to this for an entire web site without altering application code, you could implement as an ISAPI filter or equivalent for your web server of choice.

Information available publicly from web crawlers is always going to be incomplete and unreliable (not that my solution isn't...).

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文