如何避免爬虫跟随锚点空链接(使用jquery操作)

发布于 2024-09-17 23:47:33 字数 600 浏览 4 评论 0原文

我的网站中有一些链接仅用于显示信息弹出窗口。

例如,我有类似的内容:

<a href="#" id="myLink">show more info</a>

在我的 .js 文件中,我有类似的内容:

$(document).ready(function() {
  $("#myLink).click(function() {
      displayPopup();
});
});

但是谷歌爬虫或其他爬虫跟踪该链接并告诉我这是一个错误的链接(它转到我的 /usercontrol 文件夹...)

我该怎么办避免爬虫跟踪此链接?

我应该把 :

<a href="#" id="myLink" onclick="return false">show more info</a>

并保持我的 jquery 不变吗?

或者将 return false 放在 Jquery 点击事件中?

或者不使用锚点而是使用 div ?在这种情况下它会在所有浏览器中工作吗?

谢谢大家

I have in my site some links that are just used to display informative popups.

For example I have something like :

<a href="#" id="myLink">show more info</a>

And in my .js file I have something like :

$(document).ready(function() {
  $("#myLink).click(function() {
      displayPopup();
});
});

But google crawler or other crawler follow the link and tell me that it's a wrong link (it goes to my /usercontrol folder...)

How can I avoid crawler to follow this link ?

Should I put :

<a href="#" id="myLink" onclick="return false">show more info</a>

and keep my jquery as it is ?

Or put return false in Jquery click event ?

Or not use an anchor but a div instead ? is it gonna work in all browser in this case ?

Thanks for all

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

不奢求什么 2024-09-24 23:47:33
<a href="#" id="myLink" rel="nofollow">show more info</a>
<a href="#" id="myLink" rel="nofollow">show more info</a>
酒几许 2024-09-24 23:47:33

由于它并不是真正的链接,因此您可以使用 span 标签,并将其样式设置为您想要的样子。它可以在任何启用了 Javascript 的浏览器中工作,就像您当前的解决方案一样。

As it's not really a link, you can use a span tag instead, and style it to look like you want. It will work in any browser that has Javascript enabled, just as your current solution.

北方的韩爷 2024-09-24 23:47:33

正如@Darin建议的那样,使用值为 nofollow 的 rel 属性 是一个很好的技术。

但是,为了防止搜索引擎访问您网站的部分内容或将其编入索引,您应该使用机器人排除标准。请参阅各种搜索引擎对 nofollow 的解释

要告诉所有用户代理不要关注或索引给定的网址,请使用包含以下内容的 robots.txt 文件:

User-agent: *
Disallow: /usercontrol/

Google 和所有其他机器人应尊重您的 robots.txt 文件的内容,并且不要索引以该路径开头的任何链接<代码>/用户控制/。

As @Darin suggested, using the rel attribute with a value of nofollow is a good technique.

However, to prevent search engines from accessing or indexing parts of your site, you should use the Robots exclusion standard. See the interpretation of nofollow by various search engines.

To tell all user agents to not follow or index a given url, use a robots.txt file with the following contents:

User-agent: *
Disallow: /usercontrol/

Google and all other bots should respect the contents of your robots.txt file, and not index any links starting with the path /usercontrol/.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文