如何避免爬虫跟随锚点空链接(使用jquery操作)
我的网站中有一些链接仅用于显示信息弹出窗口。
例如,我有类似的内容:
<a href="#" id="myLink">show more info</a>
在我的 .js 文件中,我有类似的内容:
$(document).ready(function() { $("#myLink).click(function() { displayPopup(); }); });
但是谷歌爬虫或其他爬虫跟踪该链接并告诉我这是一个错误的链接(它转到我的 /usercontrol 文件夹...)
我该怎么办避免爬虫跟踪此链接?
我应该把 :
<a href="#" id="myLink" onclick="return false">show more info</a>
并保持我的 jquery 不变吗?
或者将 return false 放在 Jquery 点击事件中?
或者不使用锚点而是使用 div ?在这种情况下它会在所有浏览器中工作吗?
谢谢大家
I have in my site some links that are just used to display informative popups.
For example I have something like :
<a href="#" id="myLink">show more info</a>
And in my .js file I have something like :
$(document).ready(function() { $("#myLink).click(function() { displayPopup(); }); });
But google crawler or other crawler follow the link and tell me that it's a wrong link (it goes to my /usercontrol folder...)
How can I avoid crawler to follow this link ?
Should I put :
<a href="#" id="myLink" onclick="return false">show more info</a>
and keep my jquery as it is ?
Or put return false in Jquery click event ?
Or not use an anchor but a div instead ? is it gonna work in all browser in this case ?
Thanks for all
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
由于它并不是真正的链接,因此您可以使用 span 标签,并将其样式设置为您想要的样子。它可以在任何启用了 Javascript 的浏览器中工作,就像您当前的解决方案一样。
As it's not really a link, you can use a span tag instead, and style it to look like you want. It will work in any browser that has Javascript enabled, just as your current solution.
正如@Darin建议的那样,使用值为
nofollow 的
是一个很好的技术。rel
属性但是,为了防止搜索引擎访问您网站的部分内容或将其编入索引,您应该使用机器人排除标准。请参阅各种搜索引擎对 nofollow 的解释。
要告诉所有用户代理不要关注或索引给定的网址,请使用包含以下内容的 robots.txt 文件:
Google 和所有其他机器人应尊重您的 robots.txt 文件的内容,并且不要索引以该路径开头的任何链接<代码>/用户控制/。
As @Darin suggested, using the
rel
attribute with a value ofnofollow
is a good technique.However, to prevent search engines from accessing or indexing parts of your site, you should use the Robots exclusion standard. See the interpretation of nofollow by various search engines.
To tell all user agents to not follow or index a given url, use a robots.txt file with the following contents:
Google and all other bots should respect the contents of your robots.txt file, and not index any links starting with the path
/usercontrol/
.