怎样将网页中的某部分内容禁止搜索引擎抓取?
每个网页,都有一块区域的内容不希望被搜索引擎抓取,有什么好方法呢?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
每个网页,都有一块区域的内容不希望被搜索引擎抓取,有什么好方法呢?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(6)
拿js脚本来生成,脚本里面可以存放unicode转义形式,或者url编码过的文本。
ajax获取内容,然后在robots.txt里禁止搜索引擎抓取数据接口
google 也可以索引 ajax,swf的内容。我能想到的就是图片,然后根据referer 判断是否为机器人,再决定图片是否显示。
阴谋论:有的搜索引擎并非遵守robots.txt ,只是索引了,但是不现实搜索结果。
一般情况下,搜索引擎是(包括Google)不会抓取JS生成的内容的,想要Google抓取JS内容还是需要一些配置呢,Making AJAX Applications Crawlable(可能需翻墙),因此,我觉得使用JS生成内容可行。
生成图片输出,起点这些vip阅读章节就是这么做的吧
iframe 然后写robot.txt
robot.txt 指明指定的路径不希望被抓,然后在该页面引入
具体搜索引擎的robot说明,请去各自搜索引擎官方查看