WordPress 如何避免被收录重复页面
使用 WordPress 也有一段时间,每天写写博客,发发文章,分享一些设计心得和设计,可是伴随的问题也来了,今天用 site 语法查了网站的收录量,百度竟然达到了2080,网站文章根本就没有那么多,搜索引擎的索引量也没有那么多,那么就可能存在很多重复的页面,这些页面的收录降低了网站权重,之前设置的 robots.txt 文件可能没有设置正确,并没有屏蔽掉这个动态页面。
WordPress 默认会有一个 robots.txt,这个文件是伪静态的,访问地址就在根目录。
但是通过现在的设置,应该能屏蔽掉百度收录重复页面。 这些动态的页面谷歌对其反应不是很大,但是百度却很勤快,一个劲的猛收录,只能屏蔽掉这些重复页面,才能把权重集中起来,当然,如果百度的数据库内存在网站大量的重复页面也不是一件好事,收录越多越好,但是不代表收录重复页面。 我们可以通过设置 robots.txt 来屏蔽掉搜索引擎蜘蛛来抓取这些页面:
User-agent: * Disallow: /*/feed Disallow: /*/*/feed Disallow: /wp-admin Disallow: /wp-content/plugins Disallow: /wp-content/themes Disallow: /wp-includes Disallow: /*/comment-page Disallow: /trackback/ Disallow: /*/trackback Disallow: /*?* Disallow: /index.php?p=* Disallow: /index.php/down_help/ Disallow: /index.php/feedbook/ Disallow: /index.php/archives/* Disallow: /index.php/down_help/page/* Disallow: /index.php?column=* Sitemap: http://www.wenjiangs.com/sitemap.xml
另外不要着急,一时半会肯定没有效果,需要等待搜索引擎更新。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论