Google不索引网站 - 说'由Robots.txt' - 但是robots.txt允许所有爬行者 - 两个不同的托管服务的相同问题
我已经构建并发布了很多网站,但从未遇到以下问题: Google没有索引我的网站。每当我提交页面(在Google搜索控制台中)时,它都会说“ 被robots.txt …
nuxt.js robots.txt文件多重限制每个用户代理
使用nuxts nuxt-robots 模块如何配置每个用户代理的多项删除。目前我有: robots: () => { return { UserAgent: '*', Disallow: '/search/', Sitemap:…
robots.txt和htaccess(而CMS处于子折叠器中)
我的CMS放置在子文件夹中,因此通过.htaccess i将所有内容转发。对CMS有益,并且以下摘要无问题,但对诸如robots.txt之类的文件不利,必须存储在Web根…
什么是在Sveltekit项目中添加robots.txt文件的最佳方法?
官方 sveltekit docs 关于SEO主题端点。我找不到与robots.txt文件相关的其他文档,这些文档可用于引用Web Crawlers和SEO优化的站点地图。 我也看了其…
在robots.txt中不允许目录时,我应该使用尾随的斜线吗?
我想禁止在 robots.txt 中使用目录/acct 的爬网我应该使用哪个规则? disallow:/acct 或 disallow:/acct/ acct 都包含子直销和文件。拖尾的效果是什…
如何解析具有压缩链接的站点地图索引
我编写了一个程序,该程序读取页面的 /robots.txt 和 /sitemap.xml 并减去可用的站点地图并将它们存储在 siteMapsUnsorted 列表中。 到达那里后,我使…
robots.txt 中可以使用域名吗?
我们在 dev.example.com 有一个开发服务器,正在被 Google 索引。我们使用 AWS Lightsail 将开发服务器全部复制到我们的生产环境 - dev.example.com …
在 robots.txt 中,仅允许抓取共享主机上的子域而不是子目录?
我刚刚更改了 DNS 设置,因此文件夹 /forum 现在是子域而不是子目录。如果我创建一个 robots.txt 文件并说: User-agent: * Disallow: /forum 这会禁…
Robots.TXT 和元标签机器人
Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 12…
忽略 robots.txt 中带有特定参数的 URL?
我希望 Google 忽略这样的网址: http://www.mydomain.example/new-printers?dir=asc&order=price&p=3 换句话说,所有应忽略参数 dir、order 和 price…
上传robots.txt到根文件夹失败
我想阻止机器人索引我的网站。我创建了一个包含以下内容的 robots.txt 文件: User-agent: * Disallow: / 现在我必须将此文件放置在我网站的根文件夹…
WordPress 博客的 robots.txt (不允许 /blog/page/... 但允许抓取所有帖子的链接?)
我有一个非常幼稚的问题,我找不到答案。 我有一个 WordPress 博客。 所有帖子都列在几个页面中,例如 mydomain.com/blog/ mydomain.com/blog/page/2/…