robots.txt

robots.txt

文章 4 浏览 437

robots.txt 的 Spider 间隔

我一直在阅读有关网络爬行的内容,并得到了一份包含所有注意事项的列表,但是有一个问题我还没有找到任何讨论。 对于任何给定网站,robots.txt 应该多…

老街孤人 2024-10-20 21:24:37 0 0

Robots.txt,如何只允许访问域根目录,而不允许更深层次的访问?

Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 12…

小清晰的声音 2024-10-20 20:52:56 0 0

如何在 Google Analytics 中细分和过滤机器人流量?

Google Analytics 会自动过滤掉一些机器人流量(例如来自 Googlebot 和 Bing 机器人),但一些执行 JavaScript 的智能机器人在 GA 报告中会像普通用户…

网名女生简单气质 2024-10-20 16:40:20 2 0

robots.txt 带有 Disallow 和允许的元标记

我负责一个具有基本 URL 的网站,例如: https://hello.world.com/my-site/ 在 https://hello.world.com/robots 中有一个 robots.txt 文件.txt 包含以…

晨敛清荷 2024-10-18 17:40:49 3 0

如何防止 Bing 不定期地淹没我的网站?

Bingbot 每天会在几个小时内非常频繁地访问我的网站,而在其余时间里会非常轻松。 我要么想平滑其爬行,降低其速率限制,要么完全阻止它。它并没有真…

合久必婚 2024-10-16 21:24:01 4 0

配置 IIS 以对 https 请求使用不同的 robots.txt

如何在 IIS 7 中为 https 请求使用与用于 http 连接的 robots.txt 不同的 robots.txt? 谢谢。…

思念满溢 2024-10-16 10:16:51 0 0

多个 sitemaps.xml ,多个网站但单个主机

现在: 我有一个网站池,它是通过在 IIS 中的单个主机上使用不同的 css 和实现,以 ASP classic 和 vbscript 开发的。 他们的 sitemap.xml 彼此不同,…

剪不断理还乱 2024-10-15 22:54:33 1 0

子目录中的 robots.txt

我有一个项目位于主域下方的文件夹中,并且我无权访问域本身的根目录。 http://mydomain.com/myproject/ 我想禁止在子文件夹“forbidden”上建立索引 …

捶死心动 2024-10-14 18:57:10 2 0

robots.txt:用户代理:Googlebot不允许:/ Google仍在索引

看一下这个网站的robots.txt: fr2.dk/robots.txt 内容是: User-Agent: Googlebot Disallow: / 那应该告诉谷歌不要索引该网站,不是吗? 如果属实,…

∞琼窗梦回ˉ 2024-10-14 01:39:59 0 0

使用 robots.txt 阻止 /?param=X

我使用 WordPress 创建了一个网站,第一天它充满了虚拟内容,直到我上传了我的内容。 Google 索引页面,例如: www.url.com/?cat=1 现在这些页面不存…

三五鸿雁 2024-10-13 10:45:11 3 0

让 google 从 javascript 生成的内容中索引链接

在我的网站上,我有一个通过 jquery ajax 调用生成的目录,随后创建了 html。 据我所知,goole 和其他机器人在页面加载后不知道 dom 更改,并且不会索…

对风讲故事 2024-10-12 21:33:49 2 0

Robots.txt 用法

Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 12…

等待圉鍢 2024-10-12 02:58:20 1 0

用户代理字符串是否必须与我的服务器日志中显示的完全相同?

使用 Robots.txt 文件时,用户代理字符串是否必须与服务器日志中显示的完全相同? 例如,当尝试匹配 GoogleBot 时,我可以只使用 googlebot 吗? 另外…

没︽人懂的悲伤 2024-10-11 21:53:01 4 0

阻止搜索引擎索引开发网站

我认为我的一个网站最近从谷歌中除名,因为它发现并开始索引我的开发网站。它基本上是我的主网站的复制品。 (dev.site.com 和 site.com) 无论如何,…

青朷 2024-10-11 10:25:16 1 0

Googlebot 用子域替换 Rails 应用程序的链接

我有这个 Rails 应用程序,域名为 abc.com。我还有一个单独的 Piwik 统计子域,在此子域 stats.abc.com 中。 Googlebot 也以某种方式列出了一些与我的…

盗心人 2024-10-09 16:14:48 1 0
更多

推荐作者

烙印

文章 0 评论 0

singlesman

文章 0 评论 0

独孤求败

文章 0 评论 0

晨钟暮鼓

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文