robots.txt

robots.txt

文章 4 浏览 437

在网络抓取过程中如何保持网络礼貌(避免被禁止)?

网络机器人抓取您的网站并使用带宽资源。 机器人数量众多,用途广泛,从自制、大学研究、报废者、新创业公司到成熟的搜索引擎(可能还有更多类别) …

时光是把杀猪刀 2024-10-08 18:10:48 5 0

防止通过 .htaccess 直接访问 robots.txt

我想阻止用户访问我的 robots.txt 文件,但我仍然希望搜索引擎能够读取它。是否可以? 如果是的话我该怎么做?我相信如果我在 .htaccess 中编写以下内…

回心转意 2024-10-08 09:28:24 4 0

如何通过 robots.txt 排除特定文件夹

我想从搜索引擎的索引中排除任何文件夹中名为“ajax”的所有子文件夹。 示例: .com/a/ajax .com/b/ajax .com/c/ajax 这可以通过 robots.txt 实现吗?…

苦笑流年记忆 2024-10-02 02:16:17 2 0

Windows 服务器重定向问题

我正在处理一些使用 Windows 服务器的客户端,因此不支持 .htaccess 文件。这不是什么大问题,但我担心的是: 我在 .htaccess 文件中设置了一条规则,…

柠栀 2024-10-01 14:14:01 5 0

我可以允许(通过搜索引擎)对受限内容建立索引而不将其公开吗?

我有一个包含一些受限内容的网站。我希望我的网站出现在搜索结果中,但不希望它公开。 有没有一种方法可以允许爬虫爬行我的网站,但阻止它们将其公开…

说不完的你爱 2024-09-28 02:01:51 5 0

具有大量动态子域的站点的站点地图

我正在运行一个允许用户创建子域的网站。我想通过站点地图将这些用户子域提交给搜索引擎。但是,根据站点地图协议(和 Google 网站管理员工具),单个…

猫卆 2024-09-26 15:07:26 6 0

为什么谷歌索引这个?

可能的重复: 为什么 Google 将此索引编入索引? 在此网页中: http://www.alvolante.it/news/pompe_benzina_“truccate⠀_autostrada-308391044 …

末骤雨初歇 2024-09-26 13:09:53 5 0

为什么谷歌索引这个?

Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 13…

深海夜未眠 2024-09-26 11:35:53 3 0

如何阻止搜索引擎索引所有以 origin.domainname.com 开头的网址

我有 www.domainname.com、origin.domainname.com 指向相同的代码库。有没有办法,我可以阻止所有基本名称 origin.domainname.com 的 url 被索引。 ro…

栩栩如生 2024-09-26 10:52:03 4 0

robots.txt 如何禁止除站点地图中的 URL 之外的所有 URL

Closed. This question is not about programming or software development. It is not currently accepting answers. 这个问题似乎不是关于特定的编…

把回忆走一遍 2024-09-25 23:48:56 2 0

机器人.txt;什么编码?

Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章来更新问题,使其仅…

倒数 2024-09-25 23:04:39 7 0

robots.txt 和 .htaccess 中的 Mod 重写

在 robots.txt 文件中,我将禁止网站的某些部分。 例如,我不希望我的“条款和条件”被搜索引擎索引。 User-agent: * Disallow: /terms 该文件的真实…

雪化雨蝶 2024-09-25 17:26:15 4 0

spring SimpleUrlHandlerMapping 到 robots.txt

我正在使用 spring 框架,以下是 url 到控制器的映射 &ltbean id="urlMapping" class="org.springframework.web.servlet.handler.SimpleUrlHandlerMap…

风尘浪孓 2024-09-25 12:28:51 5 0

即使使用 htaccess 重定向,googlebot 也会索引我的 index.php 吗?

在我的 htaccess 文件中使用重定向语句,在地址栏中输入以下内容的人... http://example.com/index.php ...将被重定向到... http://example.com/ 我的…

巨坚强 2024-09-25 07:20:29 6 0

这个 robots.txt 是否只允许 googlebot 为我的网站建立索引?

此 robots.txt 文件是否只允许 googlebot 索引我网站的 index.php 文件?注意,我有一个 htaccess 重定向,输入 http://www.example.com/index.php 的…

下壹個目標 2024-09-25 06:29:18 6 0
更多

推荐作者

烙印

文章 0 评论 0

singlesman

文章 0 评论 0

独孤求败

文章 0 评论 0

晨钟暮鼓

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文