robots.txt

robots.txt

文章 4 浏览 442

robots.txt 只允许root,禁止其他一切?

我似乎无法让它发挥作用,但它似乎非常基本。 我希望抓取域根目录, http://www.example.com 但没有其他可抓取的内容,并且所有子目录都是动态的 http…

长伴 2024-12-02 06:19:37 5 0

robots.txt 中的 noindex 有效吗?

noindex 是 robots.txt 文件中的可选指令,还是 user-agent、disallow、allow 和crawl-delay 是唯一的选项? 例如,这对于 robots.txt 文件的内容有效…

站稳脚跟 2024-12-01 20:25:17 7 0

此 robots.txt 代码会禁止所有搜索引擎吗?

我想知道此代码是否不允许每个搜索引擎扫描我的目录。 User-agent: * Disallow: / 此代码是否也使用新的 htlm 5 协议进行更新? 真的有用还是不再需要…

倾城°AllureLove 2024-12-01 04:10:52 5 0

我应该将实际的 .aspx 文件/路径放入 Robots.txt 或路由中吗?

我正在开发一个 asp.net (4.0) Web 表单应用程序,并为我的所有 URL 使用路由。 我不确定是否应该将条目放入我的 robots.txt 中,如下所示:( Disall…

皓月长歌 2024-12-01 01:32:55 5 0

这个robots.txt是什么意思?它不允许任何机器人吗?

User-agent: * Disallow: Disallow: /admin Disallow: /admin Sitemap: http://www.myadress.com/ext/sm/Sitemap_114.xml 我在我网站的根文件夹之一中…

夜无邪 2024-12-01 00:52:24 5 0

robots.txt 和相对路径

我想禁止我网站上任何 /tmp 文件夹中的任何文件。例如我有:“/anything/tmp/whatever/test.html”、“/stuff/tmp/old/test.html”、“/people/tmp/im…

初见终念 2024-12-01 00:48:49 4 0

我们是否应该将具有 htaccess 密码保护的文件夹放入 robots.txt 中?

我们想要禁止用户代理 JavaScript 文件、CSS 文件和图片,对吗?类、模块和其他此类类型的文件夹应受 htaccess 保护。我说得对吗?如果没有,请告诉我…

别忘他 2024-11-30 20:23:16 3 0

apache - 保护和隐藏管理文件夹的智能方法?机器人.txt? .htaccess?还有什么或者更好的吗?

如何保护和隐藏 /adminblah/ 文件夹免受机器人和用户的攻击,以便只有管理员知道它的存在? 1)要禁止机器人和机器人,我们可以使用robots.txt文件。 …

烟燃烟灭 2024-11-30 17:44:21 3 0

禁止机器人可以用 htaccess 绕过吗?

我有一个简单的问题。假设我在 robots.txt: 中有这样的内容 User-agent: * Disallow: / ,在 .htaccess: 中有类似的内容 RewriteRule ^somepage/.*$ i…

蛮可爱 2024-11-30 16:35:36 3 0

阻止 robots.txt 中的子目录

Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 12…

开始看清了 2024-11-30 03:24:44 2 0

TFS 2010 中文件的条件包含和排除

我们有 DEV / QA / Prod 站点,如下所示: dev: something.dev.org qa: something-qa.dev.org/ prod: something.org/ 理想情况下,我希望 TFS 中的某…

许一世地老天荒 2024-11-29 19:14:58 3 0

如果站点地图不在 robots.txt 中,有没有办法检测它?

我正在为一个项目开发一个简单的机器人,我注意到很多网站的 robots.txt 文件中没有站点地图。当然,可以选择简单地对有问题的网站建立索引并抓取所有…

夏至、离别 2024-11-29 09:40:22 7 0

当强制使用 SSL 时,如何排除某些文件夹不被 ASP.net 中的搜索引擎索引?

美好的一天, 我做了一些研究来寻找这个答案,但运气不佳。希望有人能提供帮助.. 情况是,我正在开发的一个网站(内置于 ASP.net)在其大部分页面上强…

铁轨上的流浪者 2024-11-29 07:35:21 3 0

阻止滥用机器人爬行?

这是个好主意吗? http://browsers.garykeith.com/stream.asp?RobotsTXT 滥用爬行是什么意思意思是?这对我的网站有什么坏处?…

糖果控 2024-11-29 05:55:54 5 0

TFS 2010 - 根据环境排除部署时的特定文件?

使用 VS 2010 和 TFS 2010。 有没有办法根据我要部署到的环境从构建定义/部署中排除某些文件? 这样做的主要目的是从开发/QA 部署中排除 robots.txt …

迎风吟唱 2024-11-28 06:07:03 5 0
更多

推荐作者

李珊平

文章 0 评论 0

Quxin

文章 0 评论 0

范无咎

文章 0 评论 0

github_ZOJ2N8YxBm

文章 0 评论 0

若言

文章 0 评论 0

南…巷孤猫

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文