robots.txt

robots.txt

文章 4 浏览 438

WordPress 博客的 robots.txt (不允许 /blog/page/... 但允许抓取所有帖子的链接?)

我有一个非常幼稚的问题,我找不到答案。 我有一个 WordPress 博客。 所有帖子都列在几个页面中,例如 mydomain.com/blog/ mydomain.com/blog/page/2/…

云归处 2024-12-23 13:27:23 0 0

如何为 LWP::RobotUA 指定自己的 robots.txt 规则

我编写了一个脚本来使用 LWP::RobotUA 检查我自己的网站。我想避免频繁请求我的 robots.txt。 LWP::RobotUA 的规则参数应该允许我指定这些,但我不太…

可是我不能没有你 2024-12-22 14:17:47 1 0

如何使用通配符阻止机器人对此进行索引?

我有以下 URL 格式: example.com/page/m6aoeh/embed 想阻止任何机器人使用 URL /page/*/embed 索引任何页面 我 我假设有某种方法可以阻止通配符 URL…

趴在窗边数星星i 2024-12-21 07:24:13 1 0

Google 仍然将我的域名编入索引吗?

我有一个像下面这样的 robots.txt,但 Google 仍然为我的域名编制了索引。基本上他们已经索引了 mydomain.com 但没有索引 mydomain.com/any_page User…

静赏你的温柔 2024-12-21 03:32:53 1 0

从我的登录页面上的搜索引擎中删除抓取

我有一个登录页面(login.aspx),当有人进行搜索时,该页面当前已在谷歌中编入索引。 我创建了一个 robots.txt 文件,其中包含以下内容: User-agent…

倾城泪 2024-12-21 03:20:53 1 0

机器人.txt 文件

我有一个我想限制搜索引擎访问的网址: 以下内容是否可以接受: User-agent: * Disallow: https://mysite.com/ 或者我是否需要输入更像: User-agent:…

旧情别恋 2024-12-21 00:32:11 0 0

WordPress 机器人

Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 12…

若相惜即相离 2024-12-20 18:31:13 0 0

请求机器人重新解析 robots.txt

我正在编写一个代理服务器,将 youtube.com 映射到另一个域(这样用户就可以轻松地从德国等国家/地区访问 youtube,而无需审查搜索结果和视频)。 不…

涫野音 2024-12-20 08:05:12 0 0

网络爬虫 - 忽略 Robots.txt 文件?

有些服务器有 robots.txt 文件,以阻止网络爬虫爬行其网站。有没有办法让网络爬虫忽略robots.txt文件?我正在使用 Python 的 Mechanize。…

夏了南城 2024-12-19 17:16:52 0 0

对于 Scrapy 抓取工具来说,尊重 robots.txt 中的抓取延迟的最简单方法是什么?

是否有一个我可以切换的设置或我可以使用的 DownloaderMiddleware 来强制 robots.txt 的抓取延迟设置?如果没有,如何在抓取工具中实施速率限制?…

半﹌身腐败 2024-12-19 14:46:32 0 0

Liferay“当前 URL/robots.txt:无 VirtualHost”例外

大家好,社区,我最近几天集中精力将 opensocial 实施到 liferay 中,但由于我是 liferay 门户的新手,而且门户文档非常糟糕,所以我还有一些问题。 …

北城挽邺 2024-12-18 22:29:57 0 0

防止搜索引擎索引网页

我有一个会员控制面板页面,我不希望搜索引擎对其进行索引。 我执行了以下操作: 页面是安全的,如果没有提供会话或密码,则将用户引导至主页。重定向…

余厌 2024-12-18 03:43:28 2 0

如何读取txt文件并存储在NSArray中?

我正在尝试读取 txt 文件并将其存储在 NSArray 中。这是我的代码,但似乎缺少一些我不知道的东西! NSURL *url=[NSURL URLWithString:@"http://www.go…

孤檠 2024-12-18 02:50:11 0 0

使用Sphider搜索引擎和robots.txt

我已经在我正在开发的网站上安装了 Sphider 1.3.5 搜索引擎。我正在一台共享主机(Dreamhost)上工作,除了一个问题外,一切似乎都安装良好并且工作正…

一场信仰旅途 2024-12-17 11:52:01 0 0

谷歌机器人是否从 javascript document.write() 索引文本?

假设我有这个: var p = document.getElementById('cls'); p.firstChild.nodeValue = 'Some interesting information'; 那么,谷歌机器人是否会索引文…

一张白纸 2024-12-17 08:38:01 1 0
更多

推荐作者

三岁铭

文章 0 评论 0

alipaysp_VP2a8Q4rgx

文章 0 评论 0

拧巴小姐

文章 0 评论 0

1649543945

文章 0 评论 0

深居我梦

文章 0 评论 0

tongsw

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文