爬虫会跳过html小标签中包含的内容吗?

发布于 2024-11-29 20:47:58 字数 62 浏览 0 评论 0 原文

我想知道 small 标签是否向爬虫表明其内容不相关,因此它将被跳过并且不会被索引。

I was wondering whether the small tag indicates to crawlers that its content isn't relevant and so it will be skipped and not indexed.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

失而复得 2024-12-06 20:47:58

这取决于爬虫的实现。

我不知道有任何正式或非正式的标准表明标签会阻止内容被编入索引,并且似乎不是 rel="nofollow">讨论对索引内容的控制

最初的 Google 搜索引擎为较大的字体提供了额外的权重 - 因此您可能会期望使用较大的字体字体被认为相关,但这并不意味着较小的字体不会被索引。

没有标准可以防止页面的某些部分被索引。对于可能适用于某些引擎的方法,有 class="robots-nocontent" 是由雅虎引入的(我认为只有雅虎支持) - 所以不幸的是我不希望它能够在其他引擎上工作。

This is dependent on the crawler implementation.

I'm not aware of any formal or informal standard that small tags prevent content from being indexed, and it doesn't appear to be mentioned by major search engines when discussing control over what's indexed.

The original Google search engine gave extra weight to larger fonts - so you might expect a large font to be considered more relevant, but this doesn't mean that smaller fonts don't get indexed.

There is no standard for preventing parts of a page from being indexed. For an approach that might work on some engines, there is the class="robots-nocontent" which was introduced by (and I think only supported by) Yahoo - so unfortunately I wouldn't expect it to work across other engines.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文