当前位置：文江博客话题详情

机器人网络质量

发布于 2024-08-09 19:53:31 字数 166 浏览 15 评论 0原文

我正在寻找一个好的开源机器人来确定谷歌索引通常需要的一些质量。

例如，

找到重复的标题
无效链接（jspider 会这样做，我认为更多的会这样做）
完全相同的页面，但不同的网址
等，其中等等于谷歌质量要求。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

趴在窗边数星星i 2024-08-16 19:53:31

您的需求非常具体，因此不太可能有一个开源产品能够完全满足您的需求。

然而，有许多用于构建网络爬虫的开源框架。您使用哪一种取决于您的语言偏好。

例如：

对于 Python，请尝试 Scrapy
对于 Java，请尝试 Arachnid
对于 Ruby，尝试 Anemone
对于 Perl，尝试 WWW::Spider

一般来说，这些框架都会提供用于爬取和抓取的类根据您给出的规则抓取网站的页面，然后由您通过挂钩自己的代码来提取所需的数据。

回复收藏 0 原文

最笨的告白 2024-08-16 19:53:31

Google 网站站长工具是一项基于网络的服务（而不是一个按需机器人），它不会做你所要求的所有事情 - 但它确实做了其中一些事情以及许多你没有要求的事情，而且 - 来自 Google - 它无疑符合你的要求奇怪的“等等，其中等等于谷歌质量要求。”比其他任何地方都好。

回复收藏 0 原文

~没有更多了~

关于作者

じее

暂无简介

文章

27 人气

关注发私信

alipaysp_snBf0MSZIv

文章 0 评论 0

关注

梦断已成空

文章 0 评论 0

关注

瞎闹

文章 0 评论 0

关注

凯凯我们等你回来

文章 0 评论 0

关注

寄意

文章 0 评论 0

关注

似梦非梦

文章 0 评论 0

友情链接

文江博客

机器人网络质量

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签