当前位置：文江博客话题详情

Googlebot C# web-crawler bots

C# 基于网络的爬虫

发布于 2024-11-26 08:11:13 字数 416 浏览 0 评论 0原文

我有几个关于爬虫的问题。

我可以创建一个纯粹在网络上运行的爬虫吗？我的意思是，一个可以从网络项目的管理页面启动或停止的爬虫。
用什么语言编写爬虫最方便？我本来打算用c#来写。
最重要的一点：爬虫是如何工作的？我的意思是，我知道您通过使用 HttpWebRequest 和 HttpWebResponse 创建它们，并且我猜想在每次页面访问后，爬虫都会回来并且代码将评估然后创建一个队列将爬虫发送到其他网站。所以基本上如果这个信息是真的，考虑到我将使用一个网络项目创建爬虫，我应该保持页面始终处于打开状态吗？爬虫对服务器的负担有多大？它会减慢服务器的速度还是它的工作量相对较小？

我知道，这里有很多问题，我非常感谢您的回答:)

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

已下线请稍等 2024-12-03 08:11:14

1）爬虫绝对可以在网络上正常工作。您的爬网程序可以是 ASP.NET 应用程序，或者您的管理页面可以启动或停止服务器上的任务（网络爬网程序）。

2) VB.NET 或 C# 都可以。他们都有大量用于网络工作的库。

3）我想你正在寻找的是一个递归函数。首先，选择互联网上的一个页面（包含很多链接）。对于页面中的每个链接，再次运行爬虫的 main 方法。一遍又一遍地这样做。您可能需要限制爬行的“深度”。我想您也想在每个页面中做一些工作。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

醉城メ夜风

文章 0 评论 0

远昼

文章 0 评论 0

平生欢

文章 0 评论 0

微凉

文章 0 评论 0

Honwey

文章 0 评论 0

qq_ikhFfg

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文