ASP.NET 网页抓取超时问题

发布于 2024-10-10 18:02:57 字数 177 浏览 4 评论 0原文

我正在尝试实现一个网络抓取爬虫作为我的 ASP.NET MVC 项目的一部分。它使用 Html Agility Pack 处理从不同 URL 收集的大数据。问题是,当我想实际运行该功能时,一分钟后我从远程服务器收到“连接已重置”。当我在本地运行它时,我得到了更好的结果。我可以访问远程 IIS。有什么建议来解决这个问题和/或任何替代方案吗?

I'm trying to implement a web scraping crawler as a part of my ASP.NET MVC project. It works with large data gathered from different URLS using Html Agility Pack. The problem is when I want to actually run the function I get "The connection was reset" from remote server after a minute. I'm getting better result when I run it locally. I have access to remote IIS. Any suggestion to solve this problem and/or any alternatives?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

时光无声 2024-10-17 18:02:57

如果 ASP.NET 中有一个长时间运行的进程,最好让它在不同的线程上运行。

请参阅 - 相关问题和这篇 MSDN 文章。

If you have a long running process in ASP.NET, it is best to let it run on a different thread.

See this and this - related questions and this MSDN article.

诗化ㄋ丶相逢 2024-10-17 18:02:57

连接和网络问题可能会导致此类问题。为了避免阻止抓取其他 URL,您可以将工作并行化到单独的线程中。

Connection and network problems could result in such problems. To avoid blocking scraping of other urls you could parallelize the work into separate threads.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文