当前位置：文江博客话题详情

需要帮助来构建“机器人”从 HTTP 请求中提取数据

发布于 2024-12-09 20:33:49 字数 207 浏览 0 评论 0原文

我正在使用 ASP.net 和 C# 构建一个网站，其组件之一涉及代表用户登录用户拥有帐户的网站（例如移动电话公司），从该网站获取信息并存储它在我们的数据库中。

我觉得这个动作叫“刮”。

是否有任何产品已经可以与我的软件集成？

我不需要可以执行此操作的软件，我需要某种可以与我的 C# 代码集成的 SDK。

谢谢，

科比

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

触ぅ动初心 2024-12-16 20:33:49

使用 HtmlAgilityPack 解析登录后从 Web 请求中获取的 HTML。

请参阅此处用于登录：通过 C# 登录网站

回复收藏 0 原文

夜还是长夜 2024-12-16 20:33:49

到目前为止我还没有找到任何产品可以做到这一点。
处理这个问题的一种方法是
- 自行执行请求
- 使用 http://htmlagilitypack.codeplex.com/ 从下载的 html 中提取重要信息
- 自行保存提取的信息

事实是，根据上下文，有很多东西需要调整/配置，您需要非常大的产品，但它仍然无法达到自定义解决方案的性能/准确性：
a) 多线程控制
b) 提取规则
c) 持久性控制
d) 网络蜘蛛（或者如何选择下一个要解析的链接）

回复收藏 0 原文

巷子口的你 2024-12-16 20:33:49

检查网页抓取维基百科条目。

不过我想说，由于我们需要通过网络抓取获取的内容是特定于应用程序的，因此大多数时候，从网络响应流中抓取您需要的任何内容可能会更有效。

回复收藏 0 原文

~没有更多了~

关于作者

一城柳絮吹成雪

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

需要帮助来构建“机器人”从 HTTP 请求中提取数据

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

需要帮助来构建“机器人”从 HTTP 请求中提取数据

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。