当前位置：文江博客话题详情

JavaScript Python asp.net screen-scraping

如何抓取将所有交互都作为回发进行的 ASP.NET 站点？

发布于 2024-10-30 06:26:40 字数 412 浏览 3 评论 0原文

我使用 Python 为 ASP.NET 站点（特别是 Jenzabar 课程搜索 portlet）构建了一个抓取工具，它将创建一个新会话、加载第一个搜索页面，然后通过回发所需字段来模拟搜索。然而，有些事情发生了变化，我不知道是什么，现在我得到了对所有内容的 HTTP 500 响应。我可以看到浏览器的 POST 数据中没有新字段。

理想情况下，我想弄清楚如何修复我自己的抓取工具，但是如果不包含大量特定上下文，这可能很难在 StackOverflow 上询问，所以我想知道是否有一种方法可以将页面视为黑匣子，并且只需在我想要的回发链接上触发单击事件，然后获取结果的 HTML。

我在这里看到了一些关于使用 JavaScript 进行抓取的答案，但它们似乎主要关注等待 JavaScript 加载，然后返回页面的规范化表示。我想模拟浏览器实际单击链接并遵循相同的路径来执行请求。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

混吃等死 2024-11-06 06:26:40

在不知道任何细节的情况下，我的预感是您正在使用硬编码的会话 ID，并且 Web 服务器的应用程序域回收并创建了新的加密/解密密钥，从而使您的硬编码会话 ID（由旧密钥加密）无用。

回复收藏 0 原文

寄风 2024-11-06 06:26:40

您可以尝试使用 Firebugs NET 选项卡来监视所有请求，手动浏览，然后将您生成的请求与屏幕抓取工具生成的请求进行比较。

回复收藏 0 原文

忆依然 2024-11-06 06:26:40

如果您只是想模拟负载，您可能需要查看类似 selenium 的东西，它通过浏览器运行并像浏览器一样处理回发。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

苍风燃霜

文章 0 评论 0

我的黑色迷你裙

文章 0 评论 0

悸初

文章 0 评论 0

撧情箌佬

文章 0 评论 0

森罗

文章 0 评论 0

lyn1245

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文