screen-scraping

screen-scraping

文章 0 浏览 4

Python 中的屏幕抓取

我目前正在尝试屏幕抓取一个网站以将信息放入字典中。我正在使用 urllib2 和 BeautifulSoup。我不知道如何解析网页源信息以获取我想要的内容并将其读…

要走就滚别墨迹 2024-10-04 11:26:57 0 0

约德利如何运作?

Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 11…

锦爱 2024-10-04 09:01:50 6 0

HtmlUnit 的替代方案

迄今为止,我一直在研究可用的无头浏览器,发现 HtmlUnit 的使用非常广泛。与 HtmlUnit 相比,我们是否有任何具有可能优势的 HtmlUnit 替代方案? 谢…

栖竹 2024-10-04 02:22:45 4 0

Python 3.x 的机械化

有什么方法可以将 Mechanize 与 Python 3.x 一起使用吗? 或者有什么可以在 Python 3.x 中工作的替代品吗? 我已经搜索了几个小时,但没有找到任何东…

笑红尘 2024-10-03 23:12:40 5 0

PHP - 如何编写代码来登录网站?

我想编写一个 PHP 脚本,该脚本将访问一个网站,输入我的用户名和密码,然后检索数据。我可以获得哪些 PHP 函数或类来实现此目的? 我已经尝试过 PHP …

反目相谮 2024-10-03 04:23:47 0 0

通过使用 jQuery 排除其他 div 来从 div 获取 HTML

我们需要为我们的系统抓取博客文章的正文(这是合法的,我发誓 - 我们有一个培训博客,我们希望在系统内的帮助对话框中显示内容)。这些博客是在生成 …

北城半夏 2024-10-02 22:24:54 3 0

“现场抓取”在Windows中

我想为某些 Windows 应用程序开发一个审核应用程序。我想从 MessageBoxes、Windows、Forms、Selections 等中获取文本,理想情况下我想用 C++ 进行编程…

如梦亦如幻 2024-10-02 18:08:39 5 0

BeautifulSoup 对 jQuery 脚本感到窒息,有什么已知的解决方法吗?

我给 BeautifulSoup 一个 html 文档,只需用完整的 html 构造一个 BeautifulSoup 对象实例,它似乎就会被嵌入 html 中的 jQuery 脚本的以下行阻塞: v…

冷︶言冷语的世界 2024-10-02 05:29:47 2 0

如何从浏览器中筛选表单结果

我有一个客户正在使用第三方网络软件。在一个屏幕上,我的客户填写了一张表格。在提交之前,他想要运行一些程序来捕获他输入的内容并将其插入到 csv …

不必了 2024-10-02 01:11:51 3 0

asp.net/ C# 屏幕缩放很容易完成吗?

使用 C# 和 .net 4.0 进行屏幕抓取的最简单方法是什么? 我可以重用他们的库吗?我想我听说过一个 html 工具包,但现在找不到它......…

(り薆情海 2024-10-01 12:44:31 1 0

PHP file_get_html 的奇怪问题

您好,我正在尝试使用 simple_html_dom 进行文本(网站)集群项目,但我遇到了一个奇怪的问题。当我在外循环内使用 echo 时,url 和片段是您所期望的…

走过海棠暮 2024-10-01 02:49:55 2 0

C# 屏幕抓取使用 POST 处理登录控件

我正在尝试使用屏幕抓取登录网站,但遇到困难。 private static string GetWebRequestContent(Uri uri) { string sid = String.Empty string userName…

岁月流歌 2024-09-30 20:33:40 2 0

抓取需要使用 Mechanize 启用 Javascript 的网站美丽汤 (Python)

所以..我得到了这个网站,我正在尝试抓取,但据我了解缺乏支持 .js 的机械化,以及需要支持 JavaScript 的浏览器的顽固网站是 不是一个很好的组合... …

夜灵血窟げ 2024-09-30 14:18:11 4 0

网页抓取(流行网站的 HTML 格式)

如何抓取任何网站来为我的网站创建提要?最流行的网站遵循什么格式?…

自此以后,行同陌路 2024-09-30 05:52:32 6 0

需要使用 CURL 登录网站的帮助

我在使用 CURL 登录网站时遇到一些问题。 我认为我的问题与 cookie 文件有关。 我在登录时使用 cookiejar 来收集信息,然后 我使用 cookiefile 来检索…

梦言归人 2024-09-30 03:09:08 4 0
更多

推荐作者

烙印

文章 0 评论 0

singlesman

文章 0 评论 0

独孤求败

文章 0 评论 0

晨钟暮鼓

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文