screen-scraping

screen-scraping

文章 0 浏览 5

无法让 Scrapy 跟踪链接

我正在尝试抓取一个网站,但无法使用 scrapy 来跟踪链接,也没有收到任何 Python 错误,而且 Wireshark 也没有看到任何情况。我认为这可能是正则表达…

南冥有猫 2024-11-29 06:01:55 1 0

查询后无法获取整个网页

我正在尝试抓取此页面上找到的历史 NAVPS 表: http://www.philequity.net/pefi_historicalnavps.php 这里所有的代码都是以下内容我的最小工作脚本。…

难得心□动 2024-11-28 11:08:06 1 0

不使用键盘如何截图? (Java 和 VMWare 的问题)

我面临一个小问题。 我在 VMWare 中有一个虚拟操作系统,我需要对其进行屏幕截图。 我必须能够从原始操作系统中截取屏幕截图(我的软件在原始操作系统…

三岁铭 2024-11-28 10:38:52 2 0

如何使用Python mechanize保存页面,包括页面上的图像

所以我明白 mechanize 可以使 python 脚本的行为与浏览器完全相同。 使用浏览器,我可以将加载的页面保存到本地磁盘,包括页面中的图像 我怎样才能用…

乙白 2024-11-28 10:34:28 0 0

使用 ruby​​(clojure 或 javascript)保存输入网页

我有一个问题。我正在与一家食品供应商合作,我需要将每个订单的内容保存为 html。订单在单个页面上以链接形式列出,但这有两个困难 页面使用身份验证…

怂人 2024-11-28 10:10:20 0 0

屏幕抓取 ASP.NET 页面无法正常工作

我正在尝试在以下站点的页面上恢复日历事件: http://www.wphospital.org/News-Events/Calendar-of-Events.aspx 请注意,该网站有一个名为“Month”的…

自我难过 2024-11-28 00:03:51 1 0

从与代码相同的页面获取 +1 数据

有没有什么编码方法可以从当前网站获取+1数据?例如,我知道 Google 的 +1 还没有 API,但是有没有办法搜索在与 php 相同的页面上发布数据的字符串? …

看春风乍起 2024-11-27 21:02:30 0 0

python mechanize 与 selectcontrol 的问题

可以从中进行选择 基本上,其中一个选择控件有一些“选项”,如果我使用, for t in br.forms(): print t :我得到的输出 `SelectControl(ctl00$cph2$…

浅沫记忆 2024-11-27 18:46:44 3 0

Windows 上带有 scrapyt 的 Ruby 1.9.2

在Windows上使用scrubyt和Ruby 1.9.2,在调用Scrubyt::Extractor.define do时出现以下错误 C:/Ruby192/lib/ruby/gems/1.9.1/gems/activesupport-3.0.9…

以歌曲疗慰 2024-11-26 20:30:32 3 0

试图从新闻网站上抓取 Flash 视频

我应该如何从该网站上删除此 Flash 视频 - http://www.wmur .com/chronicle/28559748/detail.html - 我已经尝试了一切…

自由如风 2024-11-26 01:15:09 0 0

使用主机操作系统 java 应用程序 (java Robot) 截取 VMware 虚拟操作系统的屏幕截图

我开发了一个java应用程序,它使用机器人截屏(按“打印屏幕”)。问题是,如果我迁移到 VMware 的虚拟操作系统,它将无法工作。正在运行的 Java 应用…

不弃不离 2024-11-25 21:12:41 3 0

HTML 解析 - 从 div 内的表格获取数据?

我对 HTML 解析/抓取的整个想法还比较陌生。我希望我能来这里获得我需要的帮助! 基本上我想要做的(我认为)是指定我希望从中获取数据的页面的 url。…

小矜持 2024-11-25 20:43:30 0 0

在htmlunit中过滤外部加载的javascript

在使用 htmlunit 抓取网页时,我偶尔会注意到控制台输出中出现类似这样的警告。 Jul 24, 2011 5:12:59 PM com.gargoylesoftware.htmlunit.javascript.…

演多会厌 2024-11-25 18:16:20 0 0

支持 JS 的 Html 抓取

我正在尝试抓取公司网页以实现自动化目的,但页面中的嵌入式脚本阻止我完全复制请求。最大的痛苦在于脚本生成的cookie。 我想过使用 Watin 自动化 IE…

药祭#氼 2024-11-25 08:52:02 0 0

如何使用 ruby​​ 中的 mechanize 将字符串插入到文本字段?

我知道这是一个非常简单的问题,但我已经被困了一个小时,我只是不明白这是如何工作的。 我需要从学校图书馆中抓取一些内容,因此需要将“CE”插入文…

放手` 2024-11-25 08:40:54 2 0
更多

推荐作者

Gabu-gabumon

文章 0 评论 0

qq_CgiN62

文章 0 评论 0

荔枝明

文章 0 评论 0

¤→小豸慧

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文