screen-scraping

screen-scraping

文章 0 浏览 8

使用 phantomjs 或 pjscrape 的横幅刮刀

是否可以使用 phantomjs 或 pjscrape 允许用户输入 URL 并提取与该 URL 关联的所有横幅广告?…

护你周全 2025-01-06 01:30:43 6 0

从 ASP.NET webForm 获取数据

我对网络开发相当陌生,以前我从未做过任何屏幕抓取或网络爬行,但昨天我的一个朋友问我是否能够从 这个网站,不是我的,也不是他的,但数据是公开的…

无声情话 2025-01-05 17:58:06 2 0

从 python 中的 xpath 条目获取文本时遇到问题

我在网站 http://www.baseball- Reference.com/players/event_hr.cgi?id=bondsba01&t=b 并尝试从表中抓取数据。当我从一个条目中拉出 xpath 时,投手…

生生不灭 2025-01-04 21:20:30 3 0

使用 Python 抓取 RSS 提要

我是 Python 和编程的新手,所以如果问题非常愚蠢,请原谅我。 我一直在关注此 关于 RSS 逐步抓取的教程,但在尝试收集标题的相应链接时,我收到来自 …

泛泛之交 2025-01-04 16:27:58 2 0

仅获取网站的相关部分

Evernote 的 Web Clipper 插件 或 宣布插件仅获取相关文章/帖子/内容部分页面的?这是 Evernote 插件的屏幕截图: 无论您访问哪个网站,它都与其他布…

醉生梦死 2025-01-04 02:35:14 3 0

屏幕抓取记录未正确导入

我的屏幕抓取脚本(在 Rails 3.1 应用程序中)中有以下代码部分: # Add each row to a new call record page = agent.page.search("table tbody tr")…

残花月 2025-01-03 18:01:08 3 0

如何使用 Mechanize 抓取 HP 打印机状态页?

状态页面如下所示: http://h20000.www2.hp.com/bc/docs/support/SupportDocument/c00002742/c00004781.gif 您看到设备状态标题下方的文本了吗?这就…

夕色琉璃 2025-01-03 09:53:42 3 0

Mechanicalize 响应不返回任何内容

我正在 Python 中使用 Mechanize 来执行一些网络抓取。大多数网站都可以运行,但某一特定页面不会返回任何内容或响应。 我的设置是 self._browser = m…

泛滥成性 2025-01-03 08:45:27 3 0

从站点获取节点值,并仅重新输出可设置样式的选定节点标签

我正在抓紧我的头发试图让它与 php 一起工作。 问题:我只是想从网站上抓取产品并将它们显示为产品列表,而没有任何其他我可以在 css 中设置样式的内…

梦幻之岛 2025-01-03 06:06:20 4 0

解析:我可以获取Nokogiri中嵌入CSS背景的URL吗?

我正在解析的 HTML 包含表格中带有内联 CSS 的图像,我可以使用 Nokogiri 来确定 URL 组件吗,这是我想要解析的代码片段: tldr:我想获取.png 在此 h…

罗罗贝儿 2025-01-02 16:45:22 2 0

如何获得

XML 中的元素值?

XDocument coordinates = XDocument.Load("http://feeds.feedburner.com/TechCrunch"); System.IO.StreamWriter StreamWriter1 = new System.IO.Strea…

只是我以为 2025-01-02 13:30:11 3 0

如何使用 htmlagilitypack 抓取 xml 文件

我需要从 http://feeds.feedburner.com/Torrentfreak 中抓取 xml 文件的链接和描述。 我使用了这段代码: var webGet = new HtmlWeb(); var document …

心碎的声音 2025-01-01 21:33:14 2 0

XBMC 的 Python 脚本

我对编程和 Python 本身都是新手。我没有编程经验。我已经成功阅读了 Python 并完成了一些相当基本的 Python 教程,现在我已经为我的第一个 Python 项…

望喜 2025-01-01 17:43:36 6 0

用于屏幕抓取的 vt220 终端的 Java 模拟

我必须使用 Java 1.6 对 vt200 telnet 连接进行屏幕抓取。 我试图欺骗并使用带有InputStrem和OutputStream的简单telnet连接,但是服务器很挑剔,当它…

镜花水月 2025-01-01 17:38:02 1 0

仅获取 id 和 href

我的输出由多个 id 和 href 以及其他数据组成。 如何使用 Htmlunit 和 Java 代码获取所有 id 和 href 值? 我需要强制获取所有 href 值,但 id 不是强…

情绪失控 2025-01-01 15:02:03 4 0
更多

推荐作者

5040234068

文章 0 评论 0

樱花雨梦

文章 0 评论 0

≈。彩虹

文章 0 评论 0

雨轻弹

文章 0 评论 0

血之狂魔

文章 0 评论 0

qq_0bIjwE

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文