第 4 页 - screen-scraping

投稿关注

screen-scraping

文章 0 浏览 8

使用 phantomjs 或 pjscrape 的横幅刮刀

是否可以使用 phantomjs 或 pjscrape 允许用户输入 URL 并提取与该 URL 关联的所有横幅广告？…

护你周全 2025-01-06 01:30:43 6 0

从 ASP.NET webForm 获取数据

我对网络开发相当陌生，以前我从未做过任何屏幕抓取或网络爬行，但昨天我的一个朋友问我是否能够从这个网站，不是我的，也不是他的，但数据是公开的…

无声情话 2025-01-05 17:58:06 2 0

从 python 中的 xpath 条目获取文本时遇到问题

我在网站 http://www.baseball- Reference.com/players/event_hr.cgi?id=bondsba01&t=b 并尝试从表中抓取数据。当我从一个条目中拉出 xpath 时，投手…

生生不灭 2025-01-04 21:20:30 3 0

使用 Python 抓取 RSS 提要

我是 Python 和编程的新手，所以如果问题非常愚蠢，请原谅我。我一直在关注此关于 RSS 逐步抓取的教程，但在尝试收集标题的相应链接时，我收到来自 …

泛泛之交 2025-01-04 16:27:58 2 0

仅获取网站的相关部分

Evernote 的 Web Clipper 插件或宣布插件仅获取相关文章/帖子/内容部分页面的？这是 Evernote 插件的屏幕截图：无论您访问哪个网站，它都与其他布…

醉生梦死 2025-01-04 02:35:14 3 0

屏幕抓取记录未正确导入

我的屏幕抓取脚本（在 Rails 3.1 应用程序中）中有以下代码部分： # Add each row to a new call record page = agent.page.search("table tbody tr")…

残花月 2025-01-03 18:01:08 3 0

如何使用 Mechanize 抓取 HP 打印机状态页？

状态页面如下所示： http://h20000.www2.hp.com/bc/docs/support/SupportDocument/c00002742/c00004781.gif 您看到设备状态标题下方的文本了吗？这就…

夕色琉璃 2025-01-03 09:53:42 3 0

Mechanicalize 响应不返回任何内容

我正在 Python 中使用 Mechanize 来执行一些网络抓取。大多数网站都可以运行，但某一特定页面不会返回任何内容或响应。我的设置是 self._browser = m…

泛滥成性 2025-01-03 08:45:27 3 0

从站点获取节点值，并仅重新输出可设置样式的选定节点标签

我正在抓紧我的头发试图让它与 php 一起工作。问题：我只是想从网站上抓取产品并将它们显示为产品列表，而没有任何其他我可以在 css 中设置样式的内…

梦幻之岛 2025-01-03 06:06:20 4 0

解析：我可以获取Nokogiri中嵌入CSS背景的URL吗？

我正在解析的 HTML 包含表格中带有内联 CSS 的图像，我可以使用 Nokogiri 来确定 URL 组件吗，这是我想要解析的代码片段： tldr：我想获取.png 在此 h…

罗罗贝儿 2025-01-02 16:45:22 2 0

如何获得
XML 中的元素值？

XDocument coordinates = XDocument.Load("http://feeds.feedburner.com/TechCrunch"); System.IO.StreamWriter StreamWriter1 = new System.IO.Strea…

只是我以为 2025-01-02 13:30:11 3 0

如何使用 htmlagilitypack 抓取 xml 文件

我需要从 http://feeds.feedburner.com/Torrentfreak 中抓取 xml 文件的链接和描述。我使用了这段代码： var webGet = new HtmlWeb(); var document …

心碎的声音 2025-01-01 21:33:14 2 0

XBMC 的 Python 脚本

我对编程和 Python 本身都是新手。我没有编程经验。我已经成功阅读了 Python 并完成了一些相当基本的 Python 教程，现在我已经为我的第一个 Python 项…

望喜 2025-01-01 17:43:36 6 0

用于屏幕抓取的 vt220 终端的 Java 模拟

我必须使用 Java 1.6 对 vt200 telnet 连接进行屏幕抓取。我试图欺骗并使用带有InputStrem和OutputStream的简单telnet连接，但是服务器很挑剔，当它…

镜花水月 2025-01-01 17:38:02 1 0

仅获取 id 和 href

我的输出由多个 id 和 href 以及其他数据组成。如何使用 Htmlunit 和 Java 代码获取所有 id 和 href 值？我需要强制获取所有 href 值，但 id 不是强…

情绪失控 2025-01-01 15:02:03 4 0

共 46 页
上一页
2
3
4
5
6
下一页

友情链接

文江博客