第 5 页 - screen-scraping

screen-scraping

文章 0 浏览 8

用 C# 与网页交互

有一个使用 ColdFusion 创建的网站（不确定这是否重要）。我需要与该网站进行交互。我需要做的主要事情是导航到不同的页面并单击按钮。关于如何做到…

小嗷兮 2024-12-29 16:07:40 2 0

API/数据源 - 链接和按使用付费

Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …

甜扑 2024-12-29 09:40:21 1 0

grep 在 data.frame 中的任何单元格上

一个简单的“有没有更好的方法”问题。我想查找 data.frame 中的任何单元格是否包含我正在寻找的子字符串： d=data.frame(V1=c("xxx","yyy","zzz"), V…

温柔戏命师 2024-12-28 23:58:33 1 0

如何获取两个 HTML 标签之间的所有内容？（使用 XPath？）

编辑：我添加了一个适用于这种情况的解决方案。我想从页面中提取表格，并且我想（可能）使用 DOMDocument 和 XPath 来完成此操作。但如果你有更好的…

长伴 2024-12-28 07:55:47 1 0

我如何使用 file_get_contents 和 preg_match 屏幕抓取这样的页面？

我有一个包含许多 HTML 行的页面，如下所示： the_content_i_need 现在，如您所见，该行中有一个链接，不幸的是，该链接在每一行上都发生了变化。因…

混吃等死 2024-12-28 07:07:09 5 0

Rails 3 中的屏幕抓取

Rails 3 - gem/library 中的屏幕抓取选项有哪些？我过去曾使用过 Nokogiri，但只是想知道 Rails 3 中是否有更好的选择。…

薆情海 2024-12-28 05:28:50 5 0

使用 javascript 链接下载 PhantomJS

我正在尝试抓取以下网站： http://www.fangraphs.com/leaders.aspx?pos=all&stats=bat&lg=all&qual=0&type=8&season=2011&month=0&season1=2011&ind= …

琴流音 2024-12-28 05:02:29 5 0

使用 HtmlAgilityPack 解析 dl

这是我尝试使用 ASP.Net (C#) 中的 Html Agility Pack 解析的示例 HTML。 1 First Entry 2 Second Entry 3 Third Entry 我想要的值是：超链接 -> 1.h…

谁许谁一生繁华 2024-12-28 02:33:19 1 0

Ruby 中的图像抓取

如何使用 Nokogiri 抓取特定 URL 上存在的图像？如果有比 Nokogiri 更好的选择，请提出建议。 css图像标签是.profilePic img…

原谅我要高飞 2024-12-28 01:23:55 4 0

具有多个页面的 javascript 表上的 Python BeautifulSoup

我曾经有一个 python 脚本，可以使用 Mechanize 和 BeautifulSoup 正确地从下表中提取数据。但是，该网站最近已将表格的编码更改为 javascript，并且…

半边脸i 2024-12-27 15:16:24 2 0

关于转换从屏幕抓取工具收集的数据的建议

大家好，我有我的屏幕抓取工具 (scrapy) 收集多个房地产网站上的房地产列表数据。它们都有几个常见的字段，例如价格、建筑面积等。但是，与所有抓取…

握住我的手 2024-12-27 07:53:53 2 0

屏幕抓取：自动化 vim 脚本

在vim中，我将一系列网页（一次一个）加载到vim缓冲区中（使用vim netrw插件），然后解析html（使用vim elinks插件）。一切都好。然后，我使用正则表…

云柯 2024-12-27 06:05:27 3 0

执行长时间运行的屏幕抓取脚本

我在通过命令行运行的 GoDaddy 共享 LAMP 服务器上有一个 PHP 屏幕抓取脚本。该脚本抓取、解析所需信息并将其存储在数据库中。每个页面的整个过程大…

戒ㄋ 2024-12-26 23:16:32 2 0

抓取网页并检索 JavaScript 变量

我需要抓取一个嵌入了内嵌 javascript 代码的 javascript 数组的网页，例如： var videos = new Array(); videos[0] = 'http://myvideos.com/video1.m…

人│生佛魔见 2024-12-26 17:47:19 1 0

使用 python 屏幕抓取网站（服务器端）

我正在创建一个代表虚拟公司网站（在本例中为虚拟面包店）的网站。我已经设置了产品和购物车系统，现在的问题是让它与虚拟银行系统一起工作。每个参与…

吝吻 2024-12-26 02:54:25 1 0

共 46 页
上一页
3
4
5
6
7
下一页

友情链接

文江博客