第 8 页 - screen-scraping

投稿关注

screen-scraping

文章 0 浏览 8

DOMNodeList、xPath 和 PHP

我正在 PHP 中使用 DOM 和 XPath 解析 HTML 页面。我必须从 HTML 中获取嵌套的。我在浏览器中使用 FirePath 定义了一个查询，该查询指向“ html/bo…

若无相欠,怎会相见 2024-12-19 19:36:15 3 0

如何快速收到网页特定更改的通知？

Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题？更新问题，以便可以通过编辑这篇文章用事实和…

方觉久 2024-12-19 13:02:56 2 0

如何使用 iMacros 检查 html 是否包含特定数字

我想使用 iMacros 检查 html 网站是否包含某些数字。如果是，那么我想根据找到的数字分配一个变量。就像如果 html 包含 112233 那么我想将 Var1 设置…

若相惜即相离 2024-12-19 03:12:02 5 0

为什么雅虎电影返回“未知问题”页？

据我所知，雅虎电影没有 API，我为它制作了一个抓取工具（Java）。现在的问题是，当我向雅虎电影请求多个页面时，它有时会返回一个“未知问题”页面…

只想待在家 2024-12-18 23:05:42 2 0

scrapy 日志处理程序

我在以下两个问题中寻求您的帮助 - 如何为不同的日志级别设置处理程序，例如在 python 中。目前，我已经 STATS_ENABLED = True STATS_DUMP = True LOG…

︶￣淡然 2024-12-18 19:53:49 2 0

创建 DC 自行车共享位置的小型数据库

我对这个网站和编程都很陌生，所以如果我说错了什么，请原谅。我需要找到华盛顿特区所有共享单车亭的经纬度位置列表。包含所有车站的地图可以在此处…

过潦 2024-12-18 14:49:28 2 0

从 HTML 页面中删除所有 JavaScript

我尝试使用 Sanitize gem 来清理包含网站 HTML 的字符串。它只删除了标签，而不是脚本标签内的 JavaScript。我可以使用什么来从页面中删除 JavaScr…

迷鸟归林 2024-12-18 13:29:57 5 0

DOMNode 无法转换为字符串

萤火眠眠 2024-12-18 02:20:36 4 0

为什么我会收到“错误的状态行” Nokogiri 的错误？

我的 Ruby/Nokogiri 脚本是： require 'rubygems' require 'nokogiri' require 'open-uri' f = File.new("enterret" + ".txt", 'w') 1.upto(100) do |…

铁憨憨 2024-12-17 21:40:39 3 0

通过 get_file_contents() 解析 html

有人告诉我们，解析 html 的最佳方法是通过 DOM，如下所示： loadHTML( $html); $elements = $d…

丘比特射中我 2024-12-17 19:37:57 3 0

JSoup 和我无法抓取的网站

我正在学习使用 JSoup，为此我从一个包含足球比赛的网站开始。我不擅长html，这可能是问题所在，无论如何，我检查了网站的代码以了解如何检索我需要的…

遇见了你 2024-12-17 15:07:09 7 0

iMacros - 提取 TD 标签内的部分文本

请访问链接 http://www.networksolutions.com/whois-search/reedandthomas。 com 我只想提取文本的以下部分： Administrative Contact: Chilcoat, Dan…

半透明的墙 2024-12-17 05:05:53 5 0

将 cookie 传递到登录页面

我正在尝试从在 Asp.Net Webforms 上运行的网页中抓取数据。我查看了此页面来执行此操作。它看起来像是我不想做的，但我不会让它开箱即用，因为登录页…

浮世清欢 2024-12-17 03:18:13 2 0

从字符串、正则表达式中提取变量？

我的困惑：作为 PHP 新手，我尝试使用正则表达式从字符串中提取一些数据，但我找不到正确的语法。字符串的内容被抓取为网站上多个图像的 html，我希…

疾风者 2024-12-16 20:29:58 4 0

从 NHL.com 抓取数据

我正在尝试从 http://www.nhl.com/ice/stands.htm?season=20112012&type=LEA" rel="nofollow">http://www. nhl.com/ice/stands.htm?season=20112012&t…

动听の歌 2024-12-16 00:52:39 5 0

共 46 页
上一页
6
7
8
9
10
下一页

关注

友情链接

文江博客

screen-scraping

DOMNodeList、xPath 和 PHP

如何快速收到网页特定更改的通知？

如何使用 iMacros 检查 html 是否包含特定数字

为什么雅虎电影返回“未知问题”页？

scrapy 日志处理程序

创建 DC 自行车共享位置的小型数据库

从 HTML 页面中删除所有 JavaScript

DOMNode 无法转换为字符串

为什么我会收到“错误的状态行” Nokogiri 的错误？

通过 get_file_contents() 解析 html

JSoup 和我无法抓取的网站

iMacros - 提取 TD 标签内的部分文本

将 cookie 传递到登录页面

从字符串、正则表达式中提取变量？

从 NHL.com 抓取数据

热门标签

推荐作者

你列表最软的妹

晚安先生.

究竟谁懂我的在乎

mmi23

梦中的蝴蝶

skjfmsvd

友情链接