web-scraping

web-scraping

文章 0 浏览 2

自动从 iTunes Connect 下载销售报告

我有一个漂亮而 hacky 的 Perl 脚本,可以自动从 iTunes Connect 抓取和下载销售报告文件。截至今天,苹果公司彻底修改了销售报告网站。它看起来好多…

遥远的绿洲 2024-09-18 16:40:57 2 0

如何正确使用Scrubty从XML输出内容中抓取URL

我绝不是 Ruby 的高手,而且对 Scrubyt 也很陌生。我只是尝试在 wiki 页面上找到一些示例。我正在研究的示例是当您搜索“ruby”时获取 Google 返回的…

请爱~陌生人 2024-09-18 16:11:51 4 0

通过 CURL 发布带有文本区域和 onClick=Java... 的 (ASP) 表单

我正在尝试将一些信息传递到 ASP 网页。 页面上的表单如下所示: &ltform name=onlineform method=post onSubmit="javascript:return false"&gt &ltin…

夏尔 2024-09-18 04:24:32 4 0

在网站 HTML 中查找标签

我正在使用 Perl。 我有标签,例如:“XYZ_PKM_HTML” 我希望能够提供一个基本网址,例如:www.example.com 并获取此标签出现的 HTML 页面(不一定是…

淤浪 2024-09-18 01:52:49 2 0

HtmlUnit 和 XPath:DOMNode.getByXPath 仅适用于 HtmlPage?

我正在尝试解析 一个页面,其中包含指向重要内容看起来的文章的链接像这样: &ltdiv class="article"&gt &lth1 style="float: none"&gt&lta href="per…

我最亲爱的 2024-09-17 20:14:27 5 0

从网页中抓取内容

我需要抓取远程 html 页面来查找图像和链接。我需要找到“最有可能”页面上的产品图像的图像以及“靠近”该图像的链接。我目前使用 javascript 书签来…

捂风挽笑 2024-09-17 07:08:18 2 0

html 抓取和 CSS 查询

以下库的优点和缺点是什么? PHP 简单 HTML DOM 解析器 QP phpQuery 从上面我使用了 QP 并且它无法解析无效的 HTML 和 simpleDomParser 做得很好,但…

被翻牌 2024-09-17 06:16:48 2 0

数据抓取问题

我正在从 Facebook 页面上抓取墙上帖子的数据,以下是网址: http://www.facebook.com/GMHTheBook?v=wall&ampref=ts#!/GMHTheBook?v=wall&ampref=ts …

随梦而飞# 2024-09-16 08:56:28 2 0

这个字符串格式有什么问题吗?

我想知道是否有人知道这个 html 字符串代码是怎么回事: &ltobject height=\\\"38\" + \"5\\\" width=\\\"64\" + \"0\\\" classid=\\\"clsid:D27CDB6E…

想你的星星会说话 2024-09-16 08:22:18 2 0

解析 html 并使用 ajax json 进行解析

我有这样的文件需要用 Python 解析(从报废中): some HTML and JS here... SomeValue = { 'calendar': [ { 's0Date': new Date(2010, 9, 12), 'valu…

最美的太阳 2024-09-16 06:27:36 2 0

如何刮“表状”来自 stackexchange 主页的数据? (在 R 中)

我希望抓取一个新的 stackexchange 网站的主页: https://webapps.stackexchange.com/ (仅一次,并且只有几页,不会打扰服务器)。如果我想要从 stac…

变身佩奇 2024-09-15 07:11:47 2 0

如何从Java Web应用程序中提取数据?

我需要从 Java Web 应用程序中提取数据。具体来说,我希望从雅虎市场跟踪器中提取实时股票数据。有人可以建议任何方法吗?…

转角预定愛 2024-09-14 22:06:43 2 0

如何使用 Java 导航 Web 搜索

我需要为一个项目抓取法国法院案件,但我不知道如何让 Java 导航法院的搜索引擎。 这是我需要操作的搜索页面。我想开始抓取结果页面,但我无法仅使用 …

清眉祭 2024-09-14 21:51:24 2 0

如何使用 IE/.Net/C# 进行真正的多线程 Web 挖掘?

我想使用IE浏览器从网络上挖掘大量数据。然而,通过 WatiN 生成大量 IE 实例会使系统崩溃。有更好的方法吗?请注意,我不能简单地执行 WebRequests - …

明月松间行 2024-09-14 16:54:33 5 0

抓取网站并将其转换为 HTML?

Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …

丿*梦醉红颜 2024-09-14 05:51:49 1 0
更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文