screen-scraping

screen-scraping

文章 0 浏览 5

如果对象还有其他类,Beautiful Soup 也找不到 CSS 类

如果页面具有 和 ,则 soup.findAll(True, 'class1') 将找到它们。 但是,如果它具有 ,则不会找到它。 如何找到具有特定类的所有对象,无论它们是否…

匿名的好友 2024-07-30 07:49:04 6 0

使用回发解析 .Net 页面

我需要从使用联合国的 aspx 页面显示的在线数据库中读取数据。 我以前做过 HTML 解析,但它总是通过操作查询字符串值。 在本例中,站点使用 asp.net …

时光倒影 2024-07-30 06:03:41 7 0

屏幕抓取表格结果

最近,一位客户要求我为他们的保险业务建立一个网站。 作为其中的一部分,他们希望对其其中一个提供商的报价网站进行一些屏幕抓取。 他们询问是否有一…

你在看孤独的风景 2024-07-30 04:30:56 6 0

使用 Simple_HTML_Dom 得到错误结果

我正在尝试抓取此网页:http://www.acttab.com.au/interbet/venues?day=today 这是我的代码: function FindRaceRows($html) { foreach ($rows = $htm…

一页 2024-07-29 18:20:49 5 0

如何保证在php中使用CURL准确抓取utf-8字符?

我正在抓取带有重音字符(如“é”)的网页(使用php的curl)。 在这些网页的源代码中,这些字符是使用 utf-8 编写的(它们不是 html 编码的)。 但是…

神回复 2024-07-29 17:37:01 4 0

用于解析“SRC”的 XPath 来自 IMG 标签?

现在,我成功地从 HTML 页面中获取了完整的元素: //img[@class='photo-large'] 例如,它将返回: 但我只需要 SRC url (http://example.com/img.jpg)…

感情废物 2024-07-28 16:45:25 6 0

抓取当前请求并将其压缩

我有一个 asp.net 网站,其中包含一些页面,我想导出它们生成的内容并发送到另一个服务进行存档。 我能想到的最好方法是抓取流并将其转储到一个文件中…

椒妓 2024-07-28 15:45:34 5 0

如何在不使用 API 的情况下以编程方式执行搜索?

我想创建一个程序,将字符串输入到 Google 等网站的文本框中(不使用其公共 API),然后提交表单并获取结果。 这可能吗? 我认为抓取结果需要使用 HTM…

另类 2024-07-27 22:27:42 10 0

产品比价脚本

您将如何构建价格比较脚本? 我知道亚马逊提供公共 API,但我看到了这两个网站 goodreads, bookdope 比较图书价格,从沃尔玛和其他不提供 API 的网站…

顾冷 2024-07-27 21:36:05 5 0

无法使用 simplehtmldom 正确分隔单元格

我正在尝试编写一个网络爬虫。 我想将所有单元格排成一行。 我想要的行之前的行将 THOROUGHBRED MEETINGS 作为其纯文本值。 我可以成功获得这一行。 …

花落人断肠 2024-07-27 20:02:08 15 0

如何在 simplehtmldom 中通过标签内容进行搜索?

我正在尝试使用 simplehtmldom 编写一个网络抓取工具。 我想通过搜索标签的内容来获取标签。 这是其中的明文,而不是标签的类型。 然后,一旦我通过搜…

戏剧牡丹亭 2024-07-27 19:17:23 10 0

使用 PHP 抓取完整图像 src

我正在尝试用 php 抓取 img src,我可以很好地获取 src,但是如果 src 不包含完整路径,那么我无法真正重用它。 有没有办法使用php获取图像的完整路径…

合久必婚 2024-07-27 17:08:59 8 0

获取 IE 的 HTTP 请求

有没有办法访问页面已加载时发出的http请求IE。 例如,我有一个正在打开浏览器窗口的应用程序。 我想要抓取页面,但想要获取该页面的整个 http 请求(…

ゃ懵逼小萝莉 2024-07-27 16:33:31 10 0

使用 PHP 从远程站点抓取时跟踪 Javascript 链接

给定远程页面: http://example.com/paged_list.aspx 使用 Javascript 函数调用显示多页表格数据: javascript: show_page(1) javascript: show_page(…

寒江雪… 2024-07-26 17:14:13 4 0

将 HTML 行解析为 CSV

首先,html 行看起来像这样: blahblah TheTextIneed blahblah and ends with 我会显示真正的 html,但很遗憾,我不知道如何阻止它。 感到羞耻 使用 B…

┈┾☆殇 2024-07-26 09:08:04 9 0
更多

推荐作者

爱人如己

文章 0 评论 0

萧瑟寒风

文章 0 评论 0

云雾

文章 0 评论 0

倒带

文章 0 评论 0

浮世清欢

文章 0 评论 0

撩起发的微风

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文