在vba excel中的刮擦网台的性能
此代码太慢。我需要将数据从HTML表转移到Excel工作表。我无法使用查询表,因为按下按钮后,该表是通过Post方法生成的。 该表是16列x 200+行, 我该怎…
如何从Inc5000中刮擦公司名称?
我正在尝试从Inc5000站点(“ https://www.inc.com/inc5000/2021”刮擦所有公司名称)。问题是公司名称是使用JavaScript显示的。我已经尝试使用硒和请…
用JSON刮擦多个页面
我正在尝试用JSON刮擦多个页面,但它们会为我提供错误 import requests import json import pandas as pd headers = { 'Accept-Language': 'en-GB,en-…
python请求html-发现的项目的结果不返回内容
嗨,我用我的脚本刮擦一个网页,问题是一个项目(标题),可以正确找到一个项目,其他项目只能在这样拿起时抛弃html: [] 我的脚本: from requests_h…
通过ID找到多个元素
我试图通过其各自的ID找到多个元素 元素命名 dcm保留限制限制 - 元素输入 - X ,x是元素的数量,可能是: dcm-reservation-limit-multiple-input-gene…
如何使用Python Selenium单击“无类,ID或值”按钮
我正在尝试单击此网站上的MLB按钮,它是动态的,因此我认为XPath不会起作用,并且我疲倦的CSS选择器代码没有工作。最好的方法是什么? driver.get("ht…
如何使用Python获取桌子的身体?
我正在自我播放的网络crap绕,我正试图从一个美丽的小屋的桌子上拿到tbody。 我的尝试: url ='https://www.agrolok.pl/notowania/notowania-cen-psze…
单击使用循环使用同一类名称的多个Divs
我正在尝试单击具有同一类名称的多个DIV。解析HTML页面,提取一些信息并返回同一页面。 在此 page 。 选择项目并提取相关信息 返回 page 单击下一个项…
如何在球拍中刮擦页面标题?
我到了以下代码获得页面的HTML的点: #!/usr/bin/env racket #lang racket/base (require net/url racket/port) (require (planet neil/html-parsing:…
C++ CSRF令牌的卷曲问题
我想将查询发布到 leetcode/graphql 中,并在JSON中获取问题列表。但是我面临着CSRF令牌的问题。我在Web的东西上很新,我无法弄清楚如何解决这个问题…
用python硒循环刮擦并保存问题
嗨,我想保存我作为CSV和TXT的数据,但我做不到。 而且; 如何多次重复此过程? nextInput = driver.find_element("xpath",'//*[@id="pnnext"]/span[2]…
仅在爬行时仅抓取400误差,而不是在使用scrapy shell时
我正在收到400 HTTP状态代码,或者使用scrapy Crawl功能在 https://www.bbc.com/news/topics/c3np65e0jq4t 。我正在使用以下代码并命令来启动疤痕。 c…