web-scraping

web-scraping

文章 0 浏览 7

在vba excel中的刮擦网台的性能

此代码太慢。我需要将数据从HTML表转移到Excel工作表。我无法使用查询表,因为按下按钮后,该表是通过Post方法生成的。 该表是16列x 200+行, 我该怎…

白衬杉格子梦 02-13 04:36 1 0

网络刮擦结果不保存

在其他所有选项卡中,索引号和数据的数据是重置的,我想将数据保存到一个又一个又一个而不重置的txt。 除这些错误代码外,代码中没有其他问题 : from…

桃气十足 02-13 04:01 2 0

如何从Inc5000中刮擦公司名称?

我正在尝试从Inc5000站点(“ https://www.inc.com/inc5000/2021”刮擦所有公司名称)。问题是公司名称是使用JavaScript显示的。我已经尝试使用硒和请…

一口甜 02-13 03:51 2 0

用JSON刮擦多个页面

我正在尝试用JSON刮擦多个页面,但它们会为我提供错误 import requests import json import pandas as pd headers = { 'Accept-Language': 'en-GB,en-…

超可爱的懒熊 02-13 03:15 1 0

python请求html-发现的项目的结果不返回内容

嗨,我用我的脚本刮擦一个网页,问题是一个项目(标题),可以正确找到一个项目,其他项目只能在这样拿起时抛弃html: [] 我的脚本: from requests_h…

灯下孤影 02-13 02:47 2 0

通过ID找到多个元素

我试图通过其各自的ID找到多个元素 元素命名 dcm保留限制限制 - 元素输入 - X ,x是元素的数量,可能是: dcm-reservation-limit-multiple-input-gene…

若相惜即相离 02-13 01:36 2 0

如何使用Python Selenium单击“无类,ID或值”按钮

我正在尝试单击此网站上的MLB按钮,它是动态的,因此我认为XPath不会起作用,并且我疲倦的CSS选择器代码没有工作。最好的方法是什么? driver.get("ht…

土豪 02-13 01:25 1 0

如何使用Python获取桌子的身体?

我正在自我播放的网络crap绕,我正试图从一个美丽的小屋的桌子上拿到tbody。 我的尝试: url ='https://www.agrolok.pl/notowania/notowania-cen-psze…

治碍 02-13 01:18 1 0

XPath一无所获

我正在尝试获取电话号码,但是从XPath中什么都没有解决这些问题。 -details.cfm?eunid = 99999999999“ rel =” nofollow noreferrer”> https://aao…

把回忆走一遍 02-13 01:15 3 0

路透社的网络报废库存数据

我是一个编程初学者,并试图从路透社提取关键的度量数据(例如beta)。但是,它总是像空白一样回来。 我的代码是这样的: from bs4 import BeautifulS…

最单纯的乌龟 02-13 01:06 1 0

单击使用循环使用同一类名称的多个Divs

我正在尝试单击具有同一类名称的多个DIV。解析HTML页面,提取一些信息并返回同一页面。 在此 page 。 选择项目并提取相关信息 返回 page 单击下一个项…

青巷忧颜 02-13 00:41 2 0

如何在球拍中刮擦页面标题?

我到了以下代码获得页面的HTML的点: #!/usr/bin/env racket #lang racket/base (require net/url racket/port) (require (planet neil/html-parsing:…

北座城市 02-13 00:20 1 0

C++ CSRF令牌的卷曲问题

我想将查询发布到 leetcode/graphql 中,并在JSON中获取问题列表。但是我面临着CSRF令牌的问题。我在Web的东西上很新,我无法弄清楚如何解决这个问题…

守不住的情 02-13 00:17 1 0

用python硒循环刮擦并保存问题

嗨,我想保存我作为CSV和TXT的数据,但我做不到。 而且; 如何多次重复此过程? nextInput = driver.find_element("xpath",'//*[@id="pnnext"]/span[2]…

错々过的事 02-13 00:13 0 0

仅在爬行时仅抓取400误差,而不是在使用scrapy shell时

我正在收到400 HTTP状态代码,或者使用scrapy Crawl功能在 https://www.bbc.com/news/topics/c3np65e0jq4t 。我正在使用以下代码并命令来启动疤痕。 c…

中性美 02-13 00:10 1 0
更多

推荐作者

万事如意

文章 0 评论 0

微信用户

文章 0 评论 0

1649543945

文章 0 评论 0

华纳云

文章 0 评论 0

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文