关于Python selenium模块
在Python里安装了selenium模块,可是在调用该模块时,调用不了webdriver这个方法,报错结果如图,文件名也没有纯在和模块同名的原因,求大神指点!!…
请教,django中 如何向带有外键(一对多和多对多)数据库中批量插入数据?
请教,自己采集了一些数据,想批量插入到django中,Models模型代码如下,我想把采集的数据批量插入到 文章信息表DetailInfo中,因为DetailInfo表中涉…
'NoneType' object has no attribute 'strip'?
html是这样的: '5 - 7' ::after ::after ::after 运行以下程序:info_list = [] table = tree.xpath('//table[@class="market_table_content"]')[0] …
python requests怎么解决url中../自动跳目录的问题?
import requests burp0_url = "http://127.0.0.1:80/../../../../a" burp0_headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) Ap…
nodejs代理采集找不到资源
const http = require("http");const cheerio = require("cheerio");const iconv = require('iconv-lite');const BufferHelper = require('bufferhelp…
lxml如何处理内容带html标签的元素?
写爬虫的时候,遇到一个元素,其text里面是html格式:获取这个元素的text_content(),lxml就傻了,出来一大堆东西:它不能识别出这是内容文本,所以不…
java 爬虫正则的问题
String Match=""(https://www.tianyancha.com/company/d+)" target='_blank'"; Pattern pattern=Pattern.compile(Match); Headers.put("user-agent", …
为什么这个爬虫一直412
https://www.12309.gov.cn/gj/s...就是这个网址cookie ,header 代理 ,selenium 能用的方法全都用了,全都是 412 ,有没有大佬点拨一下 有哥们让我贴…
java发送post form_data请求
List headers = new ArrayList(); headers.add(new BasicHeader("User-Agent", "Mozilla/5.0(Windows NT 6.1;Win64; x64; rv:50.0) Gecko/20100101 Fi…
requests用IP直连时无法用代理怎么办?
代码如下,运行报错404,但是去掉代理proxies参数就可以正常访问了。proxies = { 'http': 'http://' + "{}:{}".format(proxy['IP'], proxy['Port']), …
colly:invalid memory address or nil pointer dereference
今天用colly写了个demo,下面是代码func downloadImages(e *colly.HTMLElement) { srcRef := destUrl + e.Attr("src") res, _ := http.Get(srcRef) if …
抓包找到一串bytes的数据怎么解读(求大侠)
想这样的一串数据怎么解读百度一天也不知道怎么搞求大侠,另外我想用php模拟数据怎么该怎么弄486 bytes670BBD069D4F989418BAF9FDE5CC2B4E21FDF1F3044E7…