python爬虫

投稿关注

文章 460 浏览 26

gitignore忽略某文件目录下的所有，但是要上传这个文件。

我想忽略data/arr下面的所有文件，但是想上传data/arr文件夹感谢各位大神。…

眼波传意 2022-09-13 01:19:36 39 0

pyspider的webui界面不一样

启动成功后打开http://localhost:5000显示的是这样的点击create显示这是怎么回事啊？…

七堇年 2022-09-13 01:14:37 49 0

python requests.post 获取不到数据

目标数据:报头headers:传递的参数data:源码:requests.post(urls, json=data, headers=headers, timeout=(5, 10)).json().get('Response')运行结果:dat…

夜深人未静 2022-09-13 00:46:19 40 0

python如何用requests获取网络文件大小

python如何用requests获取网络文件大小？发送get请求解析Content-Length的话，大文件需要很久…

饭团 2022-09-13 00:43:49 24 0

有什么办法可以用xpath提取出这段html里的中文

怎么提取出 “中国正能量” 而不会一起提取出 a 标签下的 div 标签里的 “热”？…

无法言说的痛 2022-09-13 00:20:42 32 0

python中如何保留for 循环中每次的变量赋值？

最近在学习爬虫，用for语句遍历的时候只能保存最后一次的数据，想问问大佬们有没有办法解决。当前状况：for 循环下只能用pandas导出最后一次的数据需…

魔法唧唧 2022-09-13 00:17:15 35 0

爬虫入门问题，爬取10页没问题，但改了for i in range后依然是10页？

for循环for i in range（0，10）读取10页信息没问题，但是改成for i in range（0，1），本来是一页信息，但运行时读取的还是10页import urllib.reques…

つ可否回来 2022-09-13 00:14:41 33 0

Python标签树下行遍历

大家好我正在学习Python爬虫，遍历标签树.contents：子节点的列表，将所有儿子节点存入列表。在...标签下有两个子节点，为什么我只能打印第一个子节点…

指尖微凉心微凉 2022-09-13 00:04:19 31 0

python爬虫使用多进程还是多线程？

查了一些资料，看到网络请求属于IO操作，因此使用多线程，那么为什么还有多进程爬虫呢？虽然多进程爬虫可能多核，但是进程适用于cpu密集型运算啊。。…

柏林苍穹下 2022-09-13 00:02:32 23 0

一个简单的python？

题目描述为什么我的python程序有时候运行有结果，就是能到后台自动打开五个网站，有时候运行又没有结果，也不报错，就是运行完了什么也没发生。题目来…

柠檬色的秋千 2022-09-12 23:35:05 26 0

使用scrapy框架爬取数据，前面爬取正常，最后一直爬取最后一页的数据，爬虫不停止

使用的是pycharm，爬虫mport scrapy from zuowen.items import ZuowenItem class ZuoweneSpider(scrapy.Spider): name = 'zuowene' allowed_domains =…

百变从容 2022-09-12 23:23:34 30 0

python爬虫程序报错:ConnectionResetError

程序如下，爬取过程中会报错，报错时间随机，有时候爬几百条就报错，有时候爬几千条报错：`ConnectionResetError: [Errno 54] Connection reset by pe…

ゃ人海孤独症 2022-09-12 23:21:33 32 0

python使用request库通过get方式得到的url信息里，为什么会缺失？

我通过request库通过get方式得到的url信息，但是一查看，得到image这个列表里的数据既然跟真是浏览器给的列表既然不一样，有缺失。请问各位大神怎样解…

知你几分 2022-09-12 23:18:47 24 0

Python代理IP问题

Python代理问题爬取图片通过requests 代理IP访问首页。通过xpath定位，循环请求图片页面；这时不填写代理IP，默认用代理还是不用？还有访问图片下载地…

作死小能手 2022-09-12 23:13:55 42 0

想用python自动识别验证码并输入运行报错

!C:/Python27coding= utf-8from selenium import webdriverfrom selenium.webdriver.common.keys import Keysfrom pytesseract import *from PIL impo…

手心的海 2022-09-12 22:55:37 44 0

共 31 页
1
2
3
4
5
下一页

友情链接

文江博客