第 4 页 - 爬虫 - 文江博客

爬虫

文章 76 浏览 598

用Python写了一个从txt中逐行读取图片链接并下载的程序，但一遇到坏链接，requests.get()就会引发崩溃

程序代码import os import requests file = open("C:\\Users\\moles\\Documents\\SourceTree\\nsfw_data_scraper\\raw_data\\drawings\\urls_drawings…

虫児飞 2022-09-12 23:15:04 22 0

pyspider，遇到超时599，能否设置爬虫超时则跳过爬取，避免进入pause状态

爬取页面时，有的url存在重定向获取的url为： https://www.thepaper.cn/newsDetail_forward_12149631点进去后变成了：http://www.kankanews.com/a/20.…

纵性 2022-09-12 23:12:58 29 0

请教：python通过xpath该怎么获取呐

res = driver.find_elements_by_xpath('//div[contains(text(),"运单管理")]')我这样写打印的是空…

禾厶谷欠 2022-09-12 23:11:57 16 0

python如何处理时间字符串？

def salary_cal(OT_date): year = int(time.strftime('%Y',time.strptime(OT_date.day ,'%d.%m.%Y')) ) mon = int(time.strftime('%m',time.strptime(…

失退 2022-09-12 23:09:01 19 0

python爬虫解析m3u8文件，file not found？

1.解析m3u8文件时，想要提取其中的ts地址，但是无法解析，总是报错：file not found。2.代码如下：url = 'https://bobolj.com/20210324/M...'headers …

做个少女永远怀春 2022-09-12 23:06:09 20 0

我想用puppeteer爬取搜索引擎某些关键词的搜索结果数量，一共有几千个关键词，如何才能控制住一次性打开的网页不要太多。。。

第一次玩puppeteer，写个for循环就把page扔进去了，发现一下子就开了4000个promise？？？这种情况该怎么处理啊。。。。求助…

旧故 2022-09-12 23:00:53 30 0

请问如何用xpath提取内容

刚入门python爬虫，请问如何用xpath提取‘水电费’几个字，标签外的内容不知道怎么弄？123 水电费 …

淡淡離愁欲言轉身 2022-09-12 23:00:02 20 0

一个爬虫方法报错了，

com.gargoylesoftware.htmlunit.javascript.JavaScriptEngine handleJavaScriptException 信息: Caught script exception ======= EXCEPTION START ==…

彼岸花ソ最美的依靠 2022-01-04 04:58:34 906 0

爬虫的难点应该是什么?

爬虫的难点应该是什么? 这个是前几天我面试的时候遇到面试官问的一个问题,对于做了两年爬虫开发的我来说,我觉得还是链接调度比较麻烦点..也不算是…

情绪失控 2021-12-07 18:11:22 854 0

怎么有效利用爬虫系统和搜索引擎，抓取用户数据

怎么有效利用爬虫系统和搜索引擎，抓取用户数据…

笑红尘 2021-12-05 23:17:11 959 0

爬1024如何避免验证码

众所周知，1024上搜索贴子需要会员，但1024上的会员搞不到，以前能google指定1024进行搜索，但现在貌似安全搜索启用了后就搜不到。那么身为一个码农…

明月松间行 2021-12-05 18:50:43 823 0

Java执行一个10几万的用户的爬虫任务，停掉了，卡住不动，这是怎么回事？

Java执行一个10几万的用户的爬虫任务，停掉了，卡住不动，这是怎么回事？ eclipse的进度还是红的，也不见有异常报出？ …

甜扑 2021-12-03 19:08:27 868 0

java web系统防越权，就是可以直接在地址栏输入打开没有授权的页面。或者一个网站的所有链接如何爬取，并保存跳转的关系

大家好，我说一下问题和我的想法。这是运行5年的系统了，只兼容IE，几乎不能通过重构来实现，所以写个过滤器filter应该是最简单的方案。因为数据库…

滥情空心 2021-12-03 16:02:49 771 0

Java爬虫的翻页技巧？怎么写个比较通用的翻页方法？？？

Java爬虫的翻页技巧？怎么写个比较通用的翻页方法？？？…

猫性小仙女 2021-12-02 06:02:24 868 0

在项目中如何使用别人网站的数据的

如题，比如我要提供企业查询服务，数据是来源于住建部网站（http://jzsc.mohurd.gov.cn/dataservice/query/comp/list）的，有两种方式，一种是直接提…

柳絮泡泡 2021-12-01 22:58:42 802 0

共 5 页
上一页
1
2
3
4
5
下一页

友情链接

文江博客

爬虫