爬虫

爬虫

文章 76 浏览 596

用Python写了一个从txt中逐行读取图片链接并下载的程序,但一遇到坏链接,requests.get()就会引发崩溃

程序代码import os import requests file = open("C:\\Users\\moles\\Documents\\SourceTree\\nsfw_data_scraper\\raw_data\\drawings\\urls_drawings…

虫児飞 2022-09-12 23:15:04 19 0

pyspider,遇到超时599,能否设置爬虫超时则跳过爬取,避免进入pause状态

爬取页面时,有的url存在重定向获取的url为: https://www.thepaper.cn/newsDetail_forward_12149631点进去后变成了:http://www.kankanews.com/a/20.…

纵性 2022-09-12 23:12:58 23 0

请教:python通过xpath该怎么获取呐

res = driver.find_elements_by_xpath('//div[contains(text(),"运单管理")]')我这样写打印的是空…

禾厶谷欠 2022-09-12 23:11:57 14 0

python如何处理时间字符串?

def salary_cal(OT_date): year = int(time.strftime('%Y',time.strptime(OT_date.day ,'%d.%m.%Y')) ) mon = int(time.strftime('%m',time.strptime(…

失退 2022-09-12 23:09:01 16 0

python爬虫解析m3u8文件,file not found?

1.解析m3u8文件时,想要提取其中的ts地址,但是无法解析,总是报错:file not found。2.代码如下:url = 'https://bobolj.com/20210324/M...'headers …

做个少女永远怀春 2022-09-12 23:06:09 17 0

我想用puppeteer爬取搜索引擎某些关键词的搜索结果数量,一共有几千个关键词,如何才能控制住一次性打开的网页不要太多。。。

第一次玩puppeteer,写个for循环就把page扔进去了,发现一下子就开了4000个promise???这种情况该怎么处理啊。。。。求助…

旧故 2022-09-12 23:00:53 24 0

请问如何用xpath提取内容

刚入门python爬虫,请问如何用xpath提取‘水电费’几个字,标签外的内容不知道怎么弄?&ltspan&gt123&lt/span&gt 水电费 &lt/br&gt…

淡淡離愁欲言轉身 2022-09-12 23:00:02 17 0

一个爬虫方法报错了,

com.gargoylesoftware.htmlunit.javascript.JavaScriptEngine handleJavaScriptException 信息: Caught script exception ======= EXCEPTION START ==…

彼岸花ソ最美的依靠 2022-01-04 04:58:34 904 0

爬虫的难点应该是什么?

&nbsp &nbsp 爬虫的难点应该是什么? 这个是前几天我面试的时候遇到面试官问的一个问题,对于做了两年爬虫开发的我来说,我觉得还是链接调度比较麻烦点..…

情绪失控 2021-12-07 18:11:22 853 0

怎么有效利用爬虫系统和搜索引擎,抓取用户数据

怎么有效利用爬虫系统和搜索引擎,抓取用户数据…

笑红尘 2021-12-05 23:17:11 956 0

爬1024如何避免验证码

众所周知,1024上搜索贴子需要会员,但1024上的会员搞不到,以前能google指定1024进行搜索,但现在貌似安全搜索启用了后就搜不到。 那么身为一个码农…

明月松间行 2021-12-05 18:50:43 819 0

Java执行一个10几万的用户的爬虫任务,停掉了,卡住不动,这是怎么回事?

Java执行一个10几万的用户的爬虫任务,停掉了,卡住不动,这是怎么回事? eclipse的进度还是红的,也不见有异常报出? …

甜扑 2021-12-03 19:08:27 867 0

java web系统防越权,就是可以直接在地址栏输入打开没有授权的页面。或者一个网站的所有链接如何爬取,并保存跳转的关系

大家好,我说一下问题和我的想法。 这是运行5年的系统了,只兼容IE,几乎不能通过重构来实现,所以写个过滤器filter应该是最简单的方案。 因为数据库…

滥情空心 2021-12-03 16:02:49 766 0

Java爬虫的翻页技巧?怎么写个比较通用的翻页方法???

Java爬虫的翻页技巧?怎么写个比较通用的翻页方法???…

猫性小仙女 2021-12-02 06:02:24 863 0

在项目中如何使用别人网站的数据的

如题,比如我要提供企业查询服务,数据是来源于住建部网站(http://jzsc.mohurd.gov.cn/dataservice/query/comp/list)的,有两种方式,一种是直接提…

柳絮泡泡 2021-12-01 22:58:42 800 0
更多

推荐作者

lorenzathorton8

文章 0 评论 0

Zero

文章 0 评论 0

萧瑟寒风

文章 0 评论 0

mylayout

文章 0 评论 0

tkewei

文章 0 评论 0

17818769742

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文