新手请教, python status code 302 不能够抓取登录後的网页内容

发布于 2022-09-12 01:09:52 字数 1073 浏览 8 评论 0

大家好, 我写了一段python代码, 想用来爬取登录後的网页内容.
我尝试过爬一些网站是可以成功抓取的, 但是我自己公司的网站, 却不能够抓取, 然后我看了chrome里面的后台提交信息, 发现那个status_code是302, 大概是重定向的意思, 请问我抓取不了是跟这个有关系吗? 谢谢!

不好意思, 因为这个网站是我公司的网, 所以我就把它屏蔽掉了.
第一张图片是我第一个抓取到的login内容
第二张图片是我第二个抓取到的内容, 不肯定作用是什么

这个是抓取到的login路径

这个是抓取到的第2个路径 (不肯定是不是重定向的路径)

import requests
requests.packages.urllib3.disable_warnings();

session = requests.Session();
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36',
}
data = {
    'ctl00$phContentMain$txtLoginID': 'myLoginName',
    'ctl00$phContentMain$txtPassword': 'myPassword'
}
login_url ='https://www.myWebSite.com/HPD/Login.aspx';

session.post(login_url,data=data,headers=headers,verify=False);

url2 = 'https://www.myWebSite.com/HPD/default.aspx';
response = session.get(url2);
print(response.text);

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

同展鸳鸯锦 2022-09-19 01:09:53

原来是因为这个网页是aspx的缘故, form data会比平常的多
而且网页中有一个hidden的数据, 需要从网页中获取然后在放在data里面提交才可以登录

回复收藏 0

凉风有信 2022-09-19 01:09:53

session.post(login_url,data=data,headers=headers,verify=False);

改为：`
session.post(login_url,data=data,headers=headers,verify=False,allow_redirects=False);

回复收藏 0

~没有更多了~

关于作者

眸中客

暂无简介

0 文章

0 评论

22 人气

关注发私信

lioqio

文章 0 评论 0

关注

Single

文章 0 评论 0

关注

禾厶谷欠

文章 0 评论 0

关注

alipaysp_2zg8elfGgC

文章 0 评论 0

关注

qq_N6d4X7

文章 0 评论 0

关注

放低过去

文章 0 评论 0

友情链接

文江博客

新手请教, python status code 302 不能够抓取登录後的网页内容

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签