Python:今日头条页面超链接中的参数(_signature)如何获取?

发布于 2022-09-07 04:34:29 字数 811 浏览 10 评论 0

主页:
https://www.toutiao.com/c/use...
通过抓包可以得到文章列表页的网址为:
https://www.toutiao.com/c/use...
返回格式为json,结果如下:
图片描述

以上的连接我是在火狐浏览器中获取的,如果在其他浏览器中打开,并不能取得数据。

问题:

请问在python中,如何高效的获取指定用户主页中的所有文章url呢?
要得到文章url的话,必须取得以下几个参数:
as、cp、max_behot_time和_signature

方案:
1.使用python实现以上几个参数的生成过程(难道较大)
2.使用selenium来加载页面(效率很慢)
3.请补充
请问还有其他的方案吗?可以高效实现

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

爱人如己 2022-09-14 04:34:29

只能看网页代码自己分析了,应该都在js里面

睫毛上残留的泪 2022-09-14 04:34:29

https://s3.pstatp.com/toutiao...
第818行:e = TAC.sign(userInfo.id + '' + c.params.max_behot_time)
第823行:_signature: e

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文