Python:今日头条页面超链接中的参数(_signature)如何获取?
主页:
https://www.toutiao.com/c/use...
通过抓包可以得到文章列表页的网址为:
https://www.toutiao.com/c/use...
返回格式为json,结果如下:
以上的连接我是在火狐浏览器中获取的,如果在其他浏览器中打开,并不能取得数据。
问题:
请问在python中,如何高效的获取指定用户主页中的所有文章url呢?
要得到文章url的话,必须取得以下几个参数:
as、cp、max_behot_time和_signature
方案:
1.使用python实现以上几个参数的生成过程(难道较大)
2.使用selenium来加载页面(效率很慢)
3.请补充
请问还有其他的方案吗?可以高效实现
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
只能看网页代码自己分析了,应该都在js里面
https://s3.pstatp.com/toutiao...
第818行:e = TAC.sign(userInfo.id + '' + c.params.max_behot_time)
第823行:_signature: e
请看这里 https://github.com/01ly/TTBot