如何爬取 某些网页,返回一些奇怪的东西?
连接都是我使用fidder 抓包手机App得到的,可是我明明看到的是 刷新出的是页面,可是连接 却返回这么个东西,没有jison什么的
这是个什么玩意,怎么搞?
1.
可以 看到连接的路径 说的都是 新闻的列表 ,可是 返回个 文件。。。
2.
这个好歹有数值,虽然不知道乱码 是怎么回事?
刷新页面 看到的是 用户操作列表,可以实际 返回确实 一串 什么码,这个怎么抓?
第1个 是个app,叫掌上基金
第2.3个是个app,叫 股票雷达
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(5)
用javascript也可以写爬虫 在云端编写和执行 源码地址:
https://github.com/ShenJianShou/crawler_samples
伪装头,伪装cookie,检测是否有中间页
首先是请求地址是否要登录信息,是否需要父级地址作参数,url请求编码
请求头里面可能也会有特殊参数,光看url没用
返回文件,可能请求表头返回格式有关,乱码,可能是有表头信息编码有关,