DefaultHttpClient和DecompressingHttpClient的区别
在抓取bilibili弹幕文件的时候,例如 http://comment.bilibili.com/11243252.xml。
用DecompressingHttpClient可以获取到正确的内容,但是用DefaultHttpClient读出来的救赎一堆乱码。
看来是解压缩的缘故。
现在我用的是https://github.com/kevinsawicki/http-request这个库,它的自动解压不好用。(没有使用apache的那一套)
我能用什么方法去自己解压这些内容呢
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
1.指定Accept-Encoding 如:request.addHeader("Accept-Encoding", "gzip,deflate");
2.接受的response进行解压处理
可以看一下DecompressingHttpClient的源码