goquery是不是只支持英文,另,go语言的中文乱码如何解决
使用goquery来对网页爬虫的时候发现它对于很多中文网站都无法解析(试过 豆瓣,知乎),有的可以解析但打出来是诸如“
α?ȥ???Ŵ?????ʫ?ʷ?չ?ִ?????”的东西(对百度新闻解析),所以请问使用过goquery的大大们,确实是这样的吗?还是我代码写错了的原因?另,go语言的中文乱码问题要如何解决?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
你得自已去处理流并进行utf8与gb18030之间的转换
刚试了下osc没有乱码,乱码应该是网站不是utf-8引起的。
代码如下:
如果有乱码,使用iconv-go转码就可以了。