windows下python控制台输出中文乱码问题?

发布于 2022-09-01 18:51:43 字数 116 浏览 20 评论 0

在做爬虫的时候爬到的中文在控制台中显示乱码,编辑器用的是notepad++
是在powershell中运行的python程序。
在网上搜索了也没有找到合适的解决方法
请问各位这个如何解决? 先谢谢了!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(8

南渊 2022-09-08 18:51:43

首先,code utf8加了没?
最前面加上下面这句

#-*_coding:utf8-*-

其次, 有些网页不一定是utf8编码的, 这样的网页里的中文爬下来要先转码才能打印, 例如,很多网页是GBK编码的,可以用下面这一行代码转成Unicode的

unicodePage = myPage.decode("gbk").encode('utf-8').decode('utf-8')
熊抱啵儿 2022-09-08 18:51:43

网页上的编码方式和你本地环境的编码方式不一样,设置本地编码为网页的编码方式。

惯饮孤独 2022-09-08 18:51:43

网页一般是uft-8编码的,Windows上gbk编码的,做好适当的转码就OK了

优雅的叶子 2022-09-08 18:51:43

环境变量里面设置PYTHONIOENCODING为UTF8

素食主义者 2022-09-08 18:51:43

print u'中文'?

挽心 2022-09-08 18:51:43

加一句这个试试呢

import sys
reload(sys)
sys.setdefaultencoding('utf-8')
烙印 2022-09-08 18:51:43

一些招数:

#coding=utf-8
from __future__ import unicode_literals

3 利用unicode做中间桥梁(不得不说在Windows上用Python还是比较不爽的)
潦草背影 2022-09-08 18:51:43

题主问题太不具体,不是一个好问题!

Windows上面Python 2.x程序涉及到中文字符时建议:

  • Python源码文件保存的时候保存为UTF-8无BOM编码格式

  • 在Python源码文件第一行或者第二行加上

        # -*- coding:utf8 -*- 
  • 所有代码中出现中文字符串的地方用Unicdoe对象,用u''包起来

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文