atom中python使用pandas.read_table()打开文本中文乱码

发布于 2022-09-03 01:04:17 字数 462 浏览 15 评论 0

atom中使用python的pandas.read_table()打开编码为utf-8无bom格式的文档,然后使用atom的运行程序的包script运行以下代码:

# coding=utf-8
import pandas as pd
path = u'C:\\Users\\xilig\\Desktop\\北京-jd\\化妆师.txt'
print pd.read_csv(path, sep='|', header=None)

程序运行没有报错,但是结果是这样的:

clipboard.png
而同样的程序在pycharm中运行却可以正常显示中文,这是为什么

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

不回头走下去 2022-09-10 01:04:17

同样的程序在pycharm中运行却可以正常显示中文
编码为utf-8无bom格式的文档

估计是cmd 编码的问题

Pycharm 进行了编码的处理应该, atom可能直接用了中文系统的cmd.

地狱即天堂 2022-09-10 01:04:17

我猜想你的txt文件是gbk的编码
两种办法:

一是修改你txt文本的编码为utf-8,不用改代码
二是指定编码方式
print pd.read_csv(path, sep='|', header=None, encoding='gbk')
琉璃梦幻 2022-09-10 01:04:17

先转码吧,建议你先去了解一下文件编码相关的知识,这样才能有恃无恐
windows下用notepad++比较方便
Ubuntu iconv -f GBK -t UTF-8 sourceFile.txt -o outputFile.txt

http://manpages.ubuntu.com/manpages/precise/man1/iconv.1.html

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文