Pandas.dataframe.read_excel 读取excel 日期格式
使用Pandas分析一个excel的数据,里面有excel日期字段date
,存储的值如2018/12/31
这样的格式,使用pd.read_excel
读取所有excel数据,由于表中的值都是人为录入,为避免潜在的读取错误,特意设置了read_excel
的coverters={'date':str}
,,但是最终 dataframe 输出的日期却是:“2018-12-31 00:00:00”
这样的值,并没有原样存储excel中的值,请问有什么方法使得日期以原样的文本存储吗?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
老铁, 可以使用
datetime库
于2019.2.24 12:27更改
简单的看了下官方的接口文档:
有三处可以一试:
一.dtype参数
而
converters
参数:所以:
你可以在
read_excel()
中设置:dtype={'data':str}
, 而不是参数convert
尝试过了, 无解。。。。。。
看了后面的文档, 好像是解释器, 默认会使用
dateutil.parser.parser
来解析你的时间, 并返回pd.Timestamp
对象, 默认都是xxxx-xx-xx xx:xx:xx
, 你可以重写pd.Timestamp
的__str__()
和__repr__()
函数二.parse_dates 参数
就说下最后一段吧:
看完最后这个和时间有关参数, 我好像通了......
三.date_parser参数
翻译:
也就是说, 除非你制定一个对时间字符串不做改变的函数, 否则他一定会解析你的时间字符串转换成可以分析的格式(也就是你看到的那样
“2018-12-31 00:00:00”
),你问的是:
其实
pandas
是用来数据分析的, 时间得转换成特定的计算机能识别的格式, 计算机才可以帮我们识别分析, 如果以文本来存储, 占用内存资源大不说, 计算机也无法分析识别,反过来说, 如果仅仅只是将时间保存为文本格式, 用
excel
也行呀, 用pandas
有点大材小用的感觉