在Python Pandas中指定多指数标头时,请使用USECOL
我有一个庞大的数据可以根据两个标头读取,但是当我使用多指数方法时,我无法在pandas dataframe中使用“ usecols”。
当我使用
df = pd.read_csv(files, delimiter=' ', header=[0,1])
它时,会花费太多时间和内存。
我试图使用的另一种方法是
df = pd.read_csv(files, delimiter=' ', usecols = ["80.375"])
仅采用一列,而应使用所有四个列,带有'80 .375'
所需输出
建议您的其他方法
请提前
I have a huge data to read based on two headers, But when I am using multi-index approach I am unable to use 'usecols' in pandas dataframe.
When I am using
df = pd.read_csv(files, delimiter=' ', header=[0,1])
it is taking too much of time and memory.
Another approach I am trying to use is
df = pd.read_csv(files, delimiter=' ', usecols = ["80.375"])
it is taking only one column, rather it should take all the four columns with header '80.375'
Desired output
Please suggest any alternative approach
Thanks in advance
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您可以使用两个通过来提取数据和标题。
输出:
输入CSV文件:
更新
输出:
You can use two pass to extract data and headers.
Output:
Input csv file:
Update
Output: