如何读取python中的data.parquet.gz文件?

发布于 2025-02-12 13:23:25 字数 225 浏览 0 评论 0原文

如何读取文件 data.parquet.gz 并将其转换为PANDAS数据框架?

下面的代码给出错误:

无法打开镶木点输入源'':镶木魔术字节 在页脚中找不到。该文件已损坏,或者这不是 parquet文件。

df = pd.read_parquet('data.parquet.gz')

How to read file data.parquet.gz and convert it into a pandas dataframe?

Below code is giving error:

Could not open Parquet input source '': Parquet magic bytes
not found in footer. Either the file is corrupted or this is not a
parquet file.

df = pd.read_parquet('data.parquet.gz')

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

情魔剑神 2025-02-19 13:23:25

您的文件是GZIP存档,您可以阅读就像:

import gzip

with gzip.open('data.parquet.gz', 'rb') as f:
  df = pd.read_parquet(f)

You file is an gzip archive, you can to read is like so:

import gzip

with gzip.open('data.parquet.gz', 'rb') as f:
  df = pd.read_parquet(f)
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文