使用 usecols 将 CSV 文件读入 Dask DataFrames

发布于 2025-01-09 01:30:07 字数 267 浏览 3 评论 0原文

我正在 dask 中阅读 CSV 文件,但在阅读时,我想像我们在 panads 中使用的那样“usecols”。

我目前用于 DASK 的内容,

df = dd.read_csv('myfiles.csv')  #in dask

我想像我们在 pandas 中一样使用,

df = pd.read_csv('myfiles.csv',usecols=["date", "loc", "x"])

I am reading CSV file in dask but while reading, I want to "usecols" as we use in panads.

What I am currently using for DASK,

df = dd.read_csv('myfiles.csv')  #in dask

I want to use like this as we can do in pandas,

df = pd.read_csv('myfiles.csv',usecols=["date", "loc", "x"])

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

明媚如初 2025-01-16 01:30:07

您尝试过吗:

df = dd.read_csv('myfiles.csv',names=["date", "loc", "x"])

这是 pandas.read_csv

names 类似数组,可选

要使用的列名称列表。如果文件包含标题行,则应显式传递 header=0 来覆盖列名称。此列表中不允许有重复项。

您可以使用额外的关键字参数转发到 pandas.read_csv()
dask.dataframe.read_csv 所以甚至

df = dd.read_csv('myfiles.csv',usecols=["date", "loc", "x"])

可以用于你。

Have you tried:

df = dd.read_csv('myfiles.csv',names=["date", "loc", "x"])

Here is a definition from pandas.read_csv

names array-like, optional

List of column names to use. If the file contains a header row, then you should explicitly pass header=0 to override the column names. Duplicates in this list are not allowed.

You can use Extra keyword arguments to forward to pandas.read_csv().
dask.dataframe.read_csv so even

df = dd.read_csv('myfiles.csv',usecols=["date", "loc", "x"])

will work for you.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文