如何根据dask数据框中的另一列条件更新列值
我正在使用DASK DataFrame读取25 GB数据,
正在尝试从另一列中过滤基于条件的列,并将其变为NAN值。在熊猫中,我们使用类似的东西,
df.loc[
df['Reference'].str.contains(r'Ref',regex=True) == True,
['Reference','Ref2']
] = np.nan
但是当尝试使用Dask雇用时,
TypeError: _LocIndexer object does not support item Assignment
我是Dask的新手。
I'm reading a 25 GB data using Dask Dataframe
Was trying to filter a column based a condition from another column and make it Nan values. In Pandas we use something like,
df.loc[
df['Reference'].str.contains(r'Ref',regex=True) == True,
['Reference','Ref2']
] = np.nan
However when trying to employ with Dask getting like,
TypeError: _LocIndexer object does not support item Assignment
I'm new to Dask.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论