Pandas Groupby错误仅发生在大型数据集中

发布于 2025-01-29 08:40:04 字数 626 浏览 2 评论 0原文

我使用这样的代码在gropus中选择具有最大值的行：

set_f = set.loc[set.reset_index().groupby(['Scan Number'])['dda246displmils'].idxmax()]

与数据集OD〜1M行相机，但是当尝试将38M行分组时，我会遇到此错误：

keyError：'将列表类似于.loc或.loc或[]不再支持任何缺失的标签，请参见 https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#deprecate-loc-reindex-listlex-listlike'

是什么原因？更大的数据集还有其他选择吗？

谢谢，宝琳娜

原文

I use such code to select rows with max value in gropus:

set_f = set.loc[set.reset_index().groupby(['Scan Number'])['dda246displmils'].idxmax()]

and this works perfectly fine with dataset od ~1M rows but i get this error when try to group 38M rows:

KeyError: 'Passing list-likes to .loc or [] with any missing labels is no longer supported, see https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#deprecate-loc-reindex-listlike'

What is the reason? Is there any other option for bigger dataset?

Thanks,
Paulina

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

你的往事 2025-02-05 08:40:04

问题是您要选择由reset_index创建的新创建的原始索引值，因此提出错误。

解决方案在loc之前重新分配：

df = set.reset_index()
set_f = df.loc[df.groupby(['Scan Number'])['dda246displmils'].idxmax()]

Problem is you want select original index values by new created by reset_index, so raise error.

Solution is reassign back before loc:

df = set.reset_index()
set_f = df.loc[df.groupby(['Scan Number'])['dda246displmils'].idxmax()]

回复收藏 0 原文

~没有更多了~

关于作者

幻梦

暂无简介

文章

27 人气

关注发私信

陪我终i

文章 0 评论 0

关注

别忘他

文章 0 评论 0

关注

野心澎湃

文章 0 评论 0

关注

蒲公英的约定

文章 0 评论 0

关注

。

文章 0 评论 0

关注

旧时模样

文章 0 评论 0

友情链接

文江博客

Pandas Groupby错误仅发生在大型数据集中

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

陪我终i

别忘他

野心澎湃

蒲公英的约定

。

旧时模样

友情链接

Pandas Groupby错误仅发生在大型数据集中

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

陪我终i

别忘他

野心澎湃

蒲公英的约定

。

旧时模样

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。