np.where处理数据占用内存过大

发布于 2022-09-12 23:01:10 字数 542 浏览 28 评论 0

当在代码中按照条件设置 amount 列的值

当包含 M 时, 数值100000
当包含 X 时, 数值1000

想通过 np.where 来实现,结果出现占了服务器50%以上的内存
请问这是什么引起的?

image.png

import numpy as np
# df_split_desc['amount'] = np.where(df_split_desc['amount'].str.contains('M'),
#                                    df_split_desc['amount'] * 1000000, x)
# df_split_desc['amount'] = np.where(df_split_desc['amount'].str.contains('K'),
#                                    df_split_desc['amount'] * 10000, x)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

请叫√我孤独 2022-09-19 23:01:10

你的 amount 是字符串,字符串乖以100万等于把它重复100万次所以内存爆了。。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文