根据条件在 Dataframe 中乘以多列的最快方法
data = [{'a': 12, 'b': 23, 'c':34, 'd': 0.1, 'e':25},
{'a':13, 'b': 26, 'c': 38, 'd': 0.02, 'e':26},
{'a':19, 'b': 28, 'c': 31, 'd': 0.04, 'e':22}
]
# Creates DataFrame.
df = pd.DataFrame(data)
a b c d e
0 12 23 34 0.10 25
1 13 26 38 0.02 26
2 19 28 31 0.04 22
我有一个非常大的数据框,由 20 列和 2000 万行以上组成,我想将某些列乘以 d 列。
例如,在本例中,我想将 a、c 和 e 列乘以 d 列中的百分比我想知道执行此操作的最快方法是什么
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
如果由列列表选择多个值, dataframe.mul 它是快速:
numpy替代方案,但不快:
If multiple values selected by list of columns names by
DataFrame.mul
it is fast:Numpy alternative, but not faster: