记忆错误在巨大的dask.dataframe上计算Pearson相关性
我有一个巨大的数据集(9m行 * 125 Cols),我正在尝试找到一种计算可变与静止的Pearson相关性的方法。我收到此任务的内存错误。我尝试了Dask作为解决方案,如[在此处输入链接描述] [1]中所建议的解决方案,但它不起作用。
I have a huge dataset (9M rows * 125 cols) and I am trying to find a way to calculate the Pearson correlation for a variable vs rest. I receive memory error for this task. I tried dask as a solution as suggested in [enter link description here][1] but it did not work.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论