数据去重时out of memory
在DolphinDB database中,dailybar_stock表已经加载到内存,想再做个去重,这个表是八千多万条记录,占1.4GB内存.运行下列语句时OOM(用的server节点是8G内存限制)。
dailybar_stock=select * from dailybar_stock where isDuplicated([symbol,date],FIRST)=false
请教一下,是否还有别的占用较少内存的办法可以去重?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
可改用下列sql试试:
hashmap比较耗内存。这个context by使用排序算法,节约内存。