scala的distinct函数怎么用?
我这样写:
val validRDD = unionRDD.map(item => {
val arr = item.split(' ')
((arr(1), arr(2)), arr(3).toDouble)
})
.distinct()
unionRDD中是用空格隔开的数据
先转成一个二元tuple
但是distinct似乎不能对元组去重
结果还是有重复的,如下:(这是打印的validRDD)
如何解决?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
你看看呢:
希望能帮助到你。