将文件另存为 csv 后 UDF 数据值发生变化

发布于 2025-01-19 14:31:03 字数 641 浏览 2 评论 0原文

我使用 UDF 生成了一个随机 userId ，并将其分配给 df.show() 之后使用 withColumn 的表

，这是表：

userID	name
bdjq7vn3	Jhon
8br64v24	Ronan

但是，当我将新创建的 df 作为 csv 文件写入本地计算机时，用户 ID 为 changeD

本地 csv 表：

userID	name
3r8fmkt1	Jhon
fmwxgc28	Ronan

这是什么魔法？

原文

I've generated a random userId using UDF and assigned it to the table with withColumn

after df.show() this is the table:

userID	name
bdjq7vn3	Jhon
8br64v24	Ronan

however when i write the newly created df to my local computer as a csv file, the userID is changeD

local csv table:

userID	name
3r8fmkt1	Jhon
fmwxgc28	Ronan

what sorcery is this?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

趴在窗边数星星i 2025-01-26 14:31:03

这种不一致的原因就像艾玛的comment、show 和 save 是两个操作，您的 UDF 将被调用两次，因此有两个不同的随机 ID。

如果您需要随机用户 ID，那么您需要生成一次（使用您的 UDF 或 monotonically_increasing_id 或 rand），然后保存它。您的 ID 将被永久存储并且不会再更改。

回复收藏 0 原文

~没有更多了~

关于作者

抱猫软卧

暂无简介

文章

27 人气

关注发私信

alipaysp_snBf0MSZIv

文章 0 评论 0

关注

梦断已成空

文章 0 评论 0

关注

瞎闹

文章 0 评论 0

关注

凯凯我们等你回来

文章 0 评论 0

关注

寄意

文章 0 评论 0

关注

似梦非梦

文章 0 评论 0

友情链接

文江博客

将文件另存为 csv 后 UDF 数据值发生变化

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签