匿名客户数据以进行开发或测试

发布于 2024-07-09 07:39:30 字数 401 浏览 17 评论 0原文

我需要获取包含真实客户信息（姓名、地址、电话号码等）的生产数据，并将其移至开发环境中，但我想删除任何真实客户信息。

这个问题的一些答案可以帮助我生成新的测试数据，但是如何我是否要替换生产数据中的这些列，但保留其他相关列？

假设我有一张桌子，里面有 10000 个假名字。我应该通过 SQL 更新进行交叉连接吗？或者做类似的事情

UPDATE table
SET lastname = (SELECT TOP 1 name FROM samplenames ORDER By NEWID())

原文

I need to take production data with real customer info (names, address, phone numbers, etc) and move it into a dev environment, but I'd like to remove any semblance of real customer info.

Some of the answers to this question can help me generating NEW test data, but then how do I replace those columns in my production data, but keep the other relevant columns?

Let's say I had a table with 10000 fake names. Should I do a cross-join with a SQL update? Or do something like

UPDATE table
SET lastname = (SELECT TOP 1 name FROM samplenames ORDER By NEWID())

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

流星番茄 2024-07-16 07:39:30

如果您了解数据库，这比听起来更容易。必要的一件事是了解个人信息未规范化的地方。例如，客户主文件将具有名称和地址，但订单文件也将具有可能不同的名称和地址。

我的基本过程：

ID 数据（即列）以及包含这些列的表。
ID 这些列的“主”表，以及这些列的非规范化实例。
调整主文件。不要尝试随机化它们（或使它们变得虚假），而是将它们连接到文件的密钥。对于客户 123，将名称设置为 name123，地址设置为 123 123rd St, 123town, CA, USA，电话 1231231231。这样做的额外好处是使调试变得非常容易！
通过从主文件更新或通过执行相同类型的去个性化来更改非正常实例

它看起来不太漂亮，但它有效。

回复收藏 0 原文