在加权桶列表中确定性地分配一个id

发布于 2024-10-08 14:08:14 字数 268 浏览 12 评论 0原文

我正在一个网站上运行 n 个拆分测试。我想将均匀分布的整数用户 ID 分配给 n 个存储桶之一，并且确定性地使同一用户始终获得相同的测试。

此时，我可以通过将用户 ID 修改为 n，在拆分测试列表中选择一个索引。如果我想对某些测试进行加权怎么办？

例如，存储桶 #1/21 被分配 90% 的时间，而其余 20 个测试被分配 0.5% 的时间。

我觉得我可以以某种方式扩大列表的大小，并且仍然使用 mod 技术来实现这一点，但是在内存中拥有潜在的巨大的临时列表似乎不太优雅。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

爱冒险 2024-10-15 14:08:14

如果大多数存储桶具有不同的大小，其中大小定义为 id 的百分比，那么您必须以某种方式在内存中表示它。否则，你怎么知道这些百分比呢？

一种可用的解决方案是使用 100 个虚拟存储桶，每个虚拟存储桶代表 1% 的 id。然后将 90 个虚拟存储桶关联到存储桶 #1/21。然后，您可以执行 mod 100，如果它落在前 90 个虚拟存储桶中，则将 id 分配给存储桶 #1。您可以通过将每个存储桶的百分比除以所有百分比的 GCD 来获得虚拟存储桶的最佳数量，在您的示例中为 0.5 (GCD(90, 0.5))。

从您的示例来看，只有一种不同的存储桶大小。最佳解决方案实际上取决于您可以采取什么类型的安排。

回复收藏 0 原文

~没有更多了~