python如何随机加权选取n个数据

发布于 2022-09-04 19:21:49 字数 431 浏览 30 评论 0

1、有一个文件,文件格式:
A m n
例如:
天气 4 2
达康书记 8 10
啦拉拉 2 1
...

A表示数据名称;m表示数据值;n表示该数据出现的次数

2、如何快速根据不同数据出现的次数作为依据,随机选择出n个数据呢?

3、自己的想法:
自己在网上搜索了python关于random的资料,一般的思路就是,多个随机选择一个,是根据权重和来进行随机的。
对于选择多个,自己目前是先统计所有的权重和,根据这个sum,random.randint(0, sum)随机出一个数,然后加到每一个值上,最后根据这个值进行排序,取值最高的n个。

4、自己的疑问:
面对千万级别行数的数据,如何减少计算时间?
随机的方法是否是可靠,随机选取多个有没有更好的方法?

非常感谢!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文