python如何随机加权选取n个数据
1、有一个文件,文件格式:
A m n
例如:
天气 4 2
达康书记 8 10
啦拉拉 2 1
...
A表示数据名称;m表示数据值;n表示该数据出现的次数
2、如何快速根据不同数据出现的次数作为依据,随机选择出n个数据呢?
3、自己的想法:
自己在网上搜索了python关于random的资料,一般的思路就是,多个随机选择一个,是根据权重和来进行随机的。
对于选择多个,自己目前是先统计所有的权重和,根据这个sum,random.randint(0, sum)随机出一个数,然后加到每一个值上,最后根据这个值进行排序,取值最高的n个。
4、自己的疑问:
面对千万级别行数的数据,如何减少计算时间?
随机的方法是否是可靠,随机选取多个有没有更好的方法?
非常感谢!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论