与时间相关的的分算法
在像SF这种问答网站里,热门排序里是否也考虑了时间因素?就是时间越久,权值越低,我觉得这个因素是非常必要的,在考虑浏览量,答案数,vote up的同时,也兼顾问题时效性。
我做排序也遇到这个问题,通过以上提到的各种因素排序,但是问题在于如果使用计算总分的方式,就需要不断的把当前时间作为因子,重新计算全部数据的分值,以保证时效。这样就需要多次遍历全部数据。
我希望有一种方法,在不更新旧数据的情况下,直接在查询过程中给新问题加权,有什么思路可以实现呢?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
运动员的世界排名,是按比赛分来排列的,比如:今年的分数全算,去年的算一半(各个协会不同,假设一半),前年的算1/3,大前年1/5,再之前的不算.
他们并不是每次比赛以后算一次,而是每次比赛后加上这次的分数,然后到赛季重算一次, 记住赛级开始时的分数,然后后面再累加.
你也可以用这个思路,分时间段(赛季),比如每个月算一次,得到的结果存起来,然后后面的分值就累积再这个上面,到下个时间节点再计算一次. 这是一种比较好的平衡,运算量也不多,而且不修改老数据.只是每个时间节点加权算一次
以你的程序开始上线运行开始算起,假设为今天的0点为例2012-12-26 00:00:00,
你在存储数据的时候,再加一列,类型为long,值为最新时间与初始时间的总毫秒差。
然后根据你的程序时效性要求,设定一个系数以调整时间在总分中的比重。
详细可以参考http://www.ruanyifeng.com/blog/2012/0...
将时间戳除以某个常数(如:100000),得到类似13.153,13.226之类的「时间因子」,这样越是新的内容,时间因子就越大,自然权重也就越高。