我正在寻找一个算法来排序网站结果受欢迎程度..像Reddit的所以老年人的一个帖子较少的权力,它的投票/得分.
以下是reddit使用的普遍接受的解决方案:
t = (time of entry post) - (Dec 8,2005) x = upvotes - downvotes y = {1 if x > 0,0 if x = 0,-1 if x < 0) z = {1 if x < 1,otherwise x} rank = log(z) + (y * t)/45000
我已经在Reddit的算法,虽然它适合一种情况,我真正需要的是两种算法,一种是热门帖子,另一种用于即将发布的帖子:
>热门帖子
>即将发帖
受欢迎的人会减慢速度,给稍微老一些的职位增加压力,即将到来的职位今天将更多地集中在热门职位上,在N小时/天/天之后急剧下降.
我正在使用Sphinx表达式编写,所以我不能写一个很难的复杂算法,我只能访问以下功能:
http://sphinxsearch.com/docs/current.html#numeric-functions
所以我有每个帖子的以下数据:
>发布年龄在几秒钟
>发表评分
这是我目前的解决方案:
Exponent = 0.01 (Popular),0.5 (Upcoming) SecondsSincePublised = abs(CurTimeInSecondsSinceDate-PubTimeInSecondsSinceDate) Rank = (log10(Postscore)*10000) / pow(SecondsSincePublised,Exponent)
虽然这个解决方案确实可行,但并不理想.在过去的几个小时里,一个新的和受欢迎的帖子通常在流行和即将到来的时候都很高,这不是我想要的.
任何人都可以提出另一种算法,我可以修改指数组件来调整衰减?
解决方法
你尝试过使用黑客新闻的排名算法吗?
实现简单
实现简单
score = (P-1) / (T+2)^G where,P = points of an item (and -1 is to negate submitters vote) T = time since submission (in hours) G = Gravity,defaults to 1.8 in news.arc
您可以改变重力来调整衰减.
有关更多信息,请参阅How Hacker News ranking algorithm works