月光博客

青青子衿, 悠悠我心, 但为君故, 沉吟至今

« Google打不开的解决方法和IP地址表无花的蔷薇 »

热文排行的算法进行了优化

  今天打算更改一下我的Blog的文章排行算法。

  以前的算法是根据点击数目来排行,有很多不足的地方,比如没有考虑时间因素,没有考虑用户对其的推荐等因素,最近使用抓虾系统的时候,对抓虾的“热文排行”算法产生了兴趣,因此我也打算使用类似的排行来进行我的Blog的文章排行。

  其中的积分算法是比较难确定的,我打算以文章浏览次数,评论次数,引用次数以及文章的日期来生成。把用户的评论数目作为推荐次数,文章的发表日期到今天的时间做为时间因素。

  1条评论和100次浏览有相同积分。

  1条Traceback等于2条评论的积分。评论和引用的增长是线性的。

  浏览次数增大,取得的积分以开平方根的方式增长,即数字越大,变化越小。

  文章的日期做为负积分,以指数方式增长,越老的文章,会变为越来越大的负数积分。

  用数学算法表示即:log_CommNums*100 + log_TrackBackNums*200 + sqr(log_ViewNums)*10 - (date()-Log_PostTime)*(date()-Log_PostTime)

  从这个算法中,引用和评论对积分的增加影响最大,时间因素对积分的减少影响最大。以这个算法产生的“热文排行”见左边,其每天会自动更新,我将观察一段时间,看看这个算法的效果如何。

  具体的修改方法如下:

  在c_system_event.asp中加入下面的函数:

'*********************************************************
' 目的:    重建排行
'*********************************************************
Function BlogReBuild_Toplist()

 Dim i
 Dim objRS
 Dim objStream
 Dim objArticle
 Dim strLogUrl

 Dim strPrevious
 Set objRS=objConn.Execute("SELECT [log_ID],[log_Url],[log_Title] FROM [blog_Article] WHERE [log_Level]>1 ORDER BY log_CommNums*100 + log_TrackBackNums*200 + sqr(log_ViewNums)*10 - (date()-Log_PostTime)*(date()-Log_PostTime) DESC")

 If (Not objRS.bof) And (Not objRS.eof) Then
  For i=1 to ZC_PREVIOUS_COUNT
   strLogUrl=objRS("log_Url")
   If IsNull(strLogUrl) Or IsEmpty(strLogUrl) Or strLogUrl="" Then
    strLogUrl=objRS("log_ID")
   End If
   strLogUrl=ZC_BLOG_HOST & ZC_STATIC_DIRECTORY & "/" & strLogUrl & "." & ZC_STATIC_TYPE
   strPrevious=strPrevious & "<li><a href="""& strLogUrl & """>" & objRS("log_Title") & "</a></li>"
   objRS.MoveNext
   If objRS.eof Then Exit For
  Next
 End If
 objRS.close

 strPrevious=TransferHTML(strPrevious,"[no-asp]")

 Set objStream = Server.CreateObject("ADODB.Stream")
 With objStream
 .Type = adTypeText
 .Mode = adModeReadWrite
 .Open
 .Charset = "utf-8"
 .Position = objStream.Size
 .WriteText = strPrevious
 .SaveToFile BlogPath & "/include/toplist.asp",adSaveCreateOverWrite
 .Close
 End With
 Set objStream = Nothing

 BlogReBuild_Toplist=True

End Function
'*********************************************************

  然后在MakeBlogReBuild函数的BlogReBuild_Categorys后面加上一行BlogReBuild_Toplist。

  修改c_html_js.asp,在f="TRACKBACKS"后面增加
 ElseIf f="toplist" Then
  f="TOPLIST"

  修改single.html模板文件,在合适的位置增加下面几行。
<div class="function" id="divTopList">
<h3>热文排行</h3>
<ul>
<script language="JavaScript" src="<#ZC_BLOG_HOST#>c_html_js.asp?include=toplist" type="text/javascript"></script>
</ul>
</div>

  最后,重建索引,重建文件,就完成了。

  具体效果参见本页左边的“热文排行”栏目。

  更新:在Z-BLOG 1.7下的修改方法

  前面修改代码不变,之后,修改TEMPLATE\default.html模板,在适当位置加入以下语句:

<div class="function" id="divTopList">
<h3>热文排行</h3>
<ul>
<#CACHE_INCLUDE_TOPLIST#>
</ul>
</div>

  修改TEMPLATE\single.html模板,在适当位置加入以下语句:

<div class="function" id="divTopList">
<h3>热文排行</h3>
<ul id="ulToplist">
<script language="JavaScript" type="text/javascript">strBatchInculde+="ulToplist=toplist,"</script>
</ul>
</div>

  最后重建索引即可。

  参考文章:抓虾指数的热文排行的产生

  来源:http://www.zhuaxia.com/blog/?p=20

  抓虾的热门文章是大家“顶”上来的。对于每篇文章,每个人有且仅有一票(包括我们虾米自己也一样,只有一票)。推荐出来的文章,按下面的规则排列顺序,希望能够兼顾文章的新鲜(按时间)和价值(按票数)。

  1、两天之内推荐的文章,优先于超过两天的;

  2、同样是两天之内推荐的文章,票数高的优先;

  3、同样是两天之内,且同样票数的文章,最近被推荐过的优先。

  也就是说,假如一篇文章在两天内无人继续推荐,估计大家对它的兴趣就不大了,或者说它有点“过时”了,它就应该被排在后边。

  “两天”的窗口期是暂时拟定的,以后也许会调整。另外,每个人的那一票,以后的权重可能会不一样(比如,如果小虾推荐的文章总是被大家认可,那末小虾以后的推荐会更有分量。)总的想法,还是希望平衡文章的新鲜和价值。以后会加分类,搜索,和过滤功能,让大家更方便地看到自己喜爱的文章。



原创文章如转载,请注明:转载自月光博客 [ http://www.williamlong.info/ ]

本文链接地址:http://www.williamlong.info/archives/521.html
  • 文章排行:
  • 抓瞎豆瓣(引用)
  • OtherSide
  • 网络上掀起一股称赞抓虾和豆瓣的热潮,我百思不得其解。
    我首先使用抓虾时,先从GreatNews导出了OPML列表,然后直接导入到抓虾,提示成功时我觉得好神奇,刷新一看,果然都导进去了,不...
  • 2006-6-4 20:31:05
  • 1.deeper
  • hi~~William.
    我最近在弄自己的BLOG.
    觉得你现在用这个程序不错.
    也下载了.结果一头雾水..
    不知道可否加你QQ请教一下???
  • 2006-6-3 19:58:40
  • 7.DBY
  • http://WWW.CDB.COM
  • 然后在MakeBlogReBuild函数的BlogReBuild_Categorys后面加上一行BlogReBuild_Toplist。
    这个不知道在那里改的呀???????????????????
  • 2006-6-4 14:22:30
  • 16.蓝色
  • sqr函数在sql数据库的查询语句中显示不可识别

    Microsoft OLE DB Provider for SQL Server 错误 '80040e14'

    'sqr' 不是可以识别的 函数名。
  • 2006-8-11 16:19:26
  • 21.seehots
  • http://www.seehots.com/
  • <div class="function" id="divTopList">
    <h3>热文排行</h3>
    <ul>
    <script language="JavaScript" src="<#ZC_BLOG_HOST#>c_html_js.asp?include=toplist" type="text/javascript"></script>
    </ul>
    </div>

    请问下,调用有问题,该怎么修改?
    你的调用是:<script language="JavaScript" src="http://www.williamlong.info/c_html_js.asp?include=toplist" type="text/javascript"></script>
    我的用http://www.seehots.com/blog/include/toplist.asp能打开,说明include里有这个文件,但是js调用的时候缺怎么也显示不出来,不知道是什么原因,有空请回答下,谢谢
  • 2006-12-10 23:27:42
  • 28.ieqiang
  • 真希望好心人williamlong 能够在百忙之中抽点时间出来改下以适合1.7版本的ZBLOG。。毕竟c_html_js.asp文件现在已和以前的版本不同了,所以不知该如何改,好希望能用上这个。。再次谢谢!!
  • 2007-2-27 12:25:03
  • 34.dodol
  • 如果使用的是http://www.williamlong.info/archives/521/521/就不行了
    产生的链接是http://www.williamlong.info/archives/521.html这种啊!
    麻烦改进一下哦!
  • 2007-6-28 9:34:49
  • 36.jones.c
  • http://www.ccfish.cn
  • 又出了新问题。就是在开启了自定义的目录名后。这个生成的热文排行会有url错误的情况。。。查看代码是因为指定了默认的目录名导致。不知道要怎么修改。

    strLogUrl=ZC_BLOG_HOST & ZC_STATIC_DIRECTORY & "/" & strLogUrl & "." & ZC_STATIC_TYPE

    他是定义了这个url格式为blog的域名+默认目录+文章算定义的名字+网页自定义的后缀名。

    但是如果是在后台自定义了静态页面和自定义目录后,再用这个热文就会出错。。不知道要怎么修改。望大家帮帮忙。
  • 2007-7-14 20:04:32
  • 42.afan
  • http://faninfo.cn/blog
    为什么热门文章显示是这样啊
    热文排行
    <#CACHE_INCLUDE_TOPLIST#>
    为什么?
  • 2008-1-25 23:20:48

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 通过Google订阅本站
  • 通过鲜果订阅本站
  • 通过抓虾订阅本站
  • 通过电子邮件订阅本站

站内搜索


热文排行

最新评论及回复

最近发表

本站采用创作共用版权协议, 要求署名、非商业用途和保持一致. 转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议.

This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License.