青青子衿, 悠悠我心, 但为君故, 沉吟至今
« 百度日文初步评测抓虾即将支持目录阅读 »

Google的博客搜索排名分析

  今天在“谷歌治印”里看到一篇翻译Google Blogoscoped转载的Ionut Alex. Chitu修改的原创于seroundtable的文章(好大一个圈啊),讲的是Google博客搜索对于页面排名的一些分析,我这里谈一下我的看法。

  Google的BlogSearch默认是按照“相关度”(relevance)进行排序的,还有一种是按照时间排序。按照时间排序的规则很简单,就是最新的文章放在最前面。按照相关度排序,则是使用某种特殊的公式计算出一些参考分数,然后对这些分数进行排序。

  和原文说的一样,有利因素为正分,不利因素为负分。在有利因素中,应该还包括一个时间因素,据现在最近的文章其加分越高,反向链接也是一个重要参数,反向链接越多,加分越高。这两个因素应该是最为重要的因素。其他因素就是内容的相关性了,这实际上和普通网页搜索没有什么区别。

  Google博客排名的这个专利文档里面讲述的更为详细,不过我还没有仔细看过,有时间一定好好读一下,估计能学到不少东西。

  下面是关于Google Blogsearch排名规则的原文。

Google的博客排名专利

  Google在2005年年底的一份“博客排名文档”专利文件现在生效。(我没有在文件里看到过Google提及这个,但我知道一些在Google工作的工程师如Andriy Bihun, Jason Goldman and Vinod Marur.Google呈现了一组包括有利因素和不利因素的指标。为了清除Spammers,这个已经在Google博客搜索中上线了。不管怎样,从这可以窥探出Google是怎样想的。

  这里是一些对博客搜索有利因素:

  1. 博客的流行程度
  2. 是否存在于其它博客中“博客链接”里
  3. 大量的订阅数
  4. 标签的使用
  5. 在博客地址中包含的电邮地址和聊天记录(我在想Google是否把分析Gmail或Google Talk内容也用于这种用途?)

  博客或博客文章的PageRank(Google加入“博客文档”(例如一片文章)也许和PageRank没有关系(例如发表一篇新文章)。在这些情况下。新的博客文章可以把博客的PageRank保留下来和单独的PageRank为新文章确定下来)

  这里是一些不利因素:

  1. 文章在短暂时间内连续发表, 像自动的一样
  2. 在博客里发表重复的文章
  3. 使用在spam里经常出现的词汇
  4. 每片文章都是非常相似的长度
  5. 博客里的很多链接都是指向同一个网站的
  6. 包含很多广告

  当然,每个spammer同样也可以使用标签,并且有些很好的博客也有很多广告,所以我们可以把这些指标看成个别元素,缺少任何元素的存在或非存在都不能形成一个完整的好的博客。举个例子,Google可以根据其多少可见性来指定每属性几组点,通过属性的重要性来调整其价值,然后将它同某些人口进行比较来决定怎么来评定排名(或将它评定为spam)

  [经由 Ionut Alex. Chitu, 在 Search Engine Roundtable看到的.]

  原文:Google's Blog Ranking Patent , Translated by KEViN恺



  除非注明,月光博客文章均为原创,转载请以链接形式标明本文地址

  本文地址:http://www.williamlong.info/archives/835.html
  • 文章排行:
  • 3.windlike
  • 楼上说的是真的。

    只要你尝试搜索‘南京大屠杀’等类似字眼,页面就打不开了,而且你也不能再进行第二次搜索。
  • 2007/3/23 14:50:49   支持(6)反对(3) 回复
  • 5.Stonemirror
  • 标签使用有什么讲究么?
  • 2007/3/22 15:57:45   支持(9)反对(7) 回复
  • 10.yahoo
  • “请大家打开‘百度日文’首页,搜索‘南京大屠杀’或‘钓鱼岛’,你们自己看看能搜出结果吗?出现的无非是:‘该页无法显示’的提示,而且在以后的短时间内,你将不能使用‘百度日文’进行搜索。但是如果你搜索‘尖阁列岛’(即我中国钓鱼岛的鬼子叫法),就可以搜到结果。这摆明是对我中华人民共和国,对所有华夏儿女的蔑视!丑恶的亲日反华的鬼子企图从互联网上对我国进行信息封锁!用心极其险恶!
  • 2007/3/22 16:50:56   支持(6)反对(6) 回复
  • 12.宛川骄子
  • google做的很好,从我搜索的一些资料来看,他每天都在改进!
  • 2007/3/22 21:52:50   支持(5)反对(5) 回复
  • 13.sangern
  • 请大家打开‘百度日文’首页,搜索‘南京大屠杀’或‘钓鱼岛’,你们自己看看能搜出结果吗?出现的无非是:‘该页无法显示’的提示

    操!真的!
  • 2007/3/23 13:02:02   支持(6)反对(6) 回复
  • 15.kaily
  • 刚刚网站不能访问,难道又黑了
  • 2007/3/22 22:54:48   支持(3)反对(4) 回复
  • 16.felicia
  • 大概我是猜对了。我想以后他们应该会再加入一些规条吧?!
  • 2007/3/24 16:34:16   支持(3)反对(4) 回复
  • 19.pig
  • 4楼的,那是伟大的贡惨挡设置的网关过滤掉了。
  • 2007/3/23 2:16:20   支持(2)反对(4) 回复
  • 20.AT
  • 在博客地址中包含的电邮地址和聊天记录

    这个…………
  • 2007/3/23 2:25:16   支持(3)反对(5) 回复
  • 21.fixpig
  • 8楼的难道没看出来那是一种反讽么?
    是针对过去某些组织故意中伤Google的一种反讽罢了。
    既然太多FQ容易受到这种影响,不妨使用这种反讽来向那些FQ宣传。
  • 2007/3/23 2:33:48   支持(3)反对(5) 回复
  • 22.狂风
  • 关于搜索的东西还是需要好好研究学习的。博客搜索。
  • 2007/3/23 10:12:03   支持(2)反对(4) 回复
  • 23.Sul
  • 我喜欢这样的BLOG风格
    简洁而不简单
  • 2007/7/7 4:28:18   支持(3)反对(5) 回复
  • 26.storey
  • 只 要对读者有用的BLOG,自然排名高。
  • 2007/3/22 16:19:15   支持(4)反对(8) 回复
  • 27.scofield
  • 为什么博客那受搜索引擎欢迎```
  • 2007/3/25 23:37:47   支持(4)反对(8) 回复

发表评论:

 请勿发送垃圾信息、广告、推广信息或链接,这样的信息将会被直接删除。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 关注新浪微博:关注新浪微博
  • 关注腾讯微博:关注腾讯微博
  • 关注认证空间:关注QQ空间
  • 通过电子邮件订阅
  • 通过QQ邮件订阅

站内搜索

热文排行


月度排行

本站采用创作共用版权协议, 要求署名、非商业用途和相同方式共享. 转载本站内容必须也遵循“署名-非商业用途-相同方式共享”的创作共用协议.
This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License.