青青子衿, 悠悠我心, 但为君故, 沉吟至今
« 搜狗五笔输入法发布GoDaddy恢复访问正常 »

百度收录网站的特点分析

  两年前,我曾经写过一篇文章《Google和百度收录网站页面的比较》(发布于2006年4月17日《计算机世界》),分析当时情况下百度和Google搜索引擎对于网站的收录比较,两年过去了,这两个搜索引擎的算法都发生了巨大的变化,那时的比较收录规则已经完全不适用于当前了,现在,我就根据今天搜索引擎当前的发展情况,再次比较和分析一下百度和Google这两大搜索引擎在收录网站方面的异同。

  首页规则

  搜索引擎的索引更新速度是衡量搜索质量的一个重要的参数,对于大型网站(比如门户新闻网站)以及其他更新量大的网站,百度和Google的索引速度都很快,基本上都能做到当天更新。

  但是对于更新量小的网站,例如博客,两者就有较大区别,Google对于高权重并提交Sitemaps和Ping的网站,索引速度可以达到分钟级别,有时刚刚写完一篇文章,几分钟后,就能在Google中搜索到解决,但是对于百度来说,索引速度较慢,通常仅仅更新了博客网站的首页,搜索文章标题,排在前面的是博客首页或者目录页,而不是文章页。

  总的来说,百度对于网站首页的关注以及权重给的似乎特别高,而Google对于最终的文章内容页面的关注多于百度。

  半个月规则

  百度对于更新量较小的博客,收录页面有一个奇怪的时间规则限制:半个月规则,根据我对于月光博客文章收录速度的观察,通常情况下,半个月之内发布的文章,使用百度搜索文章标题,排在前面的基本上都是门户网站转载或聚合我的文章,我写的原始文章不见踪影。而使用Google搜索,我的原文基本上都是第一位。

  而大约半个月之后,我的文章的原始内容才在百度上出现,这时候搜索文章的标题,我的原文才会成为百度搜索结果的第一位。

  权重计算规则

  Google计算权重的方式主要参考页面的反向链接,如果别人转载我的文章并添加了原文链接,那么Google通常会给予原始文章较高的权值,而百度似乎对于自己的网站(百度知道、百度空间、百度百科等)给予较高的权值,并且对于更新频繁的大型门户网站更为青睐,而对于反向链接似乎没有给予太多的权重。

  新站规则

  一个新注册的网站,经过一些宣传之后,通常Google就会对其进行收录,但赋予的权值并不太高。

  百度对于新站不会立刻收录,并且相当长的时间内都不会收录,当新网站在搜索引擎有了一个不错的表现,并且有了较多的反向链接,会出现一个阀值,百度判断其网站内容不属于明显复制其他网站内容之后,会开始收录这个新站点内容,这时候网站才会出现来自百度的流量。

  总的来说,在网站收录速度上来看,Google现在比百度要快,不过由于百度的用户更多一些,所以网站搜索来源大多还是来自百度的多一些。不过对于技术博客来说,来源Google的访问量应该和百度旗鼓相当了。



  除非注明,月光博客文章均为原创,转载请以链接形式标明本文地址

  本文地址:http://www.williamlong.info/archives/1479.html
  • 文章排行:
  • 4.小舟
  • 也只有月光博客这么大的访问量,这么大的索引量,这么高的权重,能有这样直接的体会了
  • 2008-8-29 20:12:00   支持(0)反对(0) 回复
  • 5.小人物
  • 我的站就是这样,GOOGLE早就收录了,可是百度一直一页都没有
  • 2008-8-29 20:34:15   支持(0)反对(0) 回复
  • 7.poshi
  • 我博客上都是原创内容,百度显然不懂,人家在百度空间抄我的倒是被收录了,我自己的原文只被收录了三篇~~~
    JackMiao 于 2009-12-20 1:44:26 回复
    唉,可恨的百度。
  • 2008-8-29 20:43:03   支持(0)反对(0) 回复
  • 8.poshi
  • 不是说百度对独立博客好不好了,而是说,现在有很多内容在百度搜不到,在Google才能搜到,所以只好用Google了~~~
  • 2008-8-29 20:44:03   支持(0)反对(0) 回复
  • 14.爱燕博客
  • 你们到百度和GG分别搜索 爱燕博客
    百度只收录我的一项,但是在搜索首页第一个,
    而谷歌收录我的好几百项,却不在搜索首页。

    不知道怎么回事。。。
  • 2008-8-29 21:51:47   支持(0)反对(0) 回复
  • 16.John
  • 搜索这篇博客,Baidu的第一项就是原始文章,但是在google的首页都没有看到。
    不过对比首页的搜索结果,明显google的结果相关性更高; Baidu就只有第一项是原始文章,其他的都是一些在我看来毫不相关的结果...
  • 2008-8-29 22:08:03   支持(0)反对(0) 回复
  • 19.7334n
  • 谢谢月光的分享,下面是我个人的一点看法

    1、spider系统对重要的网站,重要的索引页在资源的分配上是有所倾斜的,调度算法总要优先考虑好的站点。

    2、如果check一个博客的索引页的时候,总是很难发现新的url,那么调度算法后续降低对该站点check的频度也是有必要的,所以blog自身更新较少,搜索引擎对该站点的更新周期自然会变长。

    3、再一个就是时效性,blog搜索对时效性的要求,毕竟不比news,而且blog搜索,社区搜索现在是否值得搜索引擎公司花大力气去投入还是个问题。

    4、zhidao,kongjian,baike在baidu的结果中rank要比较高,这个也非常容易理解,呵呵。其实zhidao和baike的质量应该也是比较高的。

    5、所有搜索引擎对新站的态度都是非常谨慎的,刚出现的一个站点凭什么得到se的青睐呢?当然,有时候新站可能是由于另外一个站点更改了域名,比如凤凰网从phoenixtv更改为ifeng,对se来说,也算是一个新站,不过现在的搜索引擎在更新方面应该都能解决域名更新的问题。
  • 2008-8-29 22:09:13   支持(0)反对(0) 回复
  • 26.Wang
  • 我刚开的英文Blog经常是写完十多分钟就被Google收录了。

    另外,纠正一个错别字:
    当新网站在搜索引擎有了一个不错的表现,并且有了较多的反向链接,会出现一个阀值


    应该是阈(yu,四声)而不是阀(fa),貌似很多人注意不到这一点
  • 2008-8-30 2:22:04   支持(0)反对(0) 回复
  • 28.聚友
  • 半个月规则,这个这几天百度已经改进了。可能前段时间百度因为更换硬件+奥运的原因
  • 2008-8-30 8:15:34   支持(0)反对(0) 回复
  • 29.鬼火
  • 百度的搜索要做的差不少了。
    google搜录博客超快,并且不要忘记google的博客搜索引擎,现在也很多人在用的,只要ping了,两三分钟后就能看得到。
  • 2008-8-30 8:31:09   支持(0)反对(0) 回复
  • 30.鬼火
  • 百度还有一周更首页和tags的习惯吧,我自己的博客就是每周四会更新首页和tagclod新增的tags页。
  • 2008-8-30 8:36:11   支持(0)反对(0) 回复
  • 31.Ro
  • 我刚刚用百度、谷歌、雅虎搜索“百度收录网站的特点分析”第一名都是你的博客文章链接;
    看来你说百度要半个月收录并不准确;
    但用搜狐搜狗倒是没有搜索到结果。
  • 2008-8-30 8:41:21   支持(0)反对(0) 回复
  • 32.toms
  • 确实是 yu值,两个字的写法太相似了,但是我觉得阀值更形象。

    baidu的搜索结果相关性太低了,一堆垃圾。还是google的要好些。

    小站的收录情况2家基本持平
  • 2008-8-30 8:44:13   支持(0)反对(0) 回复
  • 33.怒风
  • 现在有个alexa排名几万的网站经常转载我的文章(加了原文链接)
    不知道百度能否识别出来哪个是原文?
  • 2008-8-30 9:46:10   支持(0)反对(0) 回复
  • 34.搞笑短信
  • 玩了半年的博客,现在还是比较倾向于SMS了,毕竟博客始终不能取代SMS的!!!
  • 2008-8-30 9:54:29   支持(0)反对(0) 回复
  • 36.hunong
  • 我觉得雅虎最勤快,Google次之,百度最差。
    阈值,大约是临界值的意思,读yu,四声。
  • 2008-8-30 11:29:53   支持(0)反对(0) 回复
  • 38.Yule
  • 百度简直是...
    我在Google的收录,我写完没有几分钟就可以弄好,

    可是在百度,至今连个首页也没收录,
    气....
  • 2008-8-30 15:18:42   支持(0)反对(0) 回复
  • 41.chxwei
  • 总结的很好.
    搜索“百度收录网站的特点分析”,百度和Google均在第一。
    怀疑百度给你人工设置了
  • 2008-8-30 18:49:15   支持(0)反对(0) 回复
  • 42.aw
  • 恩,半个月规则分析的正确,我的符合。

    有些小门户就考这个活着:)
  • 2008-8-30 19:21:17   支持(0)反对(0) 回复
  • 45.茶文化基地
  • 建议月光总结下现在各地搜索引擎以及rss订阅站点的ping地址;找来给我们这些菜鸟分享一下 谢谢
  • 2008-8-30 21:46:02   支持(0)反对(0) 回复
  • 46.microhl
  • 不知啥原因,我的GOOGLE从奥运开墓以来就搜不到无响应了,是不是又是奥运的缘故被封杀了啊?
  • 2008-8-30 22:41:44   支持(0)反对(0) 回复
  • 47.microhl
  • 不管什么坚决用GOOGLE!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
  • 2008-8-30 22:42:47   支持(0)反对(0) 回复
  • 48.microhl
  • 就看不惯动不动就搞封杀×××的那一套臭伎俩,有本事你100度超过人家啊!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
  • 2008-8-30 22:45:31   支持(0)反对(0) 回复
  • 49.microhl
  • 很难相信在现在也是全球高速信息化的一个地球村的时代了,还有的GUOJIA企业动不动就搞封杀,这简直就是野蛮的愚民政策,不自信的表现!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1
  • 2008-8-30 22:49:12   支持(0)反对(0) 回复
  • 50.爱燕博客
  • 回复37#的。
    也不能小看百度,国内毕竟他是老大。
    我虽然两个搜索都使用。
    但是心里还是比较喜欢谷歌多点。
  • 2008-8-31 1:38:57   支持(0)反对(0) 回复
  • 53.bluesliu
  • “百度收录网站的特点分析”,我也分别用百度和google搜索了这个词,结果和上面仁兄的不一样啊,果然是google在第一位,百度搜出三页但全部都是转载。个人认为这里面有技术因素,也有文化因素——国人对版权、原创的尊重还是不够,这恐怕也是国内的现实情况使然,权且认为“存在即合理”吧。
  • 2008-8-31 6:25:47   支持(0)反对(0) 回复
  • 54.bluesliu
  • ◇ 32.Ro

    我刚刚用百度、谷歌、雅虎搜索“百度收录网站的特点分析”第一名都是你的博客文章链接;
    看来你说百度要半个月收录并不准确;
    但用搜狐搜狗倒是没有搜索到结果。
    46.chxwei

    总结的很好.
    搜索“百度收录网站的特点分析”,百度和Google均在第一。
    怀疑百度给你人工设置了

    上面这两位朋友,个人考虑可能是没有理解收录原文源站的含义。搜出来的文章地址是http://www.williamlong.info/archives/1479.html才能算是收录了原文源站。



  • 2008-8-31 6:38:37   支持(0)反对(0) 回复
  • 57.风到月来
  • 百度对新网站的收录也是比较快的!站内都是一些转载文章或则更新频率貌似“垃圾”站,通常会在半个月左右被K,然后看运气是否会被收录了,现在我体会百度对垃圾站的控制还是比较强。
    而Google K站的机会就很少!

    不过百度对自己站百度知道什么的都靠前,很郁闷!
  • 2008-8-31 12:06:56   支持(0)反对(0) 回复
  • 60.嗯嗯
  • 百度搜索的结果的排序是用钱买的,
    谷歌是用算法计算的,
    谁更可靠一些?
  • 2008-8-31 18:18:58   支持(0)反对(0) 回复
  • 63.bxptcdj
  • baidu?牛气啊。 我现在都开始讨厌baidu了。
    众联物流网 于 2009-9-23 20:59:21 回复
    众联物流网--空车配货、货物运输、专线信息
    www.56118.cc
  • 2008-8-31 20:18:08   支持(0)反对(0) 回复
  • 64.birdflyer
  • google还是关心普通站长的,而百度由于技术所限,只会收录大站的文章
  • 2008-8-31 20:50:34   支持(0)反对(0) 回复
  • 71.gerdy
  • 哎.我反正是发现一个问题,来这里的大多是谷歌的fans..
    再说了,你们说的大多是自己的个人博客的收录情况.但是搜索的可不仅仅是博客..像搜索这种东西,好用或者说推广做的好,当然就用的人多..我还记得,以前搜狗出过一个匿名的搜索结果的对比,貌似google也不是最优的..不过,后来,搜狗优化的不行了,就撤掉这个了..

    再说了,百度的用户多,自然有他的道理,至少百度推广做的不错...

    一般的说,用google的人都会觉得自己高人一等,就如用火狐的一般,我承认,google和火狐都很好用,但是,中国电脑初级用户还是很多..这些人中,上网就只是找想要的资料,一般的资料在搜索上是可以找到的,就算有XXX,当然你是闲的没事干,硬要找些××什么的,来证明google更自由.
    什么?你要找英文资料?都这么高水平,还不用ziyou门?wujie什么的..精英嘛.当然得常备了..
    PS:关于1989的那些内容其实在XXX下还是能搜的,只是没那么容易搜而已.

    说的正题:百度知道及其他附属品是百度的一大优势,这个可以有效的让搜索量变成流量,而且,百度知道也是非常有用的东西,一般的答案都可以在那里找到,当然,精英们可以无视..

    还有,林大了,自然什么鸟都有,竞争在哪都有的..为了几块钱杀人的都有,还有什么奇怪的...

    废话了这么多,其实我也感觉奇怪,也很担心,ZF对舆论用堵而不是疏导的政策:特别是地方ZF为了经济而用的那些政策...网络上越来越严重的反DANG情绪

    看了好几篇文章,就随便打了这么多字,如果看的很乱,请无视..
  • 2008-9-1 15:46:21   支持(0)反对(0) 回复
  • 73.倒影
  • 看了,支持!我的网站就百度的来源多,google在中国还是不行
  • 2008-9-2 15:02:21   支持(0)反对(0) 回复
  • 75.iiren
  • 分析的很对啊,我的Blog很快就被google收录了,而且更新也很快,baidu慢多了...
  • 2008-9-3 14:03:59   支持(0)反对(0) 回复
  • 76.pumadong
  • 如果内容中,一个标题被重复出现,比如,德语学习第一集是一篇,德语学习第二集也是一篇文章,如果是小站,往往被百度认为是关键字重叠作弊而给K掉。 我的就是。。
  • 2008-9-3 14:29:29   支持(0)反对(0) 回复
  • 78.welgou
  • 有这个体会,百度收录很慢
    不过收录后,到目前为止通过搜索引擎到我网站的,70%都是百度来的
  • 2008-9-4 10:36:39   支持(0)反对(0) 回复
  • 79.Heyi
  • 和Google大哥比起来,百度小弟的脑袋确实有些问题。
  • 2008-9-4 17:28:56   支持(0)反对(0) 回复
  • 80.whsjsoft
  • 百度空间有多少权重?
    一年前就收录两三百万了,现在也是只有收录200多万.百度空间一千万的用户基数,一年内什么文章都没有写吗?
  • 2008-9-6 16:56:04   支持(0)反对(0) 回复
  • 82.mylotter
  • 始终搞不懂他们的规则,总体感觉,Google相对来说收录情况更科学,而百度则是喜怒无常,每个月总有那么几天不正常的日子。
  • 2008-9-10 13:42:36   支持(0)反对(0) 回复
  • 83.小段
  • 个人刚建的博客,Google很快就收录了,可是百度现在还没有收录。
  • 2008-9-10 21:58:50   支持(0)反对(0) 回复
  • 86.狂人中国
  • 部分内容跟我的新站基本一致
    我的博客在向Google提交不到一周就被收录了,百度却没有动作大概一个月左右,百度突然收录了21个页面
    百度确实比较关注自己的产品,我的百度空间转载的文章收录速度非常快,有的还排到了首页甚至有时候超过了原文作者的博客排名
  • 2008-9-14 16:13:52   支持(0)反对(0) 回复
  • 87.ruixiang
  • 以前百度每天更新我的博客,现在好久也不更新,也没排名。
  • 2008-9-15 8:34:12   支持(0)反对(0) 回复
  • 92.怡红阁
  • 你说的太对了,我的网站20天过去了,还没有收录,,都不知道为什么
  • 2008-9-23 17:49:46   支持(0)反对(0) 回复
  • 93.Cstyle
  • GG更加注重原创性内容。

    半个圾月规则相信也只针对新站的,毕竟收集站和垃站太多了,
    我搜索用百度,但建站从不看他,收录与否随它便...
  • 2008-9-25 19:24:40   支持(0)反对(0) 回复
  • 94.OWEN
  • 看来大部分都是GOOGLE控

    作为百度粉丝个人就不说什么了

    该支持百度的还是会支持百度
    该支持GOOGLE的还是支持Google
  • 2008-9-25 21:19:22   支持(0)反对(0) 回复
  • 98.it4j
  • 百度收录真的很慢啊!

    google比baidu收录网站快多了! 喜欢google
  • 2008-9-28 15:31:53   支持(0)反对(0) 回复
  • 108.cswx2006
  • 那百度真让人费劲啊,以前天天收录,可是最近把天天就少几页,够不懂,我也没有少更新啊
  • 2008-10-7 8:07:43   支持(0)反对(0) 回复
  • 111.三点水
  • 我的站点建立并提交搜索引擎后,20多天百度才收录,谷歌收录只用了3天。
    另外,百度的确有频繁更新tags的习惯。
  • 2008-10-10 9:45:07   支持(0)反对(0) 回复
  • 113.怡红阁
  • 百度TM就是个垃圾,~!
    骗子,操,不知道为什么有那么多人用,,
  • 2008-10-12 22:03:18   支持(0)反对(0) 回复
  • 118.流泪的鱼
  • 月光博客写的非常合理,让我学习了不少!我也是第一次看你的博客。

    百度确实很差劲,我的新网站在google搜录了近200个页面了,而baidu为什么就只有3个页面呢?真是搞不懂,不知道有没有哪个高手帮我指点一下呀!
    lao910 于 2010-1-17 18:26:03 回复
    这可能是你的站被它处罚
  • 2008-10-20 8:56:40   支持(0)反对(0) 回复
  • 119.海南通
  • 我的新站一个多月,开始也是GG多,BAIDU没有,很郁闷的,可是一个月后就是BAIDU比GG多了!
  • 2008-10-26 21:20:39   支持(0)反对(0) 回复
  • 120.tinyvane
  • 恩,baidu毕竟在国内用得多,有的是底气,咱们小站不服不行,google是一片净土,只是我们还没有资本抛弃百度而已
  • 2008-10-27 16:34:01   支持(0)反对(0) 回复
  • 122.搜布
  • google.com早就收录了,为什以我的站到今天快4个月了,还没收录。
  • 2008-11-22 20:24:11   支持(0)反对(0) 回复
  • 125.ladyhb
  • 我 的站goog le 和 雅 虎都已 经收 录了,可是百 度还 连首 页都 没 收 录,也不知 道是怎么 回事儿,能帮我指点下吗?
  • 2008-12-15 11:52:44   支持(0)反对(0) 回复
  • 132.
  • 石家庄百度总代理,先用百度返点,欺骗客户开户,然后不给返点,给客户造成强大的经济损失,强烈抗议
  • 2009-8-8 8:22:52   支持(0)反对(0) 回复
  • 133.betterchoose
  • 是呀,我的博客快20天了,百度就收了我一页。
    dclfs 于 2009-9-17 10:30:08 回复
    呵呵~~~~~
  • 2009-9-15 6:52:41   支持(0)反对(0) 回复
  • 134.jnsmfw
  • 我的观察也是这样,谷歌一般收录内容页很快,只要是原创,百度似乎总是犹豫不决
  • 2009-11-29 23:33:59   支持(0)反对(0) 回复
  • 141.hehe
  • 一个搜索引擎或者说产品好于不好的标准不是所谓的专业人士说了算的,除非它是为所谓的专业人士定制的,或者专门为搜索一些有政治倾向的人定制的,如果你觉得自己生活在水深火热之中,不要只会呻吟,或扇风点火,那点实际的东西出来。
  • 2010-3-12 14:35:19   支持(0)反对(0) 回复
  • 148.6hao
  • 你分析的很不错.我花了1个月的时间把你的文章全部看完了.真的是受益诽浅,5234.cc 这是我的站.你可以看下内部结构还是外部优化,我几乎都是参照你的说法去做.呵呵..希望有用!!!
  • 2011-3-26 19:38:18   支持(0)反对(0) 回复
  • 151.ddd
  • 我的网站怎么这半个月多没百度收录呢其他引擎多有
  • 2011-7-23 16:21:44   支持(0)反对(0) 回复
  • 155.qnd
  • 显然百度更注重网站系统的整理,而不是杂乱无章
  • 2011-9-13 16:20:11   支持(0)反对(0) 回复
  • 156.我特爱
  • 文章中有一个漏了的字
    并且对于更新频繁的大型门户网站更为青睐,而对于反向链接似乎没有给予太多的权重。
    请检查上面这句话
    杭州人liu价格 于 2011-9-24 20:03:10 回复
    无聊啊
  • 2011-9-22 17:53:15   支持(0)反对(0) 回复
  • 157.小东
  • 怪不得半个多月了还没收录我的新站呢,原来如此啊,谢谢月光咯
  • 2011-10-5 8:01:40   支持(0)反对(0) 回复
  • 158.neekey
  • 不过对于技术博客来说,来源Google的访问量应该和百度骑虎相当了。
    很赞成
  • 2008-8-29 22:53:30   支持(0)反对(1) 回复

发表评论:

 请勿发送垃圾信息、广告、推广信息或链接,这样的信息将会被直接删除。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 关注新浪微博:关注新浪微博
  • 关注腾讯微博:关注腾讯微博
  • 关注认证空间:关注QQ空间
  • 通过Google订阅本站
  • 通过鲜果订阅本站
  • 通过电子邮件订阅
  • 通过QQ邮件订阅

站内搜索

热文排行


月度排行

本站采用创作共用版权协议, 要求署名、非商业用途和保持一致. 转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议.
This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License.