月光博客

青青子衿, 悠悠我心, 但为君故, 沉吟至今

« 搜狗五笔输入法发布GoDaddy恢复访问正常 »

百度收录网站的特点分析

  两年前,我曾经写过一篇文章《Google和百度收录网站页面的比较》(发布于2006年4月17日《计算机世界》),分析当时情况下百度和Google搜索引擎对于网站的收录比较,两年过去了,这两个搜索引擎的算法都发生了巨大的变化,那时的比较收录规则已经完全不适用于当前了,现在,我就根据今天搜索引擎当前的发展情况,再次比较和分析一下百度和Google这两大搜索引擎在收录网站方面的异同。

  首页规则

  搜索引擎的索引更新速度是衡量搜索质量的一个重要的参数,对于大型网站(比如门户新闻网站)以及其他更新量大的网站,百度和Google的索引速度都很快,基本上都能做到当天更新。

  但是对于更新量小的网站,例如博客,两者就有较大区别,Google对于高权重并提交Sitemaps和Ping的网站,索引速度可以达到分钟级别,有时刚刚写完一篇文章,几分钟后,就能在Google中搜索到解决,但是对于百度来说,索引速度较慢,通常仅仅更新了博客网站的首页,搜索文章标题,排在前面的是博客首页或者目录页,而不是文章页。

  总的来说,百度对于网站首页的关注以及权重给的似乎特别高,而Google对于最终的文章内容页面的关注多于百度。

  半个月规则

  百度对于更新量较小的博客,收录页面有一个奇怪的时间规则限制:半个月规则,根据我对于月光博客文章收录速度的观察,通常情况下,半个月之内发布的文章,使用百度搜索文章标题,排在前面的基本上都是门户网站转载或聚合我的文章,我写的原始文章不见踪影。而使用Google搜索,我的原文基本上都是第一位。

  而大约半个月之后,我的文章的原始内容才在百度上出现,这时候搜索文章的标题,我的原文才会成为百度搜索结果的第一位。

  权重计算规则

  Google计算权重的方式主要参考页面的反向链接,如果别人转载我的文章并添加了原文链接,那么Google通常会给予原始文章较高的权值,而百度似乎对于自己的网站(百度知道、百度空间、百度百科等)给予较高的权值,并且对于更新频繁的大型门户网站更为青睐,而对于反向链接似乎没有给予太多的权重。

  新站规则

  一个新注册的网站,经过一些宣传之后,通常Google就会对其进行收录,但赋予的权值并不太高。

  百度对于新站不会立刻收录,并且相当长的时间内都不会收录,当新网站在搜索引擎有了一个不错的表现,并且有了较多的反向链接,会出现一个阀值,百度判断其网站内容不属于明显复制其他网站内容之后,会开始收录这个新站点内容,这时候网站才会出现来自百度的流量。

  总的来说,在网站收录速度上来看,Google现在比百度要快,不过由于百度的用户更多一些,所以网站搜索来源大多还是来自百度的多一些。不过对于技术博客来说,来源Google的访问量应该和百度旗鼓相当了。



原创文章如转载,请注明:转载自月光博客 [ http://www.williamlong.info/ ]

本文链接地址:http://www.williamlong.info/archives/1479.html
  • 文章排行:
  • 4.小舟
  • 也只有月光博客这么大的访问量,这么大的索引量,这么高的权重,能有这样直接的体会了
  • 2008-8-29 20:12:00   回复该留言
  • 5.小人物
  • 我的站就是这样,GOOGLE早就收录了,可是百度一直一页都没有
  • 2008-8-29 20:34:15   回复该留言
  • 7.poshi
  • poshi.org
  • 我博客上都是原创内容,百度显然不懂,人家在百度空间抄我的倒是被收录了,我自己的原文只被收录了三篇~~~
  • 2008-8-29 20:43:03   回复该留言
  • 8.poshi
  • poshi.org
  • 不是说百度对独立博客好不好了,而是说,现在有很多内容在百度搜不到,在Google才能搜到,所以只好用Google了~~~
  • 2008-8-29 20:44:03   回复该留言
  • 14.爱燕博客
  • 你们到百度和GG分别搜索 爱燕博客
    百度只收录我的一项,但是在搜索首页第一个,
    而谷歌收录我的好几百项,却不在搜索首页。

    不知道怎么回事。。。
  • 2008-8-29 21:51:47   回复该留言
  • 15.tencentroot
  • 骑虎相当 ??旗鼓相当吧.什么输入法干的事?
  • 2008-8-29 22:06:29   回复该留言
  • 16.John
  • 搜索这篇博客,Baidu的第一项就是原始文章,但是在google的首页都没有看到。
    不过对比首页的搜索结果,明显google的结果相关性更高; Baidu就只有第一项是原始文章,其他的都是一些在我看来毫不相关的结果...
  • 2008-8-29 22:08:03   回复该留言
  • 17.乱序
  • 随它们玩吧 做好自己的博客就行了
  • 2008-8-29 22:08:15   回复该留言
  • 19.7334n
  • 谢谢月光的分享,下面是我个人的一点看法

    1、spider系统对重要的网站,重要的索引页在资源的分配上是有所倾斜的,调度算法总要优先考虑好的站点。

    2、如果check一个博客的索引页的时候,总是很难发现新的url,那么调度算法后续降低对该站点check的频度也是有必要的,所以blog自身更新较少,搜索引擎对该站点的更新周期自然会变长。

    3、再一个就是时效性,blog搜索对时效性的要求,毕竟不比news,而且blog搜索,社区搜索现在是否值得搜索引擎公司花大力气去投入还是个问题。

    4、zhidao,kongjian,baike在baidu的结果中rank要比较高,这个也非常容易理解,呵呵。其实zhidao和baike的质量应该也是比较高的。

    5、所有搜索引擎对新站的态度都是非常谨慎的,刚出现的一个站点凭什么得到se的青睐呢?当然,有时候新站可能是由于另外一个站点更改了域名,比如凤凰网从phoenixtv更改为ifeng,对se来说,也算是一个新站,不过现在的搜索引擎在更新方面应该都能解决域名更新的问题。
  • 2008-8-29 22:09:13   回复该留言
  • 21.neekey
  • photozero.net
  • 不过对于技术博客来说,来源Google的访问量应该和百度骑虎相当了。
    很赞成
  • 2008-8-29 22:53:30   回复该留言
  • 23.linfavourite
  • 百度啊……算了吧……到现在还是影子都看不到说……
  • 2008-8-29 23:39:13   回复该留言
  • 27.Wang
  • 我刚开的英文Blog经常是写完十多分钟就被Google收录了。

    另外,纠正一个错别字:
    当新网站在搜索引擎有了一个不错的表现,并且有了较多的反向链接,会出现一个阀值


    应该是阈(yu,四声)而不是阀(fa),貌似很多人注意不到这一点
  • 2008-8-30 2:22:04   回复该留言
  • 28.斑马
  • 现在谷歌的用户大有后来追上的气势!
  • 2008-8-30 7:16:02   回复该留言
  • 29.聚友
  • juyo.org
  • 半个月规则,这个这几天百度已经改进了。可能前段时间百度因为更换硬件+奥运的原因
  • 2008-8-30 8:15:34   回复该留言
  • 30.鬼火
  • birdpig.com
  • 百度的搜索要做的差不少了。
    google搜录博客超快,并且不要忘记google的博客搜索引擎,现在也很多人在用的,只要ping了,两三分钟后就能看得到。
  • 2008-8-30 8:31:09   回复该留言
  • 31.鬼火
  • 百度还有一周更首页和tags的习惯吧,我自己的博客就是每周四会更新首页和tagclod新增的tags页。
  • 2008-8-30 8:36:11   回复该留言
  • 32.Ro
  • 我刚刚用百度、谷歌、雅虎搜索“百度收录网站的特点分析”第一名都是你的博客文章链接;
    看来你说百度要半个月收录并不准确;
    但用搜狐搜狗倒是没有搜索到结果。
  • 2008-8-30 8:41:21   回复该留言
  • 33.toms
  • 确实是 yu值,两个字的写法太相似了,但是我觉得阀值更形象。

    baidu的搜索结果相关性太低了,一堆垃圾。还是google的要好些。

    小站的收录情况2家基本持平
  • 2008-8-30 8:44:13   回复该留言
  • 34.怒风
  • 现在有个alexa排名几万的网站经常转载我的文章(加了原文链接)
    不知道百度能否识别出来哪个是原文?
  • 2008-8-30 9:46:10   回复该留言
  • 35.搞笑短信
  • 玩了半年的博客,现在还是比较倾向于SMS了,毕竟博客始终不能取代SMS的!!!
  • 2008-8-30 9:54:29   回复该留言
  • 41.火星
  • 看来大家对于挑错字都情有独钟啊
  • 2008-8-30 14:01:43   回复该留言
  • 42.Yule
  • 百度简直是...
    我在Google的收录,我写完没有几分钟就可以弄好,

    可是在百度,至今连个首页也没收录,
    气....
  • 2008-8-30 15:18:42   回复该留言
  • 43.caoliu
  • www.caoliu.org 百度封我的站,很郁闷啊
  • 2008-8-30 15:53:47   回复该留言
  • 44.90stu
  • 百度越来越强大了,搞得个人站长人心惶惶
  • 2008-8-30 17:51:00   回复该留言
  • 45.风过无痕
  • 这篇文章百度到收录蛮快的。难道有百度两字原因?
  • 2008-8-30 17:53:08   回复该留言
  • 46.chxwei
  • 总结的很好.
    搜索“百度收录网站的特点分析”,百度和Google均在第一。
    怀疑百度给你人工设置了
  • 2008-8-30 18:49:15   回复该留言
  • 50.茶文化基地
  • 建议月光总结下现在各地搜索引擎以及rss订阅站点的ping地址;找来给我们这些菜鸟分享一下 谢谢
  • 2008-8-30 21:46:02   回复该留言
  • 51.microhl
  • 不知啥原因,我的GOOGLE从奥运开墓以来就搜不到无响应了,是不是又是奥运的缘故被封杀了啊?
  • 2008-8-30 22:41:44   回复该留言
  • 52.microhl
  • 不管什么坚决用GOOGLE!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
  • 2008-8-30 22:42:47   回复该留言
  • 53.microhl
  • 就看不惯动不动就搞封杀×××的那一套臭伎俩,有本事你100度超过人家啊!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
  • 2008-8-30 22:45:31   回复该留言
  • 54.microhl
  • 很难相信在现在也是全球高速信息化的一个地球村的时代了,还有的GUOJIA企业动不动就搞封杀,这简直就是野蛮的愚民政策,不自信的表现!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1
  • 2008-8-30 22:49:12   回复该留言
  • 55.爱燕博客
  • wozhuanqian.blogbus.com/
  • 回复37#的。
    也不能小看百度,国内毕竟他是老大。
    我虽然两个搜索都使用。
    但是心里还是比较喜欢谷歌多点。
  • 2008-8-31 1:38:57   回复该留言
  • 58.bluesliu
  • “百度收录网站的特点分析”,我也分别用百度和google搜索了这个词,结果和上面仁兄的不一样啊,果然是google在第一位,百度搜出三页但全部都是转载。个人认为这里面有技术因素,也有文化因素——国人对版权、原创的尊重还是不够,这恐怕也是国内的现实情况使然,权且认为“存在即合理”吧。
  • 2008-8-31 6:25:47   回复该留言
  • 59.bluesliu
  • ◇ 32.Ro

    我刚刚用百度、谷歌、雅虎搜索“百度收录网站的特点分析”第一名都是你的博客文章链接;
    看来你说百度要半个月收录并不准确;
    但用搜狐搜狗倒是没有搜索到结果。
    46.chxwei

    总结的很好.
    搜索“百度收录网站的特点分析”,百度和Google均在第一。
    怀疑百度给你人工设置了

    上面这两位朋友,个人考虑可能是没有理解收录原文源站的含义。搜出来的文章地址是http://www.williamlong.info/archives/1479.html才能算是收录了原文源站。



  • 2008-8-31 6:38:37   回复该留言
  • 60.92cha
  • 博主说的很有道理,现在Google的收录速度比Baidu快多了
    http://www.92cha.com 在站点发布的第二天google就来收录了,百度到现在还没影...
  • 2008-8-31 8:43:35   回复该留言
  • 61.粉皮靠肉
  • 说的很好,每天肯定到你的网站看你的文章,真是受益匪浅啊;
  • 2008-8-31 8:51:46   回复该留言
  • 63.风到月来
  • 百度对新网站的收录也是比较快的!站内都是一些转载文章或则更新频率貌似“垃圾”站,通常会在半个月左右被K,然后看运气是否会被收录了,现在我体会百度对垃圾站的控制还是比较强。
    而Google K站的机会就很少!

    不过百度对自己站百度知道什么的都靠前,很郁闷!
  • 2008-8-31 12:06:56   回复该留言
  • 66.jdbbs
  • Yahoo收录最快,其次是google,百度收录较慢。
  • 2008-8-31 14:50:15   回复该留言
  • 67.瑞星杀毒软件
  • 其实新站百度是收录的,并且速度不慢。只是收录之后不放出来,要过一段时间才放出来,现在新站一般都得20天以上吧……
  • 2008-8-31 15:00:38   回复该留言
  • 69.嗯嗯
  • 百度搜索的结果的排序是用钱买的,
    谷歌是用算法计算的,
    谁更可靠一些?
  • 2008-8-31 18:18:58   回复该留言
  • 71.得享人生
  • 不作弊,不过度优化的话。百度比google稳定多了。
  • 2008-8-31 19:43:29   回复该留言
  • 72.bxptcdj
  • baidu?牛气啊。 我现在都开始讨厌baidu了。
  • 2008-8-31 20:18:08   回复该留言
  • 73.birdflyer
  • google还是关心普通站长的,而百度由于技术所限,只会收录大站的文章
  • 2008-8-31 20:50:34   回复该留言
  • 75.sanding
  • google对技术博客更友好,baidu关键词出的快...
  • 2008-8-31 22:32:44   回复该留言
  • 77.Scofield
  • 现在百度收录不像以前那样简单了。
  • 2008-9-1 8:55:42   回复该留言
  • 79.醉生梦死
  • 百度对小网站基本上都是不理不睬的,google反应就会快很多,深有体会
  • 2008-9-1 14:55:02   回复该留言
  • 80.gerdy
  • 哎.我反正是发现一个问题,来这里的大多是谷歌的fans..
    再说了,你们说的大多是自己的个人博客的收录情况.但是搜索的可不仅仅是博客..像搜索这种东西,好用或者说推广做的好,当然就用的人多..我还记得,以前搜狗出过一个匿名的搜索结果的对比,貌似google也不是最优的..不过,后来,搜狗优化的不行了,就撤掉这个了..

    再说了,百度的用户多,自然有他的道理,至少百度推广做的不错...

    一般的说,用google的人都会觉得自己高人一等,就如用火狐的一般,我承认,google和火狐都很好用,但是,中国电脑初级用户还是很多..这些人中,上网就只是找想要的资料,一般的资料在搜索上是可以找到的,就算有GFW,当然你是闲的没事干,硬要找些××什么的,来证明google更自由.
    什么?你要找英文资料?都这么高水平,还不用ziyou门?wujie什么的..精英嘛.当然得常备了..
    PS:关于1989的那些内容其实在GFW下还是能搜的,只是没那么容易搜而已.

    说的正题:百度知道及其他附属品是百度的一大优势,这个可以有效的让搜索量变成流量,而且,百度知道也是非常有用的东西,一般的答案都可以在那里找到,当然,精英们可以无视..

    还有,林大了,自然什么鸟都有,竞争在哪都有的..为了几块钱杀人的都有,还有什么奇怪的...

    废话了这么多,其实我也感觉奇怪,也很担心,ZF对舆论用堵而不是疏导的政策:特别是地方ZF为了经济而用的那些政策...网络上越来越严重的反DANG情绪

    看了好几篇文章,就随便打了这么多字,如果看的很乱,请无视..
  • 2008-9-1 15:46:21   回复该留言
  • 82.倒影
  • 看了,支持!我的网站就百度的来源多,google在中国还是不行
  • 2008-9-2 15:02:21   回复该留言
  • 83.Losemyself
  • 快一个月了,百度还不收录我的BLOG哦,不知道什么原因
  • 2008-9-3 13:47:34   回复该留言
  • 84.iiren
  • 分析的很对啊,我的Blog很快就被google收录了,而且更新也很快,baidu慢多了...
  • 2008-9-3 14:03:59   回复该留言
  • 85.pumadong
  • 如果内容中,一个标题被重复出现,比如,德语学习第一集是一篇,德语学习第二集也是一篇文章,如果是小站,往往被百度认为是关键字重叠作弊而给K掉。 我的就是。。
  • 2008-9-3 14:29:29   回复该留言
  • 87.welgou
  • 有这个体会,百度收录很慢
    不过收录后,到目前为止通过搜索引擎到我网站的,70%都是百度来的
  • 2008-9-4 10:36:39   回复该留言
  • 89.whsjsoft
  • 百度空间有多少权重?
    一年前就收录两三百万了,现在也是只有收录200多万.百度空间一千万的用户基数,一年内什么文章都没有写吗?
  • 2008-9-6 16:56:04   回复该留言
  • 92.mylotter
  • mysoho.blogbus.com
  • 始终搞不懂他们的规则,总体感觉,Google相对来说收录情况更科学,而百度则是喜怒无常,每个月总有那么几天不正常的日子。
  • 2008-9-10 13:42:36   回复该留言
  • 93.小段
  • 个人刚建的博客,Google很快就收录了,可是百度现在还没有收录。
  • 2008-9-10 21:58:50   回复该留言
  • 94.技术无止境
  • 正在研究中,发现网站和博客差距还是很大的。
  • 2008-9-11 14:27:30   回复该留言
  • 96.狂人中国
  • 部分内容跟我的新站基本一致
    我的博客在向Google提交不到一周就被收录了,百度却没有动作大概一个月左右,百度突然收录了21个页面
    百度确实比较关注自己的产品,我的百度空间转载的文章收录速度非常快,有的还排到了首页甚至有时候超过了原文作者的博客排名
  • 2008-9-14 16:13:52   回复该留言
  • 98.繁华都市
  • 我的这个站都一个月了还没收入,郁闷
  • 2008-9-15 11:50:36   回复该留言
  • 100.汇视航拍公司航拍服务
  • 作者写的很有道理,根据我的网站,我也是这样的感觉。

    汇视摄影航拍公司提供航拍服务(企业厂房航拍、房产楼盘航拍、
    经济开发区航拍、风景区、大型户外活动等项目航拍服务)
    公司网址:http://www.hangpaiwang.com 更多图片请登陆查看,谢谢!!!
  • 2008-9-20 6:53:22   回复该留言
  • 103.怡红阁
  • 你说的太对了,我的网站20天过去了,还没有收录,,都不知道为什么
  • 2008-9-23 17:49:46   回复该留言
  • 104.Cstyle
  • GG更加注重原创性内容。

    半个圾月规则相信也只针对新站的,毕竟收集站和垃站太多了,
    我搜索用百度,但建站从不看他,收录与否随它便...
  • 2008-9-25 19:24:40   回复该留言
  • 105.OWEN
  • hi.baidu.com/cxkno1
  • 看来大部分都是GOOGLE控

    作为百度粉丝个人就不说什么了

    该支持百度的还是会支持百度
    该支持GOOGLE的还是支持Google
  • 2008-9-25 21:19:22   回复该留言
  • 109.it4j
  • 百度收录真的很慢啊!

    google比baidu收录网站快多了! 喜欢google
  • 2008-9-28 15:31:53   回复该留言
  • 110.动友地带
  • 为什么我的网站还不被google和baidu收录呢?有两个星期了
  • 2008-9-28 17:47:30   回复该留言
  • 119.wanfuwu
  • 百度收录我网站的很多页面,但是没有流量。
  • 2008-10-5 19:12:45   回复该留言
  • 121.游戏坛小游戏
  • 现在的优化有点不好整理了。
  • 2008-10-6 17:25:59   回复该留言
  • 122.cswx2006
  • aiiyee.com
  • 那百度真让人费劲啊,以前天天收录,可是最近把天天就少几页,够不懂,我也没有少更新啊
  • 2008-10-7 8:07:43   回复该留言
  • 125.三点水
  • 我的站点建立并提交搜索引擎后,20多天百度才收录,谷歌收录只用了3天。
    另外,百度的确有频繁更新tags的习惯。
  • 2008-10-10 9:45:07   回复该留言
  • 132.流泪的鱼
  • 月光博客写的非常合理,让我学习了不少!我也是第一次看你的博客。

    百度确实很差劲,我的新网站在google搜录了近200个页面了,而baidu为什么就只有3个页面呢?真是搞不懂,不知道有没有哪个高手帮我指点一下呀!
  • 2008-10-20 8:56:40   回复该留言
  • 133.中国诚信网长清分站
  • 百度越做越差劲了!~~
  • 2008-10-24 20:41:43   回复该留言
  • 134.海南通
  • 我的新站一个多月,开始也是GG多,BAIDU没有,很郁闷的,可是一个月后就是BAIDU比GG多了!
  • 2008-10-26 21:20:39   回复该留言
  • 135.大学生校内网
  • 百度收录太慢了~~ google还行·~~
  • 2008-10-27 12:16:08   回复该留言
  • 136.tinyvane
  • 恩,baidu毕竟在国内用得多,有的是底气,咱们小站不服不行,google是一片净土,只是我们还没有资本抛弃百度而已
  • 2008-10-27 16:34:01   回复该留言
  • 140.搜布
  • google.com早就收录了,为什以我的站到今天快4个月了,还没收录。
  • 2008-11-22 20:24:11   回复该留言
  • 143.ladyhb
  • 我 的站goog le 和 雅 虎都已 经收 录了,可是百 度还 连首 页都 没 收 录,也不知 道是怎么 回事儿,能帮我指点下吗?
  • 2008-12-15 11:52:44   回复该留言
  • 147.在路上
  • 百度真的半个月了 一点动静没有。。。
  • 2008-12-25 2:56:59   回复该留言
  • 149.月光博客
  • 按建筑材料可以分成:钢结构,混凝土结构,砖混结构,木结构。
    按建筑高度可以分为:多层结构,高层结构,超高层结构。
    按使用功能可以分为:民用建筑,工业建筑。
    以上均为简单化分,也想说明你的转回民用建筑和钢结构的选择方向根本不是一个概念。
    现在的许多高层和超高层民用建筑也都是采用钢结构的。
    钢结构的方向是一个很好的方向,也是未来的发展趋势。
    以前我国的钢结构发展缓慢主要是因为钢结构造价高(毕竟我们是发展中国家)以及钢材产量有限。
    今非昔比,钢结构施工速度快,施工污染小,重量轻,这些优势让它成为未来的发展趋势。在今天,已经有很多建筑开始采用钢结构了,所以,是一个很好的选择。

    更多精彩请点击中国钢结构人才网http//baida.job.com
    联系人:刘婷
    联系电话:13554974582





  • 2009-2-25 19:56:41   回复该留言

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 通过Google订阅本站
  • 通过鲜果订阅本站
  • 通过电子邮件订阅本站

站内搜索

热文排行

最新评论及回复

最近发表

网站收藏

本站采用创作共用版权协议, 要求署名、非商业用途和保持一致. 转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议.

This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License.