青青子衿, 悠悠我心, 但为君故, 沉吟至今
« 百度博客搜索服务正式发布软件盗版的产业链 »

百度博客搜索的收录

  百度博客搜索发布后,引起了很多人的讨论,其中对于百度博客搜索的收录问题存在不少争论,我这里就说一下我关于百度博客搜索的收录问题的看法。

  有人说百度博客搜索没有收录独立域名博客,只收录BSP服务商的,我不认为是这样的,至少我看到有一些独立域名博客是被收录,只是收录的非常少而已,这里我怀疑,可能百度在区分一个站点到底是网站还是博客遇到技术问题,因此大家可以手动将自己的RSS地址提交过去,看看百度是否会收录,如果还不收录,那就是百度自己的问题了。

  百度博客搜索的另外一个收录问题是,百度给于“百度空间”过分大的权值了,以至于搜索结果的大部分内容都是“百度空间”的内容,这对于用户搜索体验来说是一大伤害,无怪乎shunzawflasher都觉得认为“百度博客搜索”叫“百度空间搜索”更为恰当。

百度博客搜索

  对于百度博客搜索Google博客搜索的收录内容的数字化对比,我这里进行了一些整理。

收录量对比 地址 百度博客搜索 Google博客搜索
百度空间 hi.baidu.com 847,000 2,142
Google Blogger blogspot.com 0 102,682,823
MSN Spaces spaces.live.com 800,000 140,499,552
新浪博客 blog.sina.com.cn 900,000 140,499,552
博客网 bokee.com 768,000 5,261
BlogBus blogbus.com 291,000 5,926
DoNews blog.donews.com 215,000 6,512
搜狐博客 blog.sohu.com 608 2,268
网易博客 blog.163.com 7,060 2,829

  从上面的数据列表可以看出,百度对于Google Blogger的收录量竟然是0,这点比较夸张,同时也可以看出,百度博客搜索可能在避免和Google博客搜索正面竞争,对于一些Google收录较少的国内BSP进行大量收录,而对于Google收录很多的MSN和新浪等并没有收录更多。并且百度可能只收录中文信息,对于英文内容不进行收录。

  总而言之,对于博客搜索这样一个新领域,百度还有很长的路要走。



  除非注明,月光博客文章均为原创,转载请以链接形式标明本文地址

  本文地址:http://www.williamlong.info/archives/716.html
  • 1.时尙玩意
  • 新建的百度博客.为什么搜索不到呢?
  • 2008/3/31 21:27:17   支持(12)反对(4) 回复
  • 2.媚嫣然
  • 百度也收录英文吧。
    比较下面两个博客搜索,结果略有差异,大部分是第一个比第二个多些
    http://search.blogger.com
    http://blogsearch.google.com
    比如:
    2,963,404 posts linking to spaces.live.com - showing 1 through 10.
    Results 1 - 100 of 2,962,898 linking to spaces.live.com. (0.50 seconds)
  • 2006/12/9 10:53:42   支持(9)反对(4) 回复
  • 3.恋爱中的鱼
  • 百度还是没有google的好。
  • 2008/1/27 16:34:50   支持(10)反对(5) 回复
  • 4.aw
  • 沙发!:)
    baidu这个数据太fz了~
  • 2006/12/8 21:52:21   支持(6)反对(2) 回复
  • 5.williamlong
  • 你的博客没有提交过,应该是百度自动收录的吧。
  • 2006/12/9 13:55:30   支持(7)反对(3) 回复
  • 6.ititgo
  • 不管baidu收不收录blogspot.com,对于搜索用户来说,能搜索到有价值的网页是最重要的.就像我个人不喜欢baidu一样,为什么呢,不是对baidu有偏见,我只是苦恼每次baidu一搜索后,头几页的内容几乎只要看一页就行,因为全部是出于一篇.用google虽然也有很多出于同一篇,但毕竟还有不少是自己想要的,相对而言我觉得会google搜索网页的质量会比较高.
    因此对于baidu不收录blogspot.com,我在想,如果blogspot.com内容性价值高的话,那不收录对于baidu本身来说也是损失.对于搜索用户来说,肉页质量是最重要的.
  • 2007/8/14 9:27:35   支持(8)反对(4) 回复
  • 7.shizhao
  • 我觉得对于google blog,这或许和XXX有关
  • 2006/12/9 22:18:02   支持(8)反对(5) 回复
  • 11.我来了
  • 同意,GOOGLE的一些网络服务不稳定应该跟XXX有关
  • 2008/2/20 23:24:09   支持(6)反对(4) 回复
  • 12.逍遥自在心
  • 没事别 瞎说 百度 不好
  • 2008/2/25 15:50:48   支持(7)反对(5) 回复
  • 13.复仇使者
  • 君子相知,贵在温不增华,寒不改弃,贯四时而不衰,历坦险而益固.知道我是谁
  • 2008/8/23 19:49:29   支持(5)反对(3) 回复
  • 14.gch514
  • 不知道什么原因?空间被收录后,过段时间就找不到了.
  • 2007/12/8 20:23:47   支持(4)反对(3) 回复
  • 15.美亚国际
  • 我觉得对于google blog,这或许和XXX有关 !!!!
  • 2008/1/23 21:45:09   支持(4)反对(3) 回复
  • 16.ruixiang
  • 我刚刚装了z-blog 现在都是从百度博客搜索进来的流量,我担心的是百度只给我博客搜索的流量,williamlong 对这个有什么看法?我以前用oblog 访客都是从网页搜索进来的。
  • 2008/2/2 12:17:24   支持(5)反对(4) 回复
  • 19.jamebaond
  • 百度内部的算法对大部分的排名有用,但是还有很多不完善的地方~
  • 2014/12/16 11:37:39   支持(2)反对(1) 回复
  • 20.Fermi
  • 百度不收录blogspot.com是因为这个网址一直处于封禁状态,百度是不会做挑战体制的事儿的,而且百度曾一度不能搜索“陈光诚”不能搜索“文化大革命”不能搜索“高莺莺”,这次百度blog搜索不能索引blogspot正是出于同样的考量,跟它的搜索能力没什么关系。

    不过,我实在看不出用百度的理由,就算是搜索盗版音乐,我还是习惯用yahoo.cn来进行。
  • 2006/12/9 0:57:10   支持(6)反对(6) 回复
  • 21.DavidYin
  • 而且百度只收录中文的。
    而Google Blog搜索什么都收录,只要是独特的内容。
  • 2006/12/9 2:06:03   支持(4)反对(4) 回复
  • 22.成也散人
  • 百度博客推出后,本来打算写一篇测试文章。但是试用之后发现有点糟糕,想想还是算了。观察一段时间再说。
    百度空间的收录数量太不合理了,而且里面属于转载性的文章太多太多。
    williamlong,你的博客是百度自然收录的还是提交之后收录的?
  • 2006/12/9 10:56:08   支持(5)反对(5) 回复
  • 27.80后的风采
  • 月光下虽然没有阳光下的靓丽,但显示着人间的温馨!
  • 2010/5/20 21:14:55   支持(3)反对(3) 回复
  • 28.KEYONE
  • 应该是这样,百度的博客搜索默认是按照时间排序,但从现在看上去只有他们自己的空间是每几个小时更新,其他的都是一天前的数据,所以导致排在前边的都是百度空间。我想这个问题百度的人也一定注意到了,也许过一段时间就好了。对百度的产品,我觉得他们都是推出一个测试,然后慢慢改,就好像他们的新闻,越来越好。只要他们重视,别把博客搜索象黄页搜索一样搁置就好。
  • 2006/12/8 23:47:40   支持(3)反对(4) 回复
  • 29.williamlong
  • 博客搜索注重的就是快,比如我这篇文章写完后,Google博客搜索一小时内就收录了,而百度现在还没有收录,所以别人用起来肯定会觉得有问题的。
  • 2006/12/8 23:54:19   支持(3)反对(4) 回复
  • 30.KEYONE
  • 任何搜索都是覆盖率,准去性和时效性去评估。我随便搜了一些词,大多数结果百度都比GOOGLE的博客搜索多很多,但时效性上有不少差距。还有就是百度里边的垃圾比较多。就质量而言,百度目前的这个产品还有很长的路要走。
  • 2006/12/9 0:09:04   支持(6)反对(7) 回复
  • 31.AT
  • 提交了两天,没反应……

    再听你的,直接提交RSS试试
  • 2006/12/9 16:11:40   支持(5)反对(6) 回复
  • 33.逍遥自在心
  • 百度有时播放器不好是,垃圾
  • 2008/2/25 15:52:44   支持(4)反对(5) 回复
  • 34.国内行业软件
  • 学习了。我的网站上国内行业软件大全。欢迎看看
  • 2008/7/13 15:05:41   支持(2)反对(3) 回复
  • 38.收录不收录是人家百度的权利
  • 收录不收录是人家百度的权利!说人家百度的不是就是嫉妒。人家自己的网站,想收录谁,不想收录谁,这谁也管不着。
  • 2008/8/31 16:16:03   支持(4)反对(6) 回复
  • 39.我来说两句收录不收录是人家百度的权利
  • 呵呵!收录不收录是人家百度的权利!说人家百度的不是就是嫉妒。人家自己的网站,想收录谁,不想收录谁,这谁也管不着。
  • 2008/8/31 16:17:34   支持(3)反对(5) 回复
  • 40.慕以
  • 搜索“博客“时你的博客都排在了第二页百度还是要收录的 。
  • 2006/12/8 22:36:34   支持(3)反对(6) 回复
  • 41.jrsdhr
  • 百度太不公正了,这个硬伤不改,只靠着抄袭,流氓,刻意偏袒之类,终是不能长久下去,总有一天还是会得到应有的惩罚。
    这个世界说到底在一定程度上也是公平的。
  • 2006/12/9 0:39:10   支持(4)反对(7) 回复
  • 42.大布袋
  • 新闻百度有了,音乐百度有了,视频百度有了,图片百度有了,IM百度有了,网上购物百度有了,空间博客百度有了,全部热门的东西百度都做了,搜索出来的网页全是它百度自己的网页,真不知道我们这些个人站长还有什么是可以做的。有时候想想,真的是看百度不过眼!
  • 2009/3/5 3:04:50   支持(5)反对(10) 回复
  • 43.Heey
  • 貌似Google也沒有收錄幾個百度的空間
  • 2006/12/8 22:14:56   支持(5)反对(17) 回复

发表评论:

订阅博客

  • 订阅我的博客:订阅我的博客
  • 关注新浪微博:关注新浪微博
  • 关注我的推特:关注我的推特
  • 通过电子邮件订阅
  • 通过QQ邮件订阅

站内搜索

热文排行


月度排行

本站采用创作共用版权协议, 要求署名、非商业用途和相同方式共享. 转载本站内容必须也遵循“署名-非商业用途-相同方式共享”的创作共用协议.
This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License.