月光博客

青青子衿, 悠悠我心, 但为君故, 沉吟至今

« 中国联通推出的手机导航服务微软Office Live Workspace开放注册 »

百度不支持nofollow的robots对策

  nofollow标签是由Google领头新创的一个标签,目的是尽量减少垃圾链接对搜索引擎的影响,减少博客的垃圾留言,目前Google、Yahoo、MSN都标志支持这一标签。当超级链接中出现nofollow标签后,搜索引擎会不考虑这些链接的权重,不过放置nofollow标签不代表搜索引擎不索引其链接,经过我的测试,即使放置nofollow标签,Google还是会索引部分链接内容。

  这个标签主要是针对垃圾链接的,因为留言评论中的垃圾链接会影响网站在搜索引擎中排名,对博客网站产生负面的影响,因此Gogle提倡使用这个标签来遏制垃圾链接。很长时间以来我一直使用nofollow的方式来方式评论留言对于搜索引擎的SPAM,对于Google来说效果的确不错,但是对于国内最大的搜索引擎百度来说确是另外一种情况。

  因为百度不支持nofollow标签,因此在中文环境下,即使使用nofollow标签,百度依旧会索引这个链接并对其计算权值,因此产生了大量恶意留言评论者通过手动或者自动的方式发布垃圾链接以欺骗百度搜索引擎,而百度依旧是国内最大的搜索引擎服务商,其搜索流量目前远高于Google,很多中文网站甚至80%以上的流量来自百度,因此中文网站甚至可以只针对百度进行优化而不针对Google优化,由于百度的原因,中文环境下对于nofollow标签来说面临一种逐渐无用的处境。

  根据我自己的月光博客的流量数据统计,通过长时间的观察和分析,我发现百度曾经不止一次惩罚过我的域名,包括长时间删除某些网页地址以及域名降权等操作,目前我的博客从Google来的流量竟然比从百度来的流量要多得多,这和大多数中文网站完全相反,我觉得这是不正常的现象,对于大多数中文博客来说,应该尝试一下使用百度懂得的语言来预防针对百度的SPAM垃圾链接。

  因为百度虽然不支持nofollow,但还是支持robots的,编写适当的robots也可以解决百度不能分辨SPAM的对策,就是将链接都定向到一个指定目录,然后在robots中disallow这个目录,即可让百度不索引,这样那么SPAM就不会再来骚扰了。

  如果你也是使用Z-Blog系统,不妨参考一下我写的这段针对搜索引擎优化的robots,将下面代码复制并另存为robots.txt,然后放到你的博客根目录下即可,如果你使用WordPress系统,请参考一下针对WordPress的robots.txt

User-agent: *
Disallow: /wap.asp
Disallow: /cmd.asp
Disallow: /function/
Disallow: /admin/
Disallow: /script/
Disallow: /FCKeditor/



原创文章如转载,请注明:转载自月光博客 [ http://www.williamlong.info/ ]

本文链接地址:http://www.williamlong.info/archives/1262.html
  • 文章排行:
  • 3.0987
  • 这个问题我支持baidu,如果nofollow不是w3得标准,就没有必要遵守它,凭什么要为一个公司的利益而改变大家的使用习惯。除非w3定义了这个标签,才有遵守的必要。否则,这和中国移动,中国电信,微软依靠垄断推行损人利己的服务有什么区别呢?
  • ip: 218.81.173.*  2008-3-4 21:05:48   回复该留言
  • 4.0987
  • 支持百度对抗google,百度虽然流氓,但是他的存在完全是对市场被某一家公司垄断有用的,一旦市场被垄断,损失最大的是消费者。百度就好比AMD对Intel,虽然跑得慢,但是贡献是不少的。
  • ip: 218.81.173.*  2008-3-4 21:09:12   回复该留言
  • 6.aw
  • but you have to sacrifice the normal user's URL....
    The best way to fight against spam is totally removing their links.
  • ip: 221.221.161.*  2008-3-4 21:22:46   回复该留言
  • 8.coolkid
  • Gogle.......写错了...

    还是不太懂,那我这个留言的博客链接算不算?
  • ip: 124.129.200.*  2008-3-4 22:01:14   回复该留言
  • 9.xjb
  • baidu的人为因素太多,也从一个侧面说明百度在搜索技术与google有不少的差别。
  • ip: 222.247.149.*  2008-3-4 22:23:33   回复该留言
  • 12.msn
  • 呵呵,垃圾连接的危害不可防范呀
  • ip: 125.37.217.*  2008-3-4 23:23:24   回复该留言
  • 13.ruixiang
  • 刚才看到你这篇文章我又想再传一下robots文件到自己的博客上,以前的总是验证都是错误。不过验证你的也有一个错误,不知道那个验证工具权威不。我删除了错误的内容,终于显示如下文字:
    Analyzing file
    No errors found in this robots.txt file
  • ip: 59.58.24.*  2008-3-4 23:24:22   回复该留言
  • 14.linker
  • 既然你都搞这了,还要这个“网站链接”一栏忽悠啥呢?呵
  • ip: 125.46.90.*  2008-3-4 23:55:00   回复该留言
  • 22.夜火
  • 我的也被百度多次降权,很多好的排名等都没了
    现在google来的流量是百度的2倍
    希望你提供的这个方法能起到效果~
    毕竟中文站还主要是靠百度
  • ip: 123.56.53.*  2008-3-5 19:47:32   回复该留言
  • 24.GOOGLE
  • 强烈推荐一本书——《撬动地球的Google》看到这本书的时候我一下子被吸引住了,越看越精彩!!!
  • ip: 58.54.0.*  2008-3-5 22:04:19   回复该留言
  • 31.MrMike
  • 正在寻找这方面的文章,正在试用Z-Blog系统,请教如何自定义nofollow链接的目录?
  • ip: 221.237.16.*  2008-8-24 15:54:36   回复该留言
  • 34.df
  • 只是很多时候百度忽略我了……
  • ip: 123.118.4.*  2008-10-31 22:40:41   回复该留言
  • 37.KV
  • 有道理啊。不过如果想让搜索不收录跳转页面应该怎么办呢?
  • ip: 121.32.18.*  2009-1-1 8:35:09   回复该留言
  • 38.Joe
  • 我看你的网站就用了Nofollow. Firefox 有一个好的工具可以发现博客是否用了Nofollow Tag. 那就是Search Status
  • ip: 193.120.222.*  2009-1-22 0:20:42   回复该留言
  • 39.zjf
  • 谷歌中文搜索收录的网页比百度更多更精确,譬如上海有名的爱亮科贸公司,是专营冬虫夏草胶囊、精粉等生物科技食品的公司,在谷歌中文搜索上输入“上海爱亮科贸有限公司”“爱亮科贸”“爱亮冬虫夏草”等词都能搜到这个公司,而在百度上却找不到,真让人怀疑百度是中国的公司吗?很多中国的公司在百度上都找不到,百度却还在大言不惭的吹“百度知道”,应该改称“不都知道”才名副其实。我们支持李开复的google。
  • ip: 222.64.199.*  2009-7-21 20:33:20   回复该留言
  • 40.cccc
  • 收录机制不同.百度是你要求收录,它才会收录.
    google是你不要它收录,它都要强制收录一页.
    robots对google都没啥用,百度就很听话.
  • ip: 222.217.130.*  2009-7-27 3:37:34   回复该留言
  • 41.zl
  • 大家喜欢的GOOGLE的搜索,什么资料一查就有,百度上要什么资料却搜不到,而且出来一些不想要的网站,很烦人
  • ip: 222.64.194.*  2009-8-27 13:03:43   回复该留言

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 跟随我的推特:跟随我的推特
  • 跟随新浪微博:跟随新浪微博
  • 通过Google订阅本站
  • 通过鲜果订阅本站
  • 通过电子邮件订阅本站

站内搜索

热文排行

最新评论及回复

最近发表

网站收藏

本站采用创作共用版权协议, 要求署名、非商业用途和保持一致. 转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议.

This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License.