青青子衿, 悠悠我心, 但为君故, 沉吟至今
« Google个性化主页新增功能Google Earth共享发布地标详解 »

百度和Google清除站点的规则探讨

  任何一个搜索引擎都需要制定一些收录和清除站点的标准,以便确保搜索结果的公正和公平,并提供客户最佳的搜索体验,不过不同搜索引擎对于收录和清除站点的标准是不太一样的。

  关于收录上的问题,以前我曾经写了一篇文章比较百度和Google收录网站的区别,主要观点是,百度收录的多而快,对于小站点也可以大量收录,而Google收录速度较慢,主要优先收录大站点的页面。

  那么,在清除网站方面,百度和Google又有什么不同呢?这是本文主要探讨的问题。

  对于百度和Google的清除站点规则,我觉得主要分为程序的自动判断和人工判断两部分组成,下面我们将介绍一下主要的一些规则。

  Google清除网站的规则在 Webmaster Help Center 上有详细介绍,概括起来主要分为网站作弊(如隐藏文字,重复堆砌文字),使用非法的自动跳转页面技术(如302重定向),使用程序自动进行Google查询,使用子域名或者其他域名创建大量重复内容,使用门页欺骗搜索引擎,加入链接工厂等等,Google建议做网站要针对用户设计而不要针对搜索引擎设计。对于中文网站来说,Google对于作弊网站会先采用降权的方式,不太常见直接删除中文网站的情况,Google人工干预大概主要是针对英文网站来做的。另外做SEO不要使用googlepages或者blogspot进行网站优化,那样做只会被Google立刻删除。

  值得称赞的是,Google与网站管理员之间的信息是比较通畅的,Google建立了专门的“网站管理员中心”,网站管理员可以登录查看Google蜘蛛抓取网站的情况,甚至还可以设置“首选域”,设置网址在Google索引中显示的方式。

  与此对比,百度也有自己收录和删除网站的规则,有一些规则和Google的相同,有一些则比较含糊和笼统,一般认为百度的反作弊法则是神秘而让人难以捉摸的,其中部分原因是,为了保证删除的准确性,百度会人为进行一些网站的删除操作。

  百度会删除什么样的网站呢?通常认为,Google认为应该删除的网站,百度同样也会删除,Google认为不应该删除的网站,百度也可能会删除。总之,百度的删除标准会比Google更严厉一些。

  由于有了人为因素,有人会产生一个问题,就是批评百度的网站会不会被百度删除,结合一些例子,至少从目前的情况来看,百度还没有因为网站批评百度而人为进行删除的先例。

  另外一个疑问是人工的成本,人工不可能监视所有的海量搜索内容,百度也不可能雇用那么多人,那么具体这个人工干预是怎么实现的呢?根据一段时间的观察和分析,我个人推测,百度的人工干预有可能是以搜索流量为标准,对于搜索热门关键词的第一页网站进行人工验证,如果发现第一页的网站有作弊行为而百度没有正确判断,则进行人工方式降权或者删除。当然,也可能百度有一些自动化的程序进行自动处理行为。

  百度对于网站的惩罚也可能并非永久的,特别是对于本身知名度较大的网站,如果网站在百度中具有较多的反向链接,并且及时删除了百度认为不合适的页面,那么百度有可能会在一段时间后,重新收录被惩罚的网站,但是网站的权值有可能会降低。

  百度目前和网站管理员之间的信息渠道是否通畅很令人质疑,甚至可以说两者之间没有任何交流渠道,这点是远远不如Google做的好,比如webmaster的邮件永远是自动回复,贴吧里的问题永远无人处理,没有类似Google的专用工具进行分析处理等等,这也是百度在很多地方口碑不佳的一个原因。

  其实百度也发现这样所带来的问题。网络新手和普通网民的影响力微不足道,被流氓网站修改了浏览器,也不会反抗,用时间长了反而会依赖和喜欢上这样的流氓网站。而IT专业人士则不同,他们建网站、写博客、开论坛,他们可以影响一大批普通用户,如果百度长期依靠低端用户而和大量网站管理员结怨的话,其发展前景也是令人质疑的。



  除非注明,月光博客文章均为原创,转载请以链接形式标明本文地址

  本文地址:http://www.williamlong.info/archives/674.html
  • 文章排行:
  • 1.rugcn
  • 不知为什么,我刚做的站www.rugcn.com,被google删了,郁闷,页面关键字密度20%,可是我也没有故意作弊啊
  • 2006/11/28 1:10:38   支持(15)反对(7) 回复
  • 2.calldefine
  • 我的网站百度收录要快
  • 2007/11/30 14:55:31   支持(13)反对(6) 回复
  • 3.OMEGA
  • ..我的blog页面全是被搜索引擎刷的。。。
  • 2006/10/31 12:48:27   支持(10)反对(4) 回复
  • 4.中国牛
  • 现在Google收录也挺快的!我的站才几天就一下子收录了几百篇!
  • 2006/10/29 0:27:26   支持(9)反对(4) 回复
  • 5.DLP大屏幕
  • 大屏幕系统方案网提供专业的音视频信号传输处理设备,大屏幕拼接技术方案咨询,下载,包括:dlp、crt、led、lcd、pdp大屏幕拼接方案;相关背投大屏幕设备有:dlp大屏幕拼接单元、crt电视墙单元;大屏幕信号处理设备:vga矩阵、rgb矩阵、av视频矩阵、长线驱动器和格式转换器.广泛应用于:dlp、crt、液晶、等离子大屏幕显示系统中.
  • 2007/5/17 11:57:15   支持(11)反对(6) 回复
  • 6.watsonxu
  • 艾,前一阵百度还收录我5000多的,并且搜索天涯海阁排第一,前两天不知怎么的,就只有9了,并且感觉不再被收录了,sigh.
  • 2006/10/29 16:58:06   支持(14)反对(10) 回复
  • 8.Kola
  • [WAP]向月光请教一下,域名解析可不可以对二级域名进行解析的啊?
  • 2006/10/29 23:54:15   支持(11)反对(8) 回复
  • 9.aviva
  • baidu的互动真的一般般,而且工作效率很低下!
  • 2006/10/29 2:12:13   支持(12)反对(10) 回复
  • 10.jahjess
  • 我搬家到现在地址后,百度莫名其妙地删除了新旧俩站的所有收录。

    而之前301重定向后,他还收录页面,不知为何现在清零了。
  • 2010/3/21 19:51:38   支持(13)反对(11) 回复
  • 11.Washun
  • 现在搜索引擎成了权力中心了,这是以前没有料到的事情。不久以后呢?
  • 2006/10/28 22:06:32   支持(13)反对(12) 回复
  • 12.ylsky
  • 昨天我的网站 被百度杀了,我都不知道是为什么。郁闷啊。
  • 2006/11/9 9:29:34   支持(12)反对(12) 回复
  • 13.wonglaye
  • 我的最邪门了,我的直接就被Google删除了,以前pr还是3的,现在cache都成0了,我压根就不会什么作弊什么SEO的。。。。。
  • 2006/10/29 17:49:05   支持(8)反对(10) 回复
  • 14.williamlong
  • 不明白你说的是什么意思,你具体描述一下发邮件给我吧。
  • 2006/10/30 0:04:06   支持(7)反对(9) 回复
  • 16.peng
  • GOOGLE收录了你的,就不会轻易删除的
    不过现在百度很多做法改变了些,模仿了GOOGLE的一些做法了

    中文搜索感觉还是百度好些
  • 2007/2/3 22:34:52   支持(6)反对(8) 回复
  • 18.不是个小事
  • 我的为什么收录了700多条现在收的不快了?有时候两天才收一条?
  • 2006/11/22 13:57:04   支持(4)反对(8) 回复
  • 19.hucheng
  • 不知道因为什么百度只保留我网站少量的(16)项登录,而其他全部不见,更可气的是完全没有沟通渠道,这样的搜索引擎简直毫无公正性可性,因为我的网站不存在一个字的转载,全部原创并且更新及时的网站都得不得完全收并且没有任何解释,太可气了。
  • 2008/9/28 8:55:58   支持(7)反对(11) 回复
  • 20.无忧乙肝
  • 从短期看,百度牛;长远看,则不如古狗
  • 2007/9/11 10:22:36   支持(5)反对(11) 回复
  • 21.加加站长
  • 郁闷至极啊!我的网站10月末被百度删除了,到底什么原因,现在还在思考
  • 2010/11/3 16:26:42   支持(8)反对(17) 回复

发表评论:

 请勿发送垃圾信息、广告、推广信息或链接,这样的信息将会被直接删除。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 关注新浪微博:关注新浪微博
  • 关注腾讯微博:关注腾讯微博
  • 关注认证空间:关注QQ空间
  • 通过电子邮件订阅
  • 通过QQ邮件订阅

站内搜索

热文排行


月度排行

本站采用创作共用版权协议, 要求署名、非商业用途和相同方式共享. 转载本站内容必须也遵循“署名-非商业用途-相同方式共享”的创作共用协议.
This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License.