青青子衿, 悠悠我心, 但为君故, 沉吟至今
« Google搜索敏感关键字的新技术AdSense的交叉牟利和无效点击 »

加盟网站、复制内容和搜索引擎

  (本文为话题广告)这篇文章主要讲述目前流行的加盟网站(Affiliate Program)存在的内容复制的问题,以及搜索引擎可能采取的对策,通过具体的示例来分析这种加盟网站可能存在的风险。

  介绍例子之前,我先介绍一下客齐集这个网站。客齐集是美国著名电子商务公司EBAY的一个子站中的中文版本,它是一种分类信息网站,主要功能是向用户提供发布和查询信息的服务。客齐集在全球二十多个国家开通数百个城市的分类信息业务,在中国,客齐集目前也已在上海、北京、广州、深圳、杭州、成都等几十个城市开通分类信息服务。其数据量非常庞大。

  我今天要讲的主要是客齐集的一个很有争议的功能:频道定制栏目。这个功能号称是“分布式电子商务模式”,客齐集为电子商务应用的主站,各个中小网站通过分类频道的方式形成“分布式”应用,从一个角度来看,客齐集、成员网站都获得了收益,但是从搜索引擎的角度来看,客齐集的加盟网站和搜索引擎两者之间产生一定程度上的利益冲突。并在一个月前发生了百度封杀分类频道的事件。

  分类频道是这种分布式应用的表现形式,简而言之,客齐集分类频道就是让很多小站长通过修改域名DNS的方式,在自己的网站上增加几乎完全相同的分类频道,这样就能在自己的网站上快速形成一个栏目。据了解客齐集频道定制服务推出不到一个月已经有超过4000个网站加入,并以每天超过200个新网站的速度发展。

  值得注意的是,这种分类频道的定制和以往一些应用有所不同。这种分类频道的定制对于个人网站来说比较友好,定制内容也很灵活。为了测试其功能,我自己也注册了一个客齐集的联盟进行试用(域名我就不说了),只需要简单设置一个CNAME域名,就可以得到至少三十万个页面,如果全部页面都被搜索引擎索引,那么会有接近百万个页面的庞大的分类网站。在网站设置上,可以自定义头部代码,侧栏代码,底部代码;还可以方便设置列表页和信息页的代码,增加Adsense广告代码;通过CSS的设置,还可以将客齐集的LOGO图标隐藏。

  从加盟的个人网站的角度来看,只需要简单设置一下CNAME域名,瞬间就得到数十万页的分类信息内容,还可以增加自己的导航图标和广告,自己不用更新,里面的内容还会自己更新,如果这些页面被搜索引擎索引的话,可能还会带来一些流量以及广告收入,这个算盘还真不错。

  从客齐集来讲,这种加盟频道的方式可以有效扩大其知名度,越多人能访问这些内容,自己得到的也越多,损失的只是微不足道的流量。虽然从SEO的角度看,这种方式会在网络上产生大量复制内容,但由于每个分类网站都会给客齐集主站一个链接,这样就保证了客齐集主站具有很高的信用度,因此这些复制内容对主站自身的分类信息不会产生负面影响。

  相对于两方面都收益的联盟,搜索引擎就面临困难的抉择。显然,这是大规模的“复制内容”,也就是说两个或多个网站的网页内容几乎完全相同,或非常相似。搜索引擎必须判断并找到原始版本,然后把其他的复制网页忽略。但是如果页面内容非常庞大,多达数十万页,那么搜索引擎的判断就要耗费大量资源,按照客齐集数千个加盟网站的规模,这些复制内容充斥着互联网,数目极为庞大。

  搜索引擎的抉择是艰难的,搜索引擎最喜欢的是有价值的网页,不喜欢那些高度重复性的内容。对于非常关注用户搜索体验的搜索引擎来说,通常会倾向于对复制内容进行降权甚至惩罚。上个月,百度就痛下杀手,将客齐集的所有联盟网站从百度索引中删除了,这意味着那些联盟网站再也不会从百度中得到任何流量。

  从外界的评论上看,基本上都认为百度的做法没有什么不妥。对于这种复制网页的行为,我也觉得不是一个恰当的做法。道理其实很简单,设置这种“分类定制频道”无非就是想从搜索引擎中获得流量,而大多数人只需要设置一个子域名就可以“获得”数以十万计的海量页面内容,如果这些重复的内容被搜索引擎索引并展示给搜索的用户,那么用户的体验是什么样的呢?对于那些辛辛苦苦勤劳写作的人们来说,这种“不劳而获”的做法公平吗?很显然,搜索引擎为了使得用户获得更好的搜索体验,很有可能会将这些重复内容全部删除,百度就是这么做的,Google目前还没有做出激进的删除行为,可能的原因是其索引算法会自动将复制内容列入“补充材料”或者自动降权。

  因此,加盟这种分类网站虽然有可能获得一些流量,但是也有风险。

  1. 如果使用主域名加入其分销联盟计划,主域名会被百度封杀。
  2. 如果使用子域名加入,子域名也会被百度封杀,但现在还看似乎没有影响主域名。对于Google来说,加盟的网页内容很可能会被加入Google的补充材料

  分类信息网站之所以引人注目,主要原因是其贴近人们的日常生活。就连Google也推出“Google生活搜索”这样的分类信息搜索,可见其重要性。然而,制造垃圾信息是一种罪过,如果分类信息的内容非常好,又何必浪费用户的时间在那些复制内容的页面上呢?



  除非注明,月光博客文章均为原创,转载请以链接形式标明本文地址

  本文地址:http://www.williamlong.info/archives/898.html
  • 文章排行:
  • 2.xiaooo
  • 千万站一个样,这互联网还有前途吗?
    搞网站联盟觉得不可取.
  • 2007/5/22 12:13:56   支持(13)反对(9) 回复
  • 3.gongzuofu
  • 是的,客集齐这种激进的做法,实在不敢沟通,俺比较喜欢马云的"口啤网",真正是口啤相传.
  • 2007/9/28 19:43:22   支持(10)反对(6) 回复
  • 4.anzhuangbanyun
  • 有口皆啤呀,这样的事情谁都回喜欢的
  • 2007/11/13 9:23:50   支持(7)反对(4) 回复
  • 5.wdj
  • 我早就觉察了,我很多米做的加盟站,搜索引擎都没收,现在老实做站。
  • 2007/5/28 23:25:44   支持(10)反对(8) 回复
  • 8.chxy365.com
  • 我的网页上个星期也被百度封杀了,让我好是郁闷,网站没有任何不健康的内容,只是我一个空间绑了多个网站,不同的域名跳到不同的目录,呀的,上个星期全被百度杀了.........
  • 2007/5/22 2:48:31   支持(7)反对(7) 回复
  • 10.道天
  • 忘记补充了,雅虎是自始自终就只收录了一个页!
  • 2007/5/23 21:12:32   支持(8)反对(8) 回复
  • 11.gongzuofu
  • 对客集网这个策划,我是非常的佩服的,想法的双赢,对于搜索引擎,还真的要做到双赢,那这个策划就更为经典了,我真的很想知道这个策划是哪位高手,也向月光兄学习了。
  • 2007/7/23 23:20:55   支持(5)反对(5) 回复
  • 13.Charles
  • 挺罗嗦的一篇文章,不知道要拐那么多弯,饶来绕去干嘛……
  • 2007/5/22 9:31:19   支持(6)反对(7) 回复
  • 14.摩摩诘
  • 请教一下月光,如何让feedsky的订阅数自动加到feedburner的订阅数里啊?
    或者说,有没有办法让所有订阅者都被统计到任何一个feed烧录的统计里面啊.
  • 2007/5/22 18:10:37   支持(9)反对(10) 回复
  • 15.awflasher
  • 1、设置robots.txt估计可以避免吧。
    2、流量不是来自SEO,而是来自自站点流量。月光这一点似乎忽略了。
    3、我支持这种模式。搜索引擎应该为用户服务。这种模式对用户没有害处。
  • 2007/5/23 12:44:40   支持(8)反对(9) 回复
  • 16.城市隱士
  • 我也是觉得这种内容OEM对搜索不利,看了月光这篇文章就更加要小心了
  • 2007/5/22 0:42:11   支持(7)反对(9) 回复
  • 17.kaku
  • 真是好玩。
    一个月前在baidu里搜索kaku第三个就是我的小站

    结果我说了没鸡巴的事,就把站点踢出去了。

    我又把它删除我站点的事情讲出来,baidu又给恢复了原来的样子。

    呵呵~~人工干涉哦
  • 2007/5/22 10:57:07   支持(8)反对(10) 回复
  • 18.ajaxgoogle
  • 5月18日,google开始对使用adwords和adsense进行交叉牟利的网站进行了大面积封杀,本站不幸沦为google公司刀下之牺牲品。对于google公司这种不负责任的做法,应该有人站出来说几句公道话了。月光大哥应该站出来为广大站长们说话。
    http://www.ajaxgoogle.com/blog/2007/05/22/google%e7%9a%84%e7%a7%98%e5%af%86/
  • 2007/5/22 13:04:53   支持(4)反对(6) 回复
  • 19.BlueDrifter
  • 不知道自己的理解对不对:
    对于“客齐集”的操作方式,无非是“转帖”的群体化操作罢了。

    不知大家对于“转帖”有什么看法?
  • 2008/4/2 11:57:18   支持(8)反对(10) 回复
  • 20.百慧博客
  • 转贴还好点,这个比转贴更简单,呵呵
  • 2009/4/6 10:46:47   支持(3)反对(5) 回复
  • 22.一个叫搜索引擎的家伙
  • 搜索引擎如何判断文章或网页的原始出处是搜索引擎需要解决的一个问题
    比如通过算法对发文日期、网页权重、链接等的分析
  • 2007/5/22 7:46:19   支持(9)反对(40) 回复

发表评论:

 请勿发送垃圾信息、广告、推广信息或链接,这样的信息将会被直接删除。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 关注新浪微博:关注新浪微博
  • 关注腾讯微博:关注腾讯微博
  • 关注认证空间:关注QQ空间
  • 通过电子邮件订阅
  • 通过QQ邮件订阅

站内搜索

热文排行


月度排行

本站采用创作共用版权协议, 要求署名、非商业用途和相同方式共享. 转载本站内容必须也遵循“署名-非商业用途-相同方式共享”的创作共用协议.
This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License.