青青子衿, 悠悠我心, 但为君故, 沉吟至今
« 使用AdSense制作站内搜索FeedBurner开始识别鲜果阅读器 »

解决聚合网站发布全文RSS Feed的问题

  随着越来越多的博客提供全文RSS Feed输出,不少人开始对一些RSS聚合网站感到疑惑。这些RSS聚合网站通过获取其他博客的全文RSS Feed输出,将这些RSS做为网站内容重新发布,这样的行为引起了不少争议。

  显而易见,博客提供全文RSS Feed输出的原因并不是为了方便所谓的RSS聚合博阅网站的内容更容易发布,而是为了方便读者阅读,减少读者阅读文章所花的成本。那些聚合软件大部分未取得授权而将他人的全文RSS输出做为内容发布出去,这本身就不妥。从SEO的角度上讲,这样将造成大量的“复制网页”的内容出现,使得搜索引擎难以判断哪篇文章是真正的原始出处。对于一些不懂得SEO的博客来说,其较低的页面权值以及大量重复内容的出现,往往会让搜索引擎发生误判而惩罚这些原创内容的博客。

  因此,对于博客作者,需要对这些“复制网页”的行为有所行动,否则最终可能会殃及自身,目前我分析有几种不同的选择。

  下策:将RSS Feed输出从全文输出修改为摘要输出,甚至取消RSS Feed输出。这种对策虽然可以解决“网页复制”的问题,但是伤敌一千,自损八百,通过阅读器阅读的读者无端受到影响,阅读效率大幅下降。因此这种策略我并不推荐。

  中策:联系聚合网站,要求其做出一些行动。根据CC协议中的相关规定,如果你认为别人在使用你的作品有一些不当行为的时候,你可以通知他们进行删除,他们也有删除的义务。但问题是,对于大量的RSS聚合网站,这样的操作要耗费巨大的时间和精力。

  上策:通过技术手段解决问题。只要在RSS输出上进行一些针对搜索引擎方面的技术上的优化修改,就可以使得全文输出的RSS对自己的负面影响减少,这个优化修改就是增加一个指向原始文章的超级链接。

  从Google搜索引擎的角度来看,如果发现网络上有很多相同的复制内容,如果内容中存在链接,那么Google就很容易判断原文的地址,因此,全文RSS Feed必须要在每篇文章中,增加一个指向原文的超级链接,这样简单的操作就可以减轻被Google“诬陷”自己“复制网页”的罪名。

  具体的修改方法是,对于WordPress系统,使用一个名为better feed的插件,对于Z-Blog系统,请参考我写的一个Feed插件。安装好后,就增加一个链接,名字叫做“发表评论留言”等都可以,链接地址指向原文的URL地址。

  不过这个方法也有一个缺点,就是有时候即使有明显的链接指向,对于百度搜索引擎来说还是无法正确找到原始文章地址,估计百度判断分析超级链接的原理和Google有所差别。



  除非注明,月光博客文章均为原创,转载请以链接形式标明本文地址

  本文地址:http://www.williamlong.info/archives/982.html
  • 文章排行:
  • 1.FreeFlag
  • 这个问题不仅仅是技术上的,更多的是道德问题.
  • 2007/7/24 19:19:37   支持(14)反对(7) 回复
  • 2.redleaffly
  • 嘿嘿,我做的www.blogzhai.cn博摘网,就如月光所说的,:) 而且月光博客也在其中...
    要删除的话请email me
  • 2007/7/24 20:58:38   支持(9)反对(4) 回复
  • 3.野鸭
  • 建议还是以标题作为链接文字。
  • 2007/7/27 0:11:59   支持(9)反对(4) 回复
  • 5.sheva
  • 。。还有一个解决方法,没有道德问题,技术上也不难,效果最好。

    就是不写。。。
  • 2007/7/24 20:25:06   支持(10)反对(6) 回复
  • 6.spirit.wan
  • 大家还是学习下基本的seo,至少学会添加一些本站内部的连接什么的。
  • 2007/7/28 19:41:43   支持(7)反对(5) 回复
  • 7.大猫

  • 百度啥都会"学",应该不久后也学会了吧
  • 2007/7/24 19:19:21   支持(9)反对(8) 回复
  • 8.Washun
  • 哈哈 先见之明 早就用了这个插件
  • 2007/7/24 22:36:09   支持(8)反对(7) 回复
  • 9.jianshu
  • 鄙视某些不HD的RSS聚合网站
  • 2007/7/25 4:06:37   支持(9)反对(8) 回复
  • 10.linuxcity
  • 前两天我还在想呢,因为最近翻译了几篇新闻,被solidot.org收录,后来一想google会不会判我为抄袭?我的域名是.info的估计权值较小,但是我的页面出现日期应该比他们早阿。不知道Google会不会考虑这个?
  • 2007/7/24 20:48:52   支持(5)反对(6) 回复
  • 12.大猫
  • 这个就是道德解决不了的问题.只能通过技术解决...
  • 2007/7/24 19:51:54   支持(6)反对(8) 回复
  • 13.sky
  • 在原文里加链接的办法、嘿嘿,恐怕所有的采集软件,都有过滤链接的设置 技术上这个根本不是问题 太容易了 自己写上2句代码也很容易清除的
    所谓魔高一丈
    楼主应该明白的

    最后还是得靠法律约束
    如果聚合网站保留原文的链接,我想大部分作者应该还能接受


  • 2007/8/19 11:35:37   支持(6)反对(10) 回复

发表评论:

 请勿发送垃圾信息、广告、推广信息或链接,这样的信息将会被直接删除。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 关注新浪微博:关注新浪微博
  • 关注腾讯微博:关注腾讯微博
  • 关注认证空间:关注QQ空间
  • 通过电子邮件订阅
  • 通过QQ邮件订阅

站内搜索

热文排行


月度排行

本站采用创作共用版权协议, 要求署名、非商业用途和相同方式共享. 转载本站内容必须也遵循“署名-非商业用途-相同方式共享”的创作共用协议.
This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License.