月光博客 » 搜索引擎 » 也谈Google搜索引擎对原创内容的识别

也谈Google搜索引擎对原创内容的识别

  Google中文网站管理员博客在《由抄袭造成的重复内容》文章中提到:“鉴别内容的原创来源是Google所擅长的,在大多数情况下原创内容源都能被正确地识别出来,从而不会给发布真正原创内容的网站带来任何负面影响……当有人剽窃了您网站中的内容,并将其展示在其他网站上牟利。Google在不同网站遇到相同内容的时候,会基于许多不同的依据来判断究竟哪个网站才是原创,而这样的判断通常是准确的。”  

  根据我的观察,Google识别原创内容源的能力有时候比较准,但有时候不太准,不准的情况主要是在中文网站上,因为Google无法用简单的链接权重来平衡门户网站和个人博客之间的孰是孰非。

  目前的中国互联网仍然是主流门户网站的天下,个人博客的生存环境异常艰辛,个人辛辛苦苦的写作往往得不到回报,产生的内容却因为种种原因无法给个人带来应该得到的回报,所有的流量都逐步流向主流门户网站。通常情况下,Google给予门户网站的权值和网站权威度都非常高,当一篇完全相同的文章同时出现在门户网站和个人博客上的时候,Google往往认为原创者是门户网站,除非个人博客的权值非常大。

  门户网站为了内容的大量更新而雇佣了不少“网站编辑”,“网站编辑”通过人肉筛选的方法从个人博客上挑选出优秀的文章,并将这些文章复制到门户网站,复制内容的同时通常会删除原始文章的作者和文章中的链接地址,同时小幅修改文章的标题,经过这一番“处理”,Google通常很难判断出到底哪个文章是原创,当一个原创个人博客的文章被大量门户网站复制之后,Google搜索引擎可能会惩罚这个原创博客,不再索引上面的文章。

  这里我举一个例子,我在今年三月份曾经写了一篇文章《十个常用网络密码的安全保护措施》,然而相当长的一段时间里,我在Google中搜索这篇文章的标题时,却看不到来自我的博客的一点踪影,我看到的是什么呢?这篇文章被21CN中关村在线新浪网硅谷动力计算机世界瑞星科技等等无数大型门户或专业网站非法转载,最具讽刺意味的是,国家违法和不良信息举报中心这样的国家政府机关的网站竟然也非法进行了转载,通常情况下政府网站在搜索引擎中的权威度是非常高的。

  结果是,我的原始文章被搜索引擎惩罚了,至今在百度上找不到我的文章地址了,而Google前几天才重新索引了我这篇文章,其余时间网站的排名都被上面那些主流门户网站抢走了。

  从内容上说,个人博客的内容远远无法和主流门户网站相比,主流门户网站拥有自己的编辑团队和营销团队,具有足够的资源和能力输出更好的内容,而个人博客要写一篇好文章需要酝酿很长时间,每周能写一篇好文章已经算不错了,这就注定了个人博客是竞争不过门户网站的。

  当然,个人博客也有自己的对策,就是要求门户网站删除复制的文章,但通常会浪费巨大的时间和精力,当被复制的文章累计到成千上万的时候,完成这种工作量通常是不可能的任务。

  因此,Google要想在中文的互联网环境下实现对于原创内容识别的准确性,需要考虑使用专门针对中国特殊国情的特殊算法,否则,中国原创的博客群落将会逐渐被门户网站边缘化,走向自生自灭的可悲下场,最为可悲的是,中国最大的搜索引擎百度对于原创内容的识别几乎是一片空白,这也使得当前中国的互联网的环境显得异常恶劣。

也谈Google搜索引擎对原创内容的识别

顶一下 ▲()   踩一下 ▼()

相关文章

  1. 1
    Anonyshow   说道:
    建议Google通过日志发布时间来解决这个问题。
    支持(11反对(6回复
  1. 2
    N   说道:
    要怪,就怪中国这个环境太适合“盗版”的存在吧,不怪Google.
    支持(10反对(6回复
  1. 3
    stevenyin   说道:
    很多事情都是国情决定的,无力改变就去适应吧
    支持(11反对(7回复
  1. 4
    aw   说道:
    月光给这些external都加了nofollow,非常赞!!~
    支持(12反对(8回复
  1. 5
    eaglefantasy   说道:
    唉,咱这种小博客生存的太艰难了...
    支持(13反对(9回复
  1. 6
    pig   说道:
    在网吧用了百毒,真×××难用。第一页全×××广告、垃圾。
    支持(11反对(7回复
  1. 7
    leejonkang   说道:
    我有一种阻碍转载的专利,愿意在你的博客上试用.
    leejonkang@gmail.com
    支持(8反对(4回复
  1. 8
    linker   说道:
    我也知道百度也不是什么好鸟!而我也确实在寻找有关技术资料时,首用的就google.com,因为我不想浪费时间看百度前几页的垃圾;但,这不等于我否定我前列所言。

    民族情节高涨,不是高涨,是以前一直在低落,是一直在向平衡的水平线下堕落;就似海归现象一样,在外呆的就不爱国,归国的就是镀金而高人一等,这类似的现象,都有一个平衡点看待的问题,考虑点不对,那么这些行为就会变质。

    google确实有其技术方面称道的一方面,但我在另一方面不断的看到,大量的google爱好者,过于吹捧,过于痴迷,对待google的每一个小细节更改、出现,都到了信奉图腾似的地步,何至于此?这现象有吧?外国人把这现象都看待得很正常,何至国人对此有如此大的倾向?

    在没到真正的地球××主义到来之前,发展主体永远要以单方面为上,你拥戴起来的google,以后不一定会对你所在的国家采取什么样的不公正待遇。技术,什么时候真正纯粹过?

    学习先进技术,是为了强大自己,“师夷长技以制夷”,这个态度才对;

    如果哪位能够预测,google真正能够做到伟大的大公无私,中美之间产生问题google会作壁上观,那么我今天的发言,就算放×。
    支持(10反对(6回复
  1. 9
    铁碎牙   说道:
    遇到整个博客被人用博客搬家工具搬走的时候最头疼。。。
    支持(13反对(9回复
  1. 10
    zgjie   说道:
    这对独立博客或小网站确实是个严重的问题。
    支持(11反对(7回复

发表留言