网站运营优化

网站设计、开发、策划、运营、优化和推广等

« 大型网站如何做301重定向的策略原创项目是百度对站长描述的一张画饼 »

百度鼓励原创,您准备好了吗

  互联网鼓励原创,尤其是对于搜索引擎,更希望将优质的原创内容推荐给用户,16号的时候,百度站长平台lee发表了一篇名为:谈谈原创项目那点事。其主要目的,就是鼓励所有的站长支持原创。那么,百度是如何判断网站内容是原创的呢?Q猪就这篇文章,说一下,自己的看法,欢迎拍砖。

  重视原创的目的:

  1、采集泛滥

  分析:互联网上,采集泛滥的地区主要分布在,新闻、咨询、小说等领域,由于现在采集器越来越复杂,一般一个网站是很难防止不被采集的。

  做网站做内容,我们经常会发现的一个问题,就是,自己在网站上,原创更新了一篇内容,但是过几天去百度查询排名的时候,会发现,由于网站权重等因素,那些转载了该篇文章的网站,却排在了前列。

  对于大多数的中小型网站来说,搜索流量在总流量中,占有很重要的位置,如果长期原创,却不能获得应有的排名和流量,站长就会失去原创的兴趣,从而减少原创的比例。

  2、提高用户体验

  分析:大家都知道,原创文章对于网站的重要性,但是创造原创内容是一件很困难、很费时间的事情,有市场就会机会,所以市场了出现了大量的伪原创工具,原理就是将文章章节打乱,通过重新组合、添加关键词等方式,努力将原来的文章变成一篇新的。

  这些文章有一个共同点就是,可读性较差,从而导致用户体验度不高,另一方面,对搜索引擎的搜索质量也会产生一定的影响。

  提高用户体验,这是一个永远的话题,对于搜索引擎来说,虽然现在很多方面都做的还不够尽如人意,但是至少一直是在朝这个方向努力。Q猪建议,对于站长来说,只有增加网站原创内容,提高用户体验,网站才能长久的发展下去。

  3、鼓励原创作者和原创内容

  分析:就像第一点说的那样,只有对坚持原创的网站、原创的内容,给予适当的权重、排名,只有原创作者享受到了,原创所带来的巨大利益,作者才会坚持原创下去。

  判断原创内容有哪些困难:

  1、冒充原创,篡改关键信息

  分析:其实很多坚持原创的网站,都是那些中小型网站,但是由于蜘蛛爬行频率、搜索引擎重视程度等原因,在原创文章发表以后,经过其他网站的转载,篡改文章中涉及到的版权、关键词等信息,冒充原创。

  由于转载网站在权重等方面的优势,搜索引擎蜘蛛很难去判断,这篇文章是哪一个网站抄袭了哪一个网站。

  2、使用伪原创工具,对文章改头换面,批量生产“原创文章”。

  分析:不管如何判断文章是否为原创,由于网络上数以亿计的海量文章,判断的主体,都是程序来检验的。是程序就会有漏洞,是程序就可以摸索其中的规律,很多伪原创工具,可以通过这些工具和漏洞,将文章重新组合以后,变成“原创”。

  由于制造原创的工具也是随着算法的变化而变化的,在判断过程中,也会拥有一定的难度。

  从百度的描述中,可以看到,由于通过工具生产的所谓“原创文章”,具有语句不通顺,用户可读性差等原因,这些内容,是这段时间,百度重点整治的对象。Q猪提醒,如果你也在使用这些工具,就赶紧停止吧。

  3、结构差异化

  分析:我们知道,每个网站的结构都具有差异化,搜索引擎在抓取内容时,一般是通过分析,同一个网站中,哪些内容是通用的、哪些内容是真正具有价值的,然后分析这些有价值的内容,再索引至数据库中。

  但是,不同的站点结构化差异比较大,html标签的含义和分布也不同,因此提取关键信息如标题、作者和时间的难易程度差别也比较大。所以,每个网站都需要一个合理的网站结构,简单、清晰、明确,不仅让搜索引擎可以很清楚的抓取网站内容,也可以让用户更流畅的浏览网站内容。

  关于如何建立一个合理的网站结构,可以看一下,Q猪的另一篇文章:如何制作合理的网站结构

  百度为鼓励原创,所采取的措施:

  1、单独成立原创项目组

  分析:按照百度的说法,这个部门将长期成立,为如何判断原创,提供技术、产品、运营、法务等各方面支持。

  2、 原创识别“起源”算法

  百度如何判断原创内容,这个才是重点。

  a.首先通过内容的相似程度,将网络上,所有主题相似、内容相近的文章,不管原创或者采集,都聚合在一起。

  b.然后通过作者、发布时间、链接指向、用户评论、作者和站点的历史原创情况、转发轨迹等因素,综合考虑,判断原创内容。

  c.最后通过价值分析系统,判断该原创内容的价值高低,进而适当的指导最终排名顺序。

  3、原创星火计划

  分析:这个计划需要百度和站长共同努力来维护互联网的生态环境,站长推荐原创内容,搜索引擎通过一定的判断后优待原创内容,共同推进生态的改善,鼓励原创,这就是“原创星火计划”,旨在快速解决当前面临的严重问题。

  简单来说,就是站长推荐原创内容,然后百度再通过算法、甚至人工来判断是否为原创,这是一个改进算法的过程,也是一个较快实现原创内容被发掘的过程。

  综合上面的观点,要获得百度鼓励原创政策的照顾,作为站长首先需要做到的就是,网站内部做好结构优化、坚持原创制作、鼓励用户评论、保证网站内部链接的畅通,如果可以,保留每篇文章发布的时间。

  当然还有最重要的一定,就是如果文字是转载的,请保留原创的链接指向,这将有助于本身网站的原创判断。

  来源:投稿




发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

日历

<< 2015-10 >>

Sun

Mon

Tue

Wed

Thu

Fri

Sat

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

订阅博客

  • 订阅我的博客:订阅我的博客

站内搜索

热文排行

最新评论及回复

最近发表

本站采用创作共用版权协议, 要求署名、非商业用途和保持一致. 转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议.

This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License.