青青子衿, 悠悠我心, 但为君故, 沉吟至今
« 谷歌被阴谋陷害之谜IIS下PHP的ISAPI和FastCGI比较 »

Google Trends和Google Insights

  Google Trends(谷歌趋势)发布过中文版,是Google推出的一款基于搜索日志分析的应用产品,通过这个工具可以知道某一搜索关键词在Google被搜索的频率和相关统计数据。Google Insights是Google推出的一个新服务,目前只有英文版,功能比Google Trends多一些,相当于Google Trends的升级版,主要用于市场分析等商业用途。

  Google Insights和Google Trends的区别:

  Google官方解释,Google Insights和Google Trends使用相同的数据来源,Google Insights主要面向那些研究人员或广告商的那类需要更多更高级功能的用户。

  因此我们知道,Google Trends和Google Insights由于使用同一数据来源,因此统计的结果理论上应该是相同的。

  继续昨天讨论的问题,对于“儿子”这个关键字的统计,Google Trends搜索“儿子”和Google Insights搜索“儿子”的统计的结果的确完全一致,统计曲线吻合,两者均将6月6日和6月19日做为两个峰值。

搜索“儿子”

Google Trends搜索“儿子”

搜索“儿子”

Google Insights搜索“儿子”

  对于其他关键字的搜索,两者的统计曲线也是完全吻合的,大家可以搜索一下自己所想得到的热门关键字来看看,例如“百度”、“QQ”等。

  但是,对于“儿子与情人”、“儿子母亲”等等类似的关键字,两者的统计却不尽相同。

  在Google Trends上看,之前搜索量很低,6月18号开始出现大量搜索,之后呈现不规则的曲线下降,后来还有反弹。

搜索“儿子与情人”

Google Trends搜索“儿子与情人”

  而Google Insights显示从11号开始出现“线性”增长趋势,到了17号达到顶峰,之后出现“线性”下降趋势,也就是说该关键词的搜索量按照固定比例增加,第一天10个,第二天20个,第三天30个,这种搜索现象非常奇特。

 

搜索“儿子与情人”

Google Insights搜索“儿子与情人”(全球范围)

搜索“儿子与情人”

Google Insights搜索“儿子与情人”(北京地区)

  我觉得,Google Insights对于“儿子与情人”等关键字的统计数据有很多不合理的地方。

  首先是搜索顶点,6月18号央视新闻之后,该关键词的搜索量不升反降,和Google Trends相矛盾,也不符合常识,因为6月18号之后肯定会有大量网民对其进行搜索验证的,从而带动这个关键词搜索量上升。

  其次是搜索曲线,对于“儿子与情人”等等关键字,Google Trends显示的是一条曲线,先暴增,然后下降,然后再增,较为符合常识,而Google Insights显示的是一条线性增长和下降的直线,也就是说,每天增加的搜索量按比例呈有规则的增长,并且按比例下降,特别是18号之后也没有任何波动,依旧呈现“线性”下降趋势,这显然不符合常识。

  最后,最为重要的一个证据是,单独以北京地区范围搜索“儿子与情人”,会发现其数据和全球范围Google Insights搜索“儿子与情人”的数据有极大出入,北京地区的Google Insights数据呈现完整的曲线,顶峰是6月18日,与Google Trends的曲线基本相同,北京拥有大量网络用户,并曾被匿名用户指责刷数据,但Google Insights这两个曲线明显呈现自相矛盾的地方,很明显,Google Insights对于该关键字搜索的全球数据真实性存在极大的疑问。

  因此可以看出,Google Insights对于上述几个关键词的统计结果有很多不合常识的地方,和实际情况以及Google Trends的数据有很多矛盾之处,相对来说Google Trends的统计数据更具准确性,更值得参考,做分析和判断应该以Google Trends的数据为准。



  除非注明,月光博客文章均为原创,转载请以链接形式标明本文地址

  本文地址:http://www.williamlong.info/archives/1845.html
  • 文章排行:
  • 1.dilly
  • 不管怎么说,那些关键词17号之前在trends里是没有数据的。trends的图,17号-18号这条曲线不能反映实际的搜索情况。18号以后,在trends和insights里都是下降趋势。
    为何18号开始trends里开始有这些关键词的数据了呢?可能是因为搜索累积达到了一定数量,或者是搜索的来源更加广泛(17号之前都是北京的),或者其他原因。总之18号以后这些关键词的搜索没有人为的痕迹,比较像正常的搜索词了。
    路人 于 2009-6-29 1:41:33 回复
    17号以后下降是因为 Google 人工调整了“搜索建议”,
    大部分人在没有“搜索建议”的情况下,不会输入这么长的变态词组。
  • 2009/6/28 22:25:29   支持(18)反对(8) 回复
  • 2.钱是命
  • 儿子与情人就是本小说。而是非常有名气的一本小说。了解美国小说的人都知道。为什么以前就一直没流量。你却拿突然来的流量“做学问”。你本身已经先入为主。有了那个念头才拿所谓不是证据的证据来佐证
  • 2009/6/28 20:24:18   支持(16)反对(8) 回复
  • 3.nanz
  • 敏感问题,小心讨论。。。。
  • 2009/6/28 23:11:25   支持(23)反对(16) 回复
  • 4.明月
  • 沙发。。哈哈哈
    问题 于 2009-6-29 9:53:52 回复
    "因此可以看出,Google Insights对于上述几个关键词的统计结果有很多不合常识的地方,和实际情况以及Google Trends的数据有很多矛盾之处,相对来说Google Trends的统计数据更具准确性,更值得参考,做分析和判断应该以Google Trends的数据为准。"

    文章出现不少对google文档的翻译错误,而且提供的事实并不以证明此结论的正确。作者不可以凭错自已的主观意识误倒读者"insights没有可用性"。
    问题 于 2009-6-29 14:06:07 回复
    请各位移步59楼讨论问题
    mond 于 2009-6-30 0:35:05 回复
    显然博主对Google Trends和Google Insights 有些误解
    例如:原文中说
    【首先是搜索顶点,6月18号央视新闻之后,该关键词的搜索量不升反降,和Google Trends相矛盾,也不符合常识,因为6月18号之后肯定会有大量网民对其进行搜索验证的,从而带动这个关键词搜索量上升。】

    >>该关键词的搜索量不升反降
    事实上 google insights图表的纵坐标并没有标明是搜索量(和google trends 不一样),google insights 用了一个比较主观模糊的词(interest over time随时间的兴趣),疑问来了,是不是下降的曲线就意味着搜索量下降呢?因为篇幅的关系,请感兴趣的同学自行google下面的句子“Does a downward line indicate lower search volume?” 当然更深入的挖掘可以知道google insights数据时是如何得到的。
  • 2009/6/28 19:38:02   支持(19)反对(13) 回复
  • 5.四十二点亡灵
  • 好像不是很有说服力,至于哪个数据更准确的问题。但是可以明确一点,月光最开始批判的那位作者并不是用ccav的手段,因为这里你也说了两个结果有误差,是没是用两个都来搜啊!还对比一下。
  • 2009/6/28 19:42:10   支持(17)反对(11) 回复
  • 6.kk
  • 月光的观察不容置疑,图片的确令人费解,即使如此,不影响谷歌被害也是一样的不容置疑。
    20几日的截图,可能已经被网友和政府两方面影响,而且还有以上网友说的种种。
    仔细看了一下,觉得图片上的各种情况是可以并存的,毕竟全球搜索量和北京搜索量不可同日而语;儿子和不正当关系和OOXX过性生活也是不可同日而语,而且这种关键词过于幼稚五毛,应该不如月光贴出来的07搜索联想词。
    就北京流量来说,那天播出之后群众流量一下子把之前刷的对比到百分之1以下也很有可能。若不是这样,“Google Insights搜索“儿子与情人”(北京地区)”就说明之前根本没人搜。
    全球方面,17日之后竟然以直线平滑下降,说明和北京地区起伏的小小波形肯定有算法上的不同,而且播出后反而下降,这个有疑点的图不能拿来说事。如果图没事,则说明各地技术型五毛特工队一撤,即使北京网友也不是对手。

    这事现在虽很难弄清了,不管怎么说看到小高同学NC的言论,个人决定一定支持力挺谷歌这个其他国家都用的嗷嗷叫,天朝阉割版还被攻击的搜索引擎。 什么时候13亿人口大国足球有迷你小日本踢得一半好之时,俺就相信CCAV办事能力了

    以上为本人不成熟观点谢绝跨时代追捕
    pan 于 2009-7-19 23:19:22 回复
    讲的不错,个中缘由,可能要沦为千古之谜了。不过我对焦点访谈失望透了
  • 2009/7/19 21:39:30   支持(21)反对(15) 回复
  • 7.dilly
  • 再看看google怎么解释trends的数据不准确情况:
    "15. My website's information in Trends for Websites doesn't match my own data. Why?
    It's important to keep in mind that all results from Trends for Websites are estimated. Moreover, the data is updated periodically, so recent changes in traffic data may not be reflected. Finally, keep in mind that Trends for Websites is a Google Labs product, so it's still in its early stages of development and may therefore contain some inaccuracies. In the future, we may consider ways to improve the accuracy of Trends for Websites by allowing owners to contribute additional data from their sites."

    Trends是个lab产品,还在开发的早期阶段,数据有点问题很正常。 insights好歹都beta了。
  • 2009/6/29 1:19:59   支持(16)反对(11) 回复
  • 8.不具名
  • 显然月光没看我在上篇帖子的回复
    我来总结下两个服务的区别吧

    超低搜索量关键词
    Google Trends :不显示
    Google Insights :7天1个数据点

    较低搜索量关键词
    Google Trends :1天1个数据点
    Google Insights :7天1个数据点

    高搜索量关键词
    Google Trends :1天1个数据点
    Google Insights :1天1个数据点

    测试用关键词
    超低搜索量关键词 社会认知
    较低搜索量关键词 济慈
    高搜索量关键词 变形金刚
    四十二点亡灵 于 2009-6-29 19:51:41 回复
    不知道为什么我这里和“不具名”用一样的关键词 用Google Insights的结果为什么不一样!不会是我眼花吧! 你所说的关键词“社会认知”和“慈济”都是一天一个数据点。这让我很不明白,如果可以的话麻烦你给个链接,我想看看那原图,只是为了学习、、、
    niu 于 2009-6-29 20:18:08 回复
    1. Google Insight上可以设置检索的时间段: 如果设置为"2004年-至今",检索的数据段是逐月累计的;如果设置为"12个月"或"2009年" 或"2008年",检索的数据段时按7天作累计的;如果设置为"最近7天"或"最近"30天"或"最近90天",检索的数据段是逐天累计的;

    2. 登录Google后,能够看到图上的访问量,但上面访问量不是绝对值,已经经过百分比处理,即:把设定时间段的最高检索量的那一天或那一周或那一月的检索量设为100,其它各天、周、月的检索量与之比较得出相对值.
  • 2009/6/29 17:54:06   支持(16)反对(11) 回复
  • 9.钱
  • 恭喜月光博客被五毛进驻,反对绿坝软件的枪手们,ZF给了你们多少钱?
    酱油是来打我的 于 2009-6-29 20:36:22 回复
    此五毛已疯~
    钱 于 2009-6-29 21:17:27 回复
    你有儿子吗?盲目抵制绿坝,你不怕你儿子跟你老婆乱伦吗?
    酱油是来打我的 于 2009-6-29 22:04:12 回复
    原来你是由于老婆和儿子乱伦,才支持绿坝的啊~
    酱油是来打我的 于 2009-6-30 12:29:12 回复
    乱不乱伦是我们的自由,不用五毛管
    钱 于 2009-6-30 13:30:37 回复
    挣五毛钱是我们的自由,不用×民操心
    钱 于 2009-6-30 13:33:59 回复
    和我斗,你们这群P还嫩点
    酱油是来打我的 于 2009-6-30 13:35:12 回复
    垃圾五毛,除了冒名顶替和指鹿为马你们这群D狗还会什么?……
    酱油是来打我的 于 2009-7-4 21:58:30 回复
    垃圾五毛,我们挣美国人的美分、吃美国人的屎你们也管不着
    pan 于 2009-7-19 22:55:36 回复
    请问无毛是什么东东
  • 2009/6/29 20:19:42   支持(16)反对(11) 回复
  • 10.niu
  • 关于6月10号至17号变态词汇检索量每天线性增长14,6月18号以后线性递减13的猜测:

    1. 从6月10号后有一台或几台机器开始定期在Google自动搜索这个变态词汇,每天对这些变态词汇的检索量近似是相对固定数值14,并从6月17号开始停止检索;

    2. Google Insight上的每天检索量是7日或7日以上均值,那条线是7日或7日以上的均线(即过去7天或以上的总量均值),可以有效消除量的涨落;

    3. 考虑到图形以6月17号为中线左右两次近似对称,Google Insight的图线应当是7日均线,即周线;

    4. 以上几点可以很自然得出目前的图形:从6月11号机器固定贡献检索量14,7日均线也会呈线性增长态势;17号后机器停止工作,7日均线会呈线性递减态势;

    5. 变态词汇的个人随机检索量在6月17号前近似为1 ;6月17号后会稍增长,但Google已关闭搜索联想功能,个人随机检索量会增长,但一般人很难想到,不会疯长,近似为2。
  • 2009/6/29 22:34:55   支持(18)反对(13) 回复
  • 11.lightson
  • 可正如月光你所说
    Google Insight是Google Trends的升级版
    在没有搞清楚Google Insight是如何处理数据之前
    不能说就以Google Trends为准吧?
    RunescapeGold.org 于 2009-7-9 17:27:40 回复
    我的网站http://runescapegold.org 刚健10几天的时候,google 每天有收录并PR值升为2,可是好景不长,差不多半个月,我的网站就没有显示在GOOGLE 里面了,可是pr还是2,不知道为什么,好奇怪,有没有高手,帮我看看分析下什么原因。我一直想不通为为什么会这样。我也没作弊应该,我是采集的文章。
  • 2009/6/28 20:06:47   支持(19)反对(15) 回复
  • 12.Jacse
  • 我觉得是CCTV造假,谁会搜索那么长的整句关键词。
    pan 于 2009-7-19 22:42:13 回复
    关键是如果是我想上黄网,谁会文绉绉地敲入“性生活”这样的字眼,实在是菜狼
  • 2009/6/28 20:31:09   支持(14)反对(10) 回复
  • 13.cppgohan
  • trends对于小数据不敏感

    你可以用“杰克逊死了”这个关键字做比较!
  • 2009/6/28 23:44:30   支持(15)反对(11) 回复
  • 15.zvhdd
  • insights里直线的图还有一种理解,我今天仔细对比之后想到的,仅供参考

    不是从10号开始搜索量上升,到17号达到顶峰然后下降

    而是数据根本就是7天为单位统计一次的,因为粒子比较粗,所以看起来好像是10号开始就有人作假了,其实只是因为后面一次的数据高,于是拉了一条直线上去
    zvhdd 于 2009-6-28 20:34:22 回复
    有没有人看出最后两种图其实是一样的呢?
    pan 于 2009-7-19 22:31:33 回复
    我验证过了,对于一些高频词汇,它是一天记录一次。在trend的帮助里,它还提示了如果词汇火的不行,它会一个小时记录一次。insight是如何记录的,我就不得而知。还有一点,它们两个非常挑食,不具有一定的搜索量是不会理它们的。而且我曾经仔细研究过那两条直线,它的斜率其实并不是一样的,有细微的改变。按理说搜索量不会这么规则地递增递减。这个我也不知道
  • 2009/6/28 20:22:18   支持(13)反对(10) 回复
  • 16.lightson
  • 我希望给大家提供的是一个思路和方法,譬如,退一步讲,“儿子与情人”是本小说,那么,“儿子母亲不正当关系”也是本小说?这也是中国人喜欢或者经常搜索的词汇?!Google就是一机器,又怎么把这个“高频词组”记住了?
    williamlong 于 2009-6-28 21:11:34 回复
    中国人是最喜欢搜索色情词汇的了,那些黑帽SEO都是通过色情词汇来刷流量的。
  • 2009/6/28 20:34:16   支持(12)反对(9) 回复
  • 17.asiis
  • 一个伟大的技术猜想,比哥德巴赫猜想还要有技术还要伟大,我们以后可以称之为“月光猜想”
    windsaga 于 2009-6-29 14:07:49 回复
    我检查过, 用其他的词汇, 两边的反应的图表是一致的,我只发现了 "儿子母亲不正当关系" "儿子和情人" 两边的图表是不一致的。
  • 2009/6/28 21:41:44   支持(15)反对(12) 回复
  • 18.cppgohan
  • 还有发现了insights中区分了web search和image search,imagesearch“儿子与情人”的结果是一直上升的,两个结果叠加也许会与trends的结果吻合。
  • 2009/6/29 0:07:08   支持(19)反对(16) 回复
  • 20.mia90
  • 您好,我想问一下谷歌搜索指数怎么下载?网页只看到一张趋势图,如何读取每个月的具体搜索指数,如何转化为excel数据?谢谢!
  • 2013/9/2 11:52:37   支持(13)反对(10) 回复
  • 21.钱
  • 再看看现在的腾讯这些媒体,什么话都敢说,什么东西都敢瞎编乱造,如果军事信息他们能掌握,他们肯定也敢去瞎写,可惜的是他们拿到的新闻都是从人家美国人报纸上过来的,包括观点和态度。中 国 政 府不会透露机密军事信息的,这些媒体人们可能恨死了中国军政部门的人员为什么那么嘴严,因为他们嘴不严将来就是历史的罪人
    钱 于 2009-6-28 21:25:22 回复
    一个国家一个社会还有各种阶层的人,只能说道不同不相谋
    lightsoncn 于 2009-6-28 21:27:00 回复
    善意地提醒一句:这里是讨论技术的博客,不是滥发爱国情调的场所。
    这里的所有人的爱国情怀不会比你少,但恐怕比你更懂得怎么爱国+爱民。
    lightsoncn 于 2009-6-28 21:27:39 回复
    你如果讲爱国,那么倘若有一天上头为了“促进全体孩子健康”,每个孩子必须每天喝3鹿,ZF免费供应,阁下是不是也兴冲冲地赶紧去帮自己孩子领3鹿奶粉?
    Emanon 于 2009-6-28 21:27:51 回复
    同意。
    但是跟我们在讨论的有个毛关系?
    钱 于 2009-6-28 22:08:27 回复
    那我也可以以论证你是不是杂种为题写文章以显示我的技术并赚取流量喽?
  • 2009/6/28 21:22:56   支持(11)反对(9) 回复
  • 22.晕
  • 5毛来了,说明这个博客已经受到上面注意了。
    Emanon 于 2009-6-28 21:45:17 回复
    我倒觉得那个“钱”不是五毛。真正的五毛现在已经开始说什么轮子啊右粪之类的。这个起码还是讲一点道理的。
  • 2009/6/28 21:27:22   支持(14)反对(12) 回复
  • 23.D13
  • 支持月光,很多人就是只看×股,逼别人做排队游戏。

    很明显的Google Insight可能因为各种原因没能达到以天为单位的采样统计。在10号统计了一次,在17号才再次统计了一次,中间的数值缺失,所以以线性进行了图表补全,央视曝光后的不升反降也肯定如是,从图表上看采样的日期可能为3号,10号,17号,23号,23号之后到今天28号一直没有数据。还有,"儿子"本身也算不上什么高频词汇,看insights的话平常也就在6-8吧,"儿子与情人"则有3-4,这TM还用刷么?google当时也给你列出10个备选呢,不出现才有鬼呢。
  • 2009/6/28 22:04:04   支持(15)反对(13) 回复
  • 24.妖狐闪现
  • 挺专业的,没时间看完了.
  • 2009/6/28 23:17:55   支持(17)反对(15) 回复
  • 25.koko
  • “高也””wujie“等关键词被GOOGLE屏蔽。Google懦夫妥协了。
    pan 于 2009-7-19 23:06:42 回复
    你来中国玩网络公司,你就能做到不向政治低头么,我觉得谷歌已经仁至义尽了
  • 2009/6/29 0:52:47   支持(12)反对(10) 回复
  • 27.niu
  • 博主,您好!

    简单评价几点:!

    1. Google Trend 和 Google Insight对检索结果的阈值(门槛)不一样,有些词可能会有检索量,但没有达到一定的阈值(门槛)是不会出现检索结果的,个人感觉Trend的阈值(门槛)高一些,会过滤掉一些检索量,而Insight对数值更敏感一些;

    2. Google Insight的分析功能更强大一些,带有区域、时间等分析,而Google Trend只是一个粗糙的分析工具,更多的是一些流行元素的分析。

    3. 关于此次事件,对"儿子"分析没有意义,而是Google的“搜索建议”下面的比较变态的词汇是如何被作为建议出现的;

    4. Google在央视播出之后很快就已经关闭了“搜索建议”功能,所以“搜索建议”下面的那些比较变态的短语,一般人很难想到,搜索量肯定会下降,而不是是上升;

    5. 建议想好再说,是对受众的负责,也是对自己负责。

    工作愉快!
    williamlong 于 2009-6-29 10:40:59 回复
    1、没有证据证明Google Insight对检索结果有阈值,我看Google Trend 和 Google Insight使用完全相同的数据来源。
    2、功能多少不会影响基本数据的准确性。
    3、Google的搜索分词功能会将儿子分为一个词,因此其统计量也值得参考。
    4、关闭了“搜索建议”功能,但常规搜索并没有关闭,人们依旧可以直接搜索该关键词。
    niu 于 2009-6-29 11:20:28 回复
    您好!

    1. Google Trend 有阈值,您可以测试一些冷僻的关键词,如果不达到一定的量,Trend是不会给出结果的,这点我以前测试过; Google Insight 也是最近刚用,但肯定也有阈值,没有达到一定阈值的检索关键词会被忽略;

    2. 虽然基础数据一样,但各种参数不一样,而且功能也不一样,对数据的表现的形式也不一样;所以您不能说基础数据一样,最终对数据的分析结果的表现形式也一样;

    3. 不知道您是否用过一些商业数据库的分析功能,对数据库检索结果的分析非常重要,在这一点,Google Insight很好,比 Google Trend、百度Index、Yahoo 风向标等同类产品要强很多;
  • 2009/6/29 9:28:36   支持(14)反对(12) 回复
  • 28.问题
  • 再一次证明了,本身搜索频率低的关键词的相关建议关键词是很容易刷出来的。

    而且没有人相信cc -av 在做新闻的时候,就是脑子灵光一闪,而去搜索“儿子”的。之前肯定有过多次的尝试。这些尝试,有可能有意,有可能无意。
  • 2009/6/29 14:25:29   支持(14)反对(12) 回复
  • 29.酱油是来打我的
  • 这些和baidu比又算什么?26号我说查点有关世界禁毒日的中文信息,刚在百度打个[禁]字,就智能联想到[禁爱妈咪]、[禁室培欲]这些东西上去了|||~
  • 2009/6/29 18:51:30   支持(12)反对(10) 回复
  • 30.财富酒巴
  • 来学习了,学到了有用的知识
  • 2009/6/29 21:39:03   支持(13)反对(11) 回复
  • 32.钱
  • 这里已经成为五毛和反ZF组织聚集地了,月光博客我看还是不要开了吧,与我国提倡的和谐言论严重相悖
    不为五毛钱折腰 于 2009-6-30 8:17:42 回复
    五毛出来跳恐吓月光了,可是你也不想想,万一[水产]成CCAV那样还会有人自愿来吗?
  • 2009/6/30 0:45:04   支持(15)反对(13) 回复
  • 33.WordPress啦
  • 这些东西又能说明什么呢,如果Google是清白的
    就不会出现被曝光的事件,任何事不是偶然
    不为五毛钱折腰 于 2009-6-30 11:01:34 回复
    如果屈原是清白的,就不会投江。如果岳飞是清白的,就不会被在风波亭处决。如果于谦是清白的,就不会被车裂……任何事情都不是偶然的,连五毛也一样.
  • 2009/6/30 10:32:27   支持(13)反对(11) 回复
  • 35.四十二点亡灵
  • 我感觉月光和广大网友在同一战地打着两场不同的战争:
    月光:在警告我们要反驳ccav但是手段要光明磊落,月光并用技术“证明”有人有了这样的手段(其实这应该是个误会)
    网友:批判月光开始歪曲事实了(因为月光的分析确实存在问题),开始为大家都一直喜爱的月光,有些不便真像了。
    其实,大家的子弹一直就没交叉,在打着两场战争。
    钱 于 2009-6-28 21:53:02 回复
    很无奈。
    就好似很多“黑客”硬说自己的技术只是安全技术,不会去触及法律底线,谁信?
    pan 于 2009-7-19 22:51:09 回复
    我觉得月光讲的蛮好的
  • 2009/6/28 20:46:25   支持(12)反对(11) 回复
  • 36.firsdrea
  • 来源几乎都是北京的问题也还没解释

    现在已经有别的地区跟上了 当时可是北京一枝独秀

    不知道为何月光当时不去验证一下
  • 2009/6/28 21:38:47   支持(11)反对(10) 回复
  • 37.罪罪罪罪罪罪
  • 3、他们把劳伦斯的世界名著《儿子与情人》一词也同样当成黄色信息关键词,显示了那些人的无知和愚昧,如果中国大陆的GOV不由分说,就把这部一百年前在西方出版的公认的世界优秀名著《儿子与情人》当成黄色信息看待,那么等于是承认落后了西方国家一百年以上(而且还是自甘落后、封闭)。事实上从学术、言论自由的角度来看,相对于清政府和民国政府,我们的确没有多大进步,比如三·一八惨案那时,毕竟还是可以游行抗议的,鲁迅的《记念刘和珍君》等文章毕竟还是印刷发表出来了,追悼大会毕竟也开了。而现在呢?

    4、以打击黄色为名,而更多的却是在进行其他言论(比如关于政治的)上的封锁。实际上网上流传的不少“权威”的过滤词列表(比如VeryCD版eMule的、cctv网站上发现的、baidu贴吧使用的、绿坝软件破解出来的)显示,关于色情的过滤词并不多,绝对不会超过50%,主要还是关于政治的词汇
    Lightson 于 2009-6-29 8:54:32 回复
    支持一下
    据说色情词汇实际上只占绿坝词汇的15%,ZF的目的已经不言而喻了。
  • 2009/6/29 7:15:33   支持(15)反对(14) 回复
  • 38.goby
  • 虽说真理越辩越明

    但“ccav这件事”本身就没什么技术含量,换做“柯南”也只会是同一个答案。
  • 2009/6/29 15:57:17   支持(9)反对(8) 回复
  • 40.钱
  • 别的国家政府做监控就没啥可说的?美国监听民众电话、监听互联网络,为什么你们不去指责呢?
    中国 政 府的人难道傻到监听互联网去让民众都安装个傻X客户端一样的东西吗?你们也太有才了
    钱 于 2009-6-28 21:12:50 回复
    发挥你们的想像力继续联想下去吧,地球不会因为你们的联想而现在停止转动
    lightson 于 2009-6-28 21:15:30 回复
    呵呵,这次的事件充分证明了ZF的颟頇,而且是每一个环节都极其愚蠢,才能冒出这样的国际笑话来。当然,在陷害Google上,倒是配合得挺好。
    钱 于 2009-6-28 21:16:56 回复
    傻子永远不会说自己傻,疯子永远不会说自己疯
    lightsoncn 于 2009-6-28 21:20:13 回复
    那当然了,傻子和疯子都是打着“为后代考虑”的旗号出现的。
    Emanon 于 2009-6-28 21:20:34 回复
    美国还有GCD呢,干我×事?

    是不是你认为美国政府做的就一定是对的,他们做的我们也必须做?要不然你就是认为我们不达而兼济天下就是不公平继而是不正确的?什么狗×逻辑。
    lightsoncn 于 2009-6-28 21:21:47 回复
    倘若有一天上头为了“促进全体孩子健康”,每个孩子必须每天喝3鹿,ZF免费供应,阁下是不是也兴冲冲地赶紧去帮自己孩子领3鹿奶粉?
    pan 于 2009-7-19 23:10:49 回复
    美国曾经在911后颁布了一《爱国者法》,其中有两条涉及人身自由的网络审查许可遭到了民众的强烈质疑。
    你这样的言论越多想移民的人越多 于 2009-7-22 2:42:41 回复
    脑子能不好的这种地步该说什么好,你活在这里,你首先该关心谁的是非?自己先过好了,先树立个榜样,再帮助其他国家的人摆脱痛苦也不迟,否则你也太崇高了点吧?
  • 2009/6/28 21:11:25   支持(13)反对(13) 回复
  • 41.kdfj
  • 数据是一样,但表现出来的一个是相对数据,一个是绝对数据
  • 2009/6/28 22:24:51   支持(13)反对(13) 回复
  • 42.crazyfly
  • 央视曝光后,网友的验证大多是输入关键字,看联想出来什么词,这个应该不算搜索
  • 2009/7/1 10:47:17   支持(13)反对(13) 回复
  • 43.明月
  • 莫非Google对Google Insights有人工干预么?
  • 2009/6/28 19:39:06   支持(13)反对(14) 回复
  • 44.钱是命
  • 月光若真有本事,请尽快联系谷歌,也许谷歌可以用你的逻辑去起诉中 国 政 府,但前提是谷歌有胆量确保,自己在遵守中国法律的提前下被人阴了
    但是。。。这些数据是否能做“证据”呢?谷歌心里最有数
  • 2009/6/28 20:31:41   支持(12)反对(13) 回复
  • 45.钱
  • 谷歌Y O U T U B E有低 俗内容的时候,美国人自己可以指责谷歌,可以要求谷歌整改。哪中国屏 蔽之又有什么不对呢?但是国内某些自认思想自 由 民 主其实是脑子已经被人洗过的人,硬要说中 国Z F这不对那不是
    劝这些把美国人大 便也能当美餐享用的人省省吧,你们将来在历史上只是一小丑
    lightson 于 2009-6-28 20:48:13 回复
    美国的做法:我们来玩一个游戏,先定一个规则,以后大家照这个规则玩儿。违反了规则就受处罚,概不例外。
    中国的做法:我们来玩一个游戏,我就是老大,我定规则,我说什么,什么就是规则。只要我看你不顺眼,我就滤八你。
    lightson 于 2009-6-28 20:51:38 回复
    所以在中国这个大家庭里,ZF越“照顾”你,你越过不好。阁下不要起急,先想想你周围的事情是不是这样?
    Nemo 于 2009-6-29 11:04:18 回复
    说得好!赏你5毛。
  • 2009/6/28 20:44:32   支持(12)反对(13) 回复
  • 46.FORECE
  • 这里好热闹啊。。。。。。。。。我是来打酱油的
  • 2009/6/28 23:02:56   支持(14)反对(15) 回复
  • 48.Jacse
  • 我坚信是CCAV和XX部门合作搞的鬼。
  • 2009/6/29 10:29:02   支持(13)反对(14) 回复
  • 49.niu
  • 4. "儿子"的统计量不是问题关键,要害是那些“Google 搜索建议”的相关搜索建议是何时、何地、怎样出现的,这样更有助于了解事实真相;

    5. 虽然“Google搜索建议”已关闭,常规搜索仍然可以搜索这些词,但有多少人会用这些变态词汇作为关键词?这可以解释您的博文中一些您不能理解的数值趋势变化。
  • 2009/6/29 11:32:07   支持(13)反对(14) 回复
  • 51.存疑
  • 一般词语insights和trend显示结果的确相同,例如“翻墙”这个词,两者相同;而有些热门词显示的结果却大相竞庭,如“抢尸”这个词,两者相差很大,insights显示的结果只到达6月23号,而trend显示的结果到了6月26号,两者的峰值位置也不一样,insights显示的峰值到23号,trend显示的峰值在21号,而且在insights中显示也是一条上升的直线,城市显示也是北京,应该不是有人故意刷这个词吧?我估计google这两个产品都有些问题,怎么会出现这种结果,只有他们自己最清楚了。
  • 2009/6/30 0:23:24   支持(12)反对(13) 回复
  • 53.钱是命
  • 为了钱,月光会越走越远的,最后消失在我的视线里,可悲
  • 2009/6/28 20:27:23   支持(10)反对(12) 回复
  • 55.dilly
  • 错就错了,干嘛死不承认呢?

    数据源一样不代表展现结果一样,展现的都是对原始数据进行加工处理以后的结果。trends的数据明显没有insights敏感,对于低频词汇,trends一开始都没数据。insights记录了每一次搜索,是trends的升级版。
  • 2009/6/28 22:25:01   支持(9)反对(11) 回复
  • 56.钱是唯一的信仰
  • 其实这世道在慢慢的变,大家也不用急
    看看腾讯,八卦新闻充斥了腾讯的版面,一开始还只是娱乐圈的八卦,哪个明星跟哪个明星有一腿,哪个明星没人格,现在都开始在社会新闻、经济新闻、军事新闻等范围内八卦起来,新闻事实可以拿“据传”、“据说”这类的传言和谣言做内容吗?没有新闻就算了,为了流量和金钱效益,硬是要丧失应有的职业道德,看看那些为了生活的“狗仔”们,他们把自己的良心喂狗之后富了吗,没有,富的只有人家马化腾。
    悲哀而已
    EZnova.com很黄很暴力 于 2009-6-29 13:14:32 回复
    偌大的国家,连《新闻法》都没有。。。哎
  • 2009/6/28 20:06:33   支持(11)反对(14) 回复
  • 57.失望
  • 先不谈别的,月光至今也没有对上一篇的逻辑错误作出任何回应。。。比较令人失望。
  • 2009/6/28 23:00:27   支持(12)反对(15) 回复
  • 58.cppgohan
  • 还有“霍金死了”这个关键字,同样在trends中没有记录,我猜可能是因为搜索的总量不多,不过还是存在一个趋势,谁又知道呢
  • 2009/6/28 23:52:55   支持(10)反对(13) 回复
  • 59.karas
  • 月光,你还是没看懂为什么数值不一样
    因为两者量化的手法不一样,你觉得谷歌是白痴么?
    做一个统计搜索数量,然后再做一个一样的?并且当2个产品看待?
    NO,人家insights的根本就不是确切的搜索量。相当于一个搜索趋势并且取的是一定天数内的平均值。为什么18号后还不够多?因为,刷起来更厉害!
  • 2009/6/29 2:09:47   支持(11)反对(14) 回复
  • 60.farcorners
  • 拜托!兒子和情人,勞倫斯的名著!!受不了這幫人了…… 月光自己好像都不是很清楚。
  • 2009/6/29 10:43:19   支持(14)反对(17) 回复
  • 61.dilly
  • 构造了一个冷僻词组“儿子月光”,没有恶意不要误会,只是一时间能想到的最冷僻的词组,之前应该没有过搜索。用3台机器2个ip测了一下,现在google insights上已经有记录,而google trends上还啥都看不到。
    minami 于 2009-6-29 12:45:37 回复
    Good Job
    问题 于 2009-6-29 13:58:50 回复
    这基本能证明insights更容易被触发,
    windsaga 于 2009-6-29 14:04:25 回复
    google insights 实时性 和google trends 实时性可能不一样。 你明天再试试看。
    问题 于 2009-6-29 14:25:38 回复
    再一次证明了,本身搜索频率低的关键词的相关建议关键词是很容易刷出来的。

    而且没有人相信cc -av 在做新闻的时候,就是脑子灵光一闪,而去搜索“儿子”的。之前肯定有过多次的尝试。这些尝试,有可能有意,有可能无意。
    Jacse 于 2009-6-29 19:46:09 回复
    很好的测试,黑盒就是这样牛逼。
    sky 于 2009-7-2 19:20:39 回复
    儿子月光 我怎么搜索不出来?
  • 2009/6/29 12:31:05   支持(11)反对(14) 回复
  • 62.mini
  • google有没有暗箱操作
    不为五毛钱折腰 于 2009-6-30 11:02:43 回复
    ccav有没有明箱操作
  • 2009/6/30 10:55:52   支持(14)反对(17) 回复
  • 64.lightson
  • 好,就算以月光你所说
    以Google Trends的数据为准
    很显然,从Google Trends图上来看
    "儿子和情人"这从来就不是一个汉语里常用的高频词组

    ——那么,既然这不是一个高频词组,Google Suggest又怎么会把它记住并作为“儿子”的相关高频词组向用户建议呢?

    显然,还是有黑手。
    钱是唯一的信仰 于 2009-6-28 20:14:49 回复
    月光删除我的评论做什么,怕了吗,说到你的要处了?
    williamlong 于 2009-6-28 20:16:00 回复
    Google Suggest algorithms use a wide range of information to predict the queries users are most likely to want to see. For example, Google Suggest uses data about the overall popularity of various searches to help rank the refinements it offers. An example of this type of popularity information can be found in the Google Zeitgeist. Google Suggest does not base its suggestions on your personal search history。
    四十二点亡灵 于 2009-6-28 20:17:14 回复
    好像是少了两条评论,这确实叫人有些遐想
    钱是唯一的信仰 于 2009-6-28 20:17:23 回复
    说不过理了就删,以前的月光可能已经死了,最起码在我心中已经死了
    williamlong 于 2009-6-28 20:18:54 回复
    “儿子与情人”的搜索量不一定很小,我在07年截屏的那张图就有这个关键字,说不定是本小说来着。
    zvhdd 于 2009-6-28 20:24:12 回复
    儿子和情人好像是名著……
  • 2009/6/28 20:11:05   支持(9)反对(13) 回复
  • 65.劳伦斯作品
  • “儿子与情人”是正儿八经的文学作品,有色的内容但并不能算“低俗”
  • 2009/6/28 20:27:44   支持(11)反对(15) 回复
  • 66.Jacse
  • 《儿子与情人》 是劳伦斯的小说。还有《查特莱夫人的情人》等。
  • 2009/6/28 20:34:37   支持(11)反对(15) 回复
  • 67.lightson
  • 我刚才用google.com搜索了一下,用“儿子母亲不正当关系”基本搜索不到什么实质内容(CCAV新闻后冒出来的东西不算),所以排除了它作为一个高频搜索关键词的可能。
    lightson 于 2009-6-28 20:38:16 回复
    呵呵,原来我不是第一个这么测试的:
    http://www.yilubbs.com/HT/con_119_M.1246107282.A.htm
    Jacse 于 2009-6-28 20:42:49 回复
    很有道理,我就说嘛,怎么可能有人搜这么傻逼的关键长句
  • 2009/6/28 20:37:03   支持(9)反对(13) 回复
  • 68.罪罪罪罪罪罪
  • 或许CCTV和GOV并没有恶意刷关键词,但是,他们有没有恶意刷关键词不是非常重要的,CCTV和GOV本身就是在找“黄色”的借口来加罪于Google。CCTV和GOV的丑恶,就算不丑恶在恶意刷关键词上。也依然有大量证据揭示他们的丑恶和愚蠢,主要表现在:

    1、他们不分尺度,把与“性”擦点边的所有东西当成低俗、黄色的东西。关于“性”知识,不管是少年,还是成年人都是宜导不宜堵,这是一种正常的生理需要,你越堵,越不进行性教育,他们越无助、越压抑,加上对性的了解不够,甚至可能会导致心理变态和犯罪。那些性犯罪不是因为你堵了就减少了,而恰恰是因为你堵了才增多的;

    2、当互联网举报中心副主任在镜头前熟练地输入“boobs”搜索,然后指着Google从其他网站上收录的那些“黄色”图片,训斥Google的时候,我们深刻地体会到了“欲加之罪,何患无辞”是什么意思。Google完全是在公正地对待所有这些收录页面,权重算法也毫无疑问是所有搜索引擎中最权威的。某关键词出现在搜索建议中不是因为搜索的多,更是因为出现这个关键词的网页多。搜索“儿子”第一条建议是“儿子母亲不正当关系”,这不是Google有问题,更多的是说有大量的中文的网站在刊载关于“儿子母亲乱伦”的新闻或文章。就算有问题,也是这些网站一味迎合浏览者需求、吸引人的眼球,是有问题的。同时也看到“宜导不宜堵”的重要,压抑、饥渴者是非常渴望看到这样信息的。你没有告诉他们充分的性知识,没有避免他们的压抑,又一味地阻止他们浏览这些信息,那问题是非常严重的;
    phy 于 2009-6-29 9:37:02 回复
    http://d1.it168.com/attachments.php?aid=5174

    请注意该图中搜索提示右侧的结果数,参差不齐,说明Google的确是用搜索量来提示的。
  • 2009/6/29 7:15:09   支持(10)反对(14) 回复
  • 69.zaiping
  • 我觉得暂时不管关键词是否刷还是google在07年时本身就存在,不过这次ccav的行为更像是在×眼里检查有没有屎。
    月光也应该跳出这个怪圈来就事论事,作为搜索引擎自己本身是不产生内容的,它只是反映了客观存在的事物而已,就像一面镜子,脸脏了怎么能怪镜子呢?
    pan 于 2009-7-19 22:59:59 回复
    晕死,如果搜索引擎只是镜子的话,那样也有脏的镜子,干净的镜子;大的镜子,也有小的镜子。。。。
  • 2009/6/29 16:55:20   支持(11)反对(15) 回复
  • 71.flashjj
  • Google Insights和Google Trends的区别:

      Google官方解释,Google Insights和Google Trends使用相同的数据来源,Google Trends主要面向那些研究人员或广告商的那类需要更多更高级功能的用户。

    -------------------------------------------

    博主,你怎么可以把官方“解释”给倒过来解释啊?明明是insights更高级!
    williamlong 于 2009-6-29 8:34:47 回复
    笔误。
  • 2009/6/29 7:22:22   支持(10)反对(15) 回复
  • 72.变态的短语
  • 变态的短语中最滑稽的“儿子母亲不正当关系”,不正当关系,这个短语大家用过吗?用这个词搜索太不正当了
  • 2009/6/29 9:54:27   支持(16)反对(21) 回复
  • 73.不具名
  • to 四十二点亡灵 "济慈"已经变成高搜索量关键词了,但是“社会认知”依然有效,选择“Last 30 days”,观察3-10号,可以看到,3是起点,10是个转折点,3号和10号的数据点是来源于真实数据的,中间4-9的点,是通过3,和10推算出来的,所以3-10之间是一条直线,4-9在这条直线上。所以低搜索量关键词的转折点最少间隔7天才会出现,中间推算出来的数据,和真实数据相比,价值很低。
    “社会认知”可能很快会变成高搜索量关键词了,大家可以换用其他的冷僻词测试。
  • 2009/6/29 21:35:50   支持(10)反对(15) 回复
  • 74.vvvccc123
  • 一个是中文一个英文,会不会是时区不同造成
  • 2009/6/29 22:11:34   支持(10)反对(15) 回复
  • 75.pig
  • 这个垃圾ZF已经腐败到极点。
    Termlife 于 2010-3-10 15:11:23 回复
    Yeah!
  • 2009/6/29 23:55:30   支持(10)反对(15) 回复
  • 76.windsaga
  • 这里我做了一个测试。发现 google 的 Insights 系统中的数据应该是被动了手脚。
    http://docs.google.com/View?id=dcc47d3c_9fn22q9cz
    niu 于 2009-6-30 9:20:39 回复
    看了您的文档,疑问如下:

    1. 您的测试词汇“儿子和母亲发生性关系”并没有出现在6月17号央视的视频截图对“儿子”的搜索建议下拉列表中,您昨晚测试也反映在6月17号之前该词汇并没有出现异常增长,原因在于该词汇没有进入刷词列表,故不会出现异常,6月17号的异常跟新闻效应有关,这恰证明Google 没有修改数据;

    2. 建议拿6月17号央视截图的“儿子”的搜索建议下拉列表词汇进行测试,测试Google是否修改数据;

    3. 截图的“儿子”的搜索建议下拉列表词汇的Insight的图线以6月17号为中线左右对称,从6月10号增长至6月23号复位(正好两周);而您测试的“儿子和母亲发生性关系”的Insight图线是以6月18号左右对称暴涨,至6月20号复位(2天工夫);这恰证明某些数据是由非Google本身因素引起的异常。
    windsaga 于 2009-6-30 12:47:07 回复
    继续发现问题: 同样的Insights检索数据 临晨4:00的数据和
    现在12:48的数据已经发生质的改变了。
    在5个小时内。 修订增量的统计数,啥样的算法会导致图表线势的逆转呢?

    详细参见
    http://docs.google.com/View?id=dcc47d3c_9fn22q9cz




    windsaga 于 2009-6-30 16:50:39 回复
    至少系统有BUG。而且这些BUG被某些自已为是专家的人说的很高明,其实在混淆逻辑。
    在从今天临晨4点到上午9点,5个多小时内,我测试的Insight词汇图表结果发生了质变。原来18日的顶峰偏移到17日上了。
    google 是否有动机这么做,我想大家是否可以仔细想想。
  • 2009/6/30 4:06:23   支持(13)反对(18) 回复
  • 78.Loveyuki
  • 月光,谁跟你说数据源一样统计结果就一样?

    两个统计的基础单位不同,结果怎么可能一样?
    williamlong 于 2009-6-28 22:14:23 回复
    Google官方说的来源一样 http://www.google.com/support/insights/bin/answer.py?hl=en&answer=117683
    Loveyuki 于 2009-6-29 8:07:56 回复
    我跟你说了。数据来源一样又如何?

    统计的单位不同,有些数据是直接抛弃的不用的

    比如 18 号搜索了 100万次,那么17号的100次需要体现出来给人看么?

    Trends 使用的基础单位比 Insights 高。所以曲线底部不同,但是曲线的趋势相同,明白了吧?

    没见过你这么死板的。
  • 2009/6/28 22:09:15   支持(11)反对(18) 回复
  • 79.karas
  • 还有,我建议月光你不要搞不清到底是怎么回事之前就给我写文章质疑广大网民的观点,无论是多么向着party。
    误导类的文章不要写。
    pan 于 2009-7-19 23:02:38 回复
    看了你的观点我更晕了,难道广大网名的观点就一定是正确的么?我浏览了一下这里的文章,已经基本做到了讲技术,避开政治,我支持月光
  • 2009/6/29 2:11:59   支持(14)反对(21) 回复
  • 80.cure
  • 不错的文章知识性很强,学习了!
  • 2011/4/8 6:54:04   支持(7)反对(14) 回复
  • 81.dilly
  • 月光这个就太不厚道了啊
    "Google Insights和Google Trends的区别:
      Google官方解释,Google Insights和Google Trends使用相同的数据来源,Google Trends主要面向那些研究人员或广告商的那类需要更多更高级功能的用户。" google的原文是这么说的么?
    "How is Google Insights for Search different from Google Trends?
    While Google Insights for Search and Google Trends use the same data, Insights for Search is geared towards users (such as researchers or advertisers) who may find some of its advanced features more useful for their purposes."
    williamlong 于 2009-6-29 8:36:16 回复
    翻译的时候有一个笔误,现在已经修正。
  • 2009/6/29 1:13:38   支持(9)反对(17) 回复
  • 82.niu
  • 关于相关测试的方法:

    1. 输入网址: http://www.google.com/insights/search

    2. 登录Google账号 ;

    3. 输入变态词组"儿子母亲不正当关系", 检索日期设置为"最近90天"或"最近30天",区域选择"中国"

    4.你会看到关于该词汇的最近90天的相对变化趋势: 从4月1号到6月10号每天的相对检索量(相对6月17号相对检索量100)为1, 而从6月10号到6月17号的相对检索量线形增长,每天相对增长14,直至6月17号相对值100,而这7天的检索均来自北京(其它地区可能也有,但低于一定的阈值被忽略,目前地区分布信息已被污染,看不到了).
  • 2009/6/29 20:37:27   支持(9)反对(17) 回复
  • 83.芸珜
  • 有可能Google Insights对没有统计数据的词组使用了插值代替。而18日前,“儿子与母亲XX”这类词组没有统计过,18日之后又被禁止了,所以很可能只有18日一天的数据是真实值。
    另外,Google Insights有单独对北京地区的“儿子母亲不正当关系”的统计,统计结果应该没什么问题。http://www.google.com/insights/search/#q=%E5%84%BF%E5%AD%90%E6%AF%8D%E4%BA%B2%E4%B8%8D%E6%AD%A3%E5%BD%93%E5%85%B3%E7%B3%BB&geo=CN-11&date=today%201-m&cmpt=q
    williamlong 于 2009-7-2 18:02:00 回复
    对,这个insights“北京地区”的现实结果和trends一致。
  • 2009/6/30 23:16:03   支持(9)反对(18) 回复

发表评论:

 请勿发送垃圾信息、广告、推广信息或链接,这样的信息将会被直接删除。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 关注新浪微博:关注新浪微博
  • 关注腾讯微博:关注腾讯微博
  • 关注认证空间:关注QQ空间
  • 通过电子邮件订阅
  • 通过QQ邮件订阅

站内搜索

热文排行


月度排行

本站采用创作共用版权协议, 要求署名、非商业用途和相同方式共享. 转载本站内容必须也遵循“署名-非商业用途-相同方式共享”的创作共用协议.
This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License.