月光博客 » 搜索引擎 » Google是如何搜集互联网信息

Google是如何搜集互联网信息

  如果你问别人什么是力量。培根会说“知识就是力量”,Google会说“信息就是力量”,某人会说“隐私就是力量”。毋庸置疑,Google早已认识到信息(数据)的力量。相信其他公司,不管是互联网公司,还是其他类型公司,多多少少都应该意识到这一点了。否则,哪里会出现贩卖用户资料的案件?

  本文主要说Google如何搜集互联网信息、不计其数的趋势信息和Google用户(包括你我)的信息。

  那Google到底知道多少你的信息呢?还有你的在线习惯呢?请你坐下来,登录你的Google账号,看看你正在使用的Google服务列表,你就知道你正把多少信息交给了Google。

Google是如何搜集互联网信息

登录Google账号后的“我的产品”

(注:此图中产品因人而异,只要你在登录Google账号时使用过某服务,则自动会添加到此列表中。)

  这些服务已经引起了很多隐私问题。09年末时,Google CEO埃里克·施密特曾说过:“如果你有些东西不想让别人知道,或许你本该就别做那事。”(这话听起来颇似有点“切莫伸手,伸手必被抓”的韵味。)

  那我们现在就来看看Google是怎么搜集从你那收集你的信息。

  Google信息收集渠道

  Google的使命是:“整合全球信息,让人人可用,人人受益”。它也正在很好地兑现这个诺言。然而,Google正在收集的信息似乎比我们意识到的还要多。

  1. 搜索(网页、图片、新闻和博客等)- 众所周知,Google是全球最受欢迎的搜索引擎,其全球市场占有率几近70%(比如,美国本土占66%)。Google追踪所有的搜索,其现在的搜索方式也越加个性化,个性化势必将越来越细化。

  2. 搜索结果中的点击 - Google不仅能知道我们要找什么,它也知道我们点击了哪些搜索结果。(编者注:这个做SEO的朋友应该很清楚,可以从Google Analytics中知道。)

  3. 网页检索 - Google的网页爬虫Googlebot就是一只不知疲倦的小蜜蜂,一直不停地“品读”和收录数十亿的网页。

  4. 网站分析 - Google Analytics是目前最受欢迎的网站分析工具。因其免费并支持多种高级特性,全球大量网站正使用它。

  5. 广告服务 - Adwords和Adsense是Google财务成功的基石,但它们也给Google提供了大量的有价值的数据。网民点击了那些广告,广告主在竞争哪些关键字,哪些关键字最值钱等等。这些信息都是非常有用的。

  6. 电子邮件 - Gmail是全球三大电子邮件服务之一,面临着来自微软的Hotmail还有雅虎的Email的竞争。邮件内容,包括发送内容和接收内容,都是可以解析和分析的。即使是从安全角度来看,这也是Google的一项优秀服务。Google的邮件安全服务——Postini,要从海量Gmail用户中,接收超大量的数据,包括垃圾信息、恶意软件和邮件安全趋势数据。(编者注:2007年,Google以六亿二千五百万美元的价格收购网络安全服务商Postini,以此为Google的小型商务客户提供更好的电子邮件安全服务。)

  7. Twitter - “你说有的Twitter消息都是我们的”,这句话用来解释早期的网络快速传播现象(又称“网络爆红现象”)。在09年和Twitter达成交易后,Google可以直接访问Twitter上所有的消息。

  8. Google应用服务(文档、电子表单和日历等) - Google的办公套件有很多用户,它当然也是Google的一个数据收集来源。

  9. Google公开的个人资料 - Google鼓励你把你的个人资料在网络上公开,这些资料包括你活跃在哪些社交网站(Facebook或Linkedin),你的个人主页和在线图片等等。

  10. Orkut - 虽然Google的社交网络还并不是很成功,但Orkut在巴西和印度还是有很多成功。(编者注:为什么还没有成功?可参见伯乐在线此文:《Google的社交网络为什么还没有成功》。)

  11. Google Public DNS - Google2009年年末推出的DNS服务并不只是帮助网民获得更快的DNS解析,也同时帮助Google自己。因为从这项服务中,Google可以获得大量的统计数据,比如网民访问了哪些网站。

  12. Chrome浏览器 - Chrome可以收集你的浏览器行为,还有访问哪些网站。

  13. Google财经 - 除了财经数据之外,用户在Google财经上搜索的信息和使用的信息都是Google的重要数据。

  14. YouTube - 这个目前是全球最大最受欢迎的视频网站,为Google所有。它也向Google提供了大量的用户观看习惯方面的数据。

  15. Google翻译 - 帮助Google完善其自然语言解析和翻译。

  16. Google Books - 虽然现在不是很庞大,但有潜力帮助Google知道网民阅读习惯和他们想阅读什么东西。

  17. Google阅读器 - 目前为止是全球最受欢迎的Feed阅读器。你订阅了哪些RSS种子?你在看哪些博文?Google会知道的。

  18. Feedburner - 很多博客都使用Feedburner来公开其RSS种子。Google追踪Feedburner的每一条链接。

  19. Google地图和 Google Earth - 你对哪些地方感兴趣?(Google也会知道的)

  20. 你的联系人网络 - 你在Gtalk和Gmail等上的联系,组成了一张错综复杂的用户网。如果他们都使用Google,网络映射更为深刻。虽然我们不知道Google是否做了这个,但这上面的数据是可以收集的。

  21. 即将推出的 - Chrome OS等Google更多可能成功的产品。

  22. 刚推出不久的 - 即时搜索和Goo.gl等服务

  23. 已经消亡的 - Google Wave等(虽然消亡了,应该死前收集了一些数据吧。)

  因为Google的产品数不胜数,上面的列表还会扩大。到现在为止,你应该已经知道要点了。

Google是如何搜集互联网信息

Google服务列表

  (Google收集的)这些数据中,很多都是匿名化的,所以并非总是正确。日志可以保存9个月,服务相关的cookies可以保留18个月。即便如此,对大多数公司而言,Google手中所拥有的通用用户数据仍是有很大竞争优势,是一座名副其实的金山。

  Google - 一台无法停止的数据收集机器

  Google数据收集的方式有很多种。登录站点时生成的IP地址请求,用来设定和追踪目标的cookie。如果你登录了Google账户,你在Google下属网站上的一举一动,通常都可以和你个人账户联系起来,而不用和你的计算机对应起来。

  简而言之,如果你使用Google的服务,Google将知道你在搜索什么,你访问了什么网站,你看了哪些新闻和博客,等等。随着Google增加更多的服务,其曝光率将更加广泛,几乎一切东西都将所谓的“Google化”。

  编者注:Googlization即“Google化”,2003年由ohn Batelle和Alex Salkever共同创造这个字。

  你使用任何单一的Google服务所贡献的数据,你无需对此过多恼火。当你使用多个Google服务是,真正有趣的窘境才出现了。这个年头,谁不是呢?

  可以试着一个星期上网不用Google的任何一个服务。这也就是说,没有YouTube、没有Gmail、没有Google文档、不点击Feedburner的链接、不用Google搜索引擎等等。严格来说,你甚至必须避开和Google有合作的服务,所以,非常抱歉,Twitter也不能用、(编者注:不管你用不用梯子,YouTube和Twitter都别用)

  这个不断增长中的Google化可能就是为什么有些人不想用Google Chrome OS的缘故。因为Chrome OS可以强有力地整合Google的多种服务,并且很可能向Google提供关于你习惯的空前绝后数量级数据。

  Google为什么这么做呢?

  就像在本文一开始所提到,信息就是力量!

  拥有这些信息,Google可以用非常有效的方式来整合数据。除了每个用户或访客,Google也能为整个城市或国家检测趋势和行为。

  Google收集的信息用途广泛。在Google所有活跃的领域,那些收集的数据可以用来制定市场决策、研究、完善产品等。

  比如,如果你能提前发现特定的市场趋势,你就可以对市场做出有效反应。如果你能发现人们所寻和所需,你就可以基于这些发现做出决策。当然了,这对像Google这样的大公司是极为有用的。

  而且我们也别忘了,Google的大部分收入来自广告。Google越了解你,其广告能更加有效地服务你,这也对Google的底线有着直接影响。

  不只是(谷)哥这么做

  必须要说的是,并非只有Google一家公司在做这样的数据收集。请放心,微软也在用Bing和Hotmail做相似的事,这只是一个例子。

  Google的问题(如果你想称之为“问题”)是,它像一只大章鱼,其触须正伸向各个角落。Google已变成如此混杂,囊括我们在线生活的方方面面,我们(网上的操作)动作、行为和关系等数量空前的信息都汇聚到Google手中。

Google是如何搜集互联网信息

Google是章鱼?

  造访Google数据库

  值得称道的是,Google正通过各种服务来利用其收集的数据,进一步为你提供服务。

  1、Google趋势

  2、Google网站趋势

  3、Google搜索解析

  4、Google广告计划

  5、其他诸如Wonder Wheel这样的搜索工具

  如果Google能公布如此之多的数据,可以想象一下数据量有多大,还有Google所知道的细节程度有多深。而且这些服务也能向Google提供更多的数据,比如我们对哪些趋势感兴趣,我们在找哪些网站等。

  在使用Google趋势等这些工具的时候,发现一个有趣的现象:我们几乎可以知道一切,但就是无法知道Google自身的产品。比如,“Goolge广告计划”和“Google网站趋势”并不显示Google自身站点的信息,但你可以找到其他站点的信息。

  这个比较有讽刺意味!昨天“Goolge广告计划”更新2010年9月份的“全球Top1000网站”数据,你可以看到Facebook等网站的每月独立访客数量和PV数量,但你看不到Google旗下网站的数据。

  没有免费的午餐

  不知你有没有想过,为什么几乎Google所有服务都是免费的?好了,你现在知道答案了吧。还是那就老话:天下没有免费的午餐。你或许是没有给Google掏钱(点击Google广告除外),但你已经付出信息了。虽然这并不一定是坏事,但你应该对此有所了解并加以注意。

  来源:伯乐在线投稿,原文链接

顶一下 ▲()   踩一下 ▼()

相关文章

  1. 1
    my   说道:
    才注意到这个问题呢。我晕了。
    支持(19反对(9回复
  1. 2
    邢台吧   说道:
    我的隐私啊!
    支持(21反对(12回复
  1. 3
    两小乱猜   说道:
    被Google收集我的信息,我放心。
    支持(16反对(8回复
  1. 4
    绿草   说道:
    因为中国有着5000年的文明,因此公司对中国市场有着5000年的耐心。”--谷歌CEO斯密特    --2010年初曾退出大陆市场的谷歌终究还算是回来了,对中国文化他们是否又了解更深了一层?
    支持(14反对(6回复
  1. 5
    AH64   说道:
    信息出现的概率越小,就越有价值,这是通信原理里面讲的
    支持(22反对(15回复
  1. 6
    月月   说道:
    GG我喜欢。。:-)
    Leu 于 2010-11-28 11:04:35 回复
    自诩骄傲?
    支持(22反对(16回复
  1. 7
    分楚   说道:
    是啊,想想自己的一举一动都在别人的掌握中式个是什么概念。
    支持(11反对(5回复
  1. 8
    happyxiao   说道:
    貌似我最近比较关注科技进步的信息.....
    支持(18反对(12回复
  1. 9
    ithinkin   说道:
    google 迷路过
    支持(14反对(9回复
  1. 10
    自我超越   说道:
    一如既往的支持Google。
    支持(14反对(9回复
  1. 11
    UFO   说道:
    Google无处不在 李小龙
    支持(14反对(10回复
  1. 12
    water   说道:
    同关注百度的,虽然我几乎不用百度
    支持(11反对(7回复
  1. 13
    哈哈哈哈火   说道:
    吧一切献给谷歌!
    支持(8反对(4回复
  1. 14
    TerranceSiu   说道:
    Google 的强大正是如此的给力
    支持(12反对(10回复
  1. 15
    广告   说道:
    恩,虽然来晚了,首页留下足迹还是可以的。
    支持(13反对(11回复
  1. 16
    Suitear   说道:
    ~~~~~~~~水,应该不会被删除~~~
    支持(8反对(6回复
  1. 17
    Newber   说道:
    在互联网上如果不去刻意保护的话
    你是没有隐私的
    支持(14反对(12回复
  1. 18
    db   说道:
    我都54个产品了!
    支持(13反对(12回复
  1. 19
    YCZone   说道:
    听说又有拆迁户遭到殴打,看来天朝是要把共同富裕里边没富起来的逐渐消灭最终实现“共同富裕”啊!
    支持(9反对(8回复
  1. 20
    邢台123   说道:
    怎么可以这样呢?
    支持(9反对(8回复
  1. 21
    Baby   说道:
    有一个错字,DNS被大成DNA了。
    支持(12反对(11回复
  1. 22
    hexieshe   说道:
    期盼google更多服务
    支持(10反对(9回复
  1. 23
    娃哈哈   说道:
    那不是章鱼,是飞天面神。
    支持(11反对(10回复
  1. 24
    刘永康   说道:
    难得这么靠前
    支持(10反对(10回复
  1. 25
    笑了   说道:
    被谷歌收集我倒挺放心的
    我担心的是我被360收集走的信息
    这点我真的不放心!
    支持(11反对(11回复
  1. 26
    Baby   说道:
    晕 挑别人的错字自己打错了一个....
    支持(10反对(10回复
  1. 27
    Xijun   说道:
    隐私个P,赶紧利用最方便快捷的方式把手头的事弄完赚到钱是正经,几十年以后2腿一蹬,什么隐私,数据的,爱咋咋

    千亿光年大的宇宙,我们连一粒尘埃都算不上,还整天把个人隐私挂在心上,P
    支持(7反对(7回复
  1. 28
    美丽新世界   说道:
    真强大,呵呵
    支持(21反对(21回复
  1. 29
    爱敏记   说道:
    不错,这个又大用
    支持(7反对(8回复
  1. 30
    Ryan   说道:
    我觉得除了网页搜索,最有价值的应该是谷歌的网站管理员信息吧,通过这个工具,可以把所有使用管理员工具的网站的访问情况一览无余,把用户浏览一个网页的所有习惯纪录在案,让谷歌专家进行分析。这是最重要的。
    支持(9反对(10回复
  1. 31
    John7young3   说道:
    我这边google ncr挂了,除了gmail还能收信,其它搜索 reader都连不上
    我是校园网 改了hosts的 之前u2b可以直连的 现在也一起挂掉了~
    支持(10反对(11回复
  1. 32
    匿名   说道:
    google真的好强大.......
    支持(11反对(12回复
  1. 33
    chromei   说道:
    想要得到更好的服务,只能心甘情愿被搜集。
    支持(6反对(8回复
  1. 34
    阅微BLOG   说道:
    又是伯乐在线的投稿啊……高产啊^
    支持(7反对(9回复
  1. 35
    powkiller   说道:
    你让我知道得更多了一些 ,, ,,谢谢 ,, ,,
    支持(7反对(9回复
  1. 36
    ying   说道:
    收集上网习惯这些对用户也没啥坏处,我就用google工具栏保存上网记录的,除非是收集家庭地址身份证号这些隐私那就不能容忍了
    谷歌能搜到的东西比百度多多了,当然收集信息肯定也多
    支持(10反对(12回复
  1. 37
    阿木   说道:
    强悍的Google
    支持(10反对(12回复
  1. 38
    5566   说道:
    SB的文章。。。。。。
    支持(12反对(14回复
  1. 39
    我来了   说道:
    我开始喜欢上用google了,哈哈……
    支持(11反对(13回复
  1. 40
    POLICE萌   说道:
    想表达什么?
    支持(8反对(11回复
  1. 41
    老丹   说道:
    章鱼??请作者Google“Flying Spaghetti Monster”。
    sen 于 2010-11-28 16:56:28 回复
    那個google logo被指為章魚⋯⋯汗。完全被曲解了。
    支持(8反对(11回复
  1. 42
    ILAGO   说道:
    这个么,没离开过GG
    支持(7反对(10回复
  1. 43
    阿里嘎嘎   说道:
    题目有语病。
    应该为
    Google是如何搜集互联网信息的

    Google如何搜集互联网信息
    支持(6反对(9回复
  1. 44
    Tuannet   说道:
    哈哈‘隐私就是力量’,支持google
    支持(10反对(13回复
  1. 45
    爱新奇   说道:
    信息就是力量呀
    支持(7反对(11回复
  1. 46
    园子   说道:
    如果你什么都不想暴露
    请不要上网
    远离网络。
    支持(7反对(11回复
  1. 47
    千与琥珀   说道:
    被谷歌搜走的信息还是比较放心的,毕竟美国不像中国,美国的隐私权可不是一句空话。说实话,没有一个公司(一项服务)不会收集你的个人信息(最直接的就是网站底部的统计),只要他能在法律的框架下运作与收集,并且能利用这些信息为我们提供更优秀的服务也是未尝不可的。
    kira 于 2010-12-17 20:15:34 回复
    越是发达国家越没有个人隐私可言
    只不过 相较于发展中国家而言
    他们的收集个人隐私的方式与渠道更为"人性化一些而以"
    不像发展中国家哪么相对粗暴
    像英美这样的国家ZF对其国内甚至国外公民的个人隐私掌握量岂是像中国这样的国家能比拟的
    从其多场战争和各个层面及阶层的外交博弈就便可见一般
    支持(13反对(19回复
  1. 48
    中华语录   说道:
    那既然GG是这样搜集信息的,那么我要提问了,那百度是怎么搜集的?
    支持(5反对(11回复
  1. 49
    zancart   说道:
    gooole多多少少比百度强一点吧..
    支持(12反对(18回复
  1. 50
    Xshagua   说道:
    正在看在图书馆借来的一本书《Google知道你多少秘密》,翻译本,其中有句很经典的:企业会最大限度保证股东的利益。所以现在逐渐使用其他的产品,平衡一下。
    yanhui 于 2010-11-28 12:47:50 回复
    平衡一下 挺好的思维 单一使用一家的产品肯定会被绑架 就像用微软的东西 好像在吸毒 戒不掉啊
    支持(8反对(17回复
  1. 51
    菜谱   说道:
    发发百度的!。
    支持(7反对(21回复

发表留言