介绍用户一方可以对精准广告定向进行的审查。这样有一个平衡:广告商是自由的,用户也是自由的,双方都能,且应该对它们手上的信息进行审查。那么,用户如何反制互联网精准广告定向?
这篇投稿是补充牛国柱的《互联网精准广告定向技术》,在作者前一篇文章《是谁在偷窥我们的网络隐私》已简单介绍了广告统计的原理,《互联网精准广告定向技术》则给出了详细说明。
放任追踪的后果:
作者在某个社交网站用目前使用的邮箱注册了帐号a。有一天用老的email注册了账户b并登入,该社交网站第一个提醒我应该加的好友就是a。
它其实知道b和a是同一个人。
这就是社交图谱,更广泛地说,是用户(没有注意到而提供的)信息价值。
再回到牛国柱的文章,这篇文章脉络很好,按照广告追踪所涉及的不同“门路”进行分类。
本文也以同样的分类,来介绍根据“门路”不同,用户如何对它受到的追踪进行审查。
1,Http Header之User-Agent
有了UA,网站才能根据你希望的语言,版面(手机版?桌面版?)向你提供网页。它在广告上的用途无非是大致统计使用者的浏览器,操作系统,语言等元信息。
UA只是一个明文字符串,浏览器通常都允许将其自定义。通过扩展程序,可以按照网站域名(或其它几乎任何条件)伪造不同的UA
2,Cookie(包括flash cookie)
在广告行业以外,Cookie也是必不可少的东西。它几乎是让服务器记住你的唯一方法:登录,记住你最后一次访问的页面(为什么优酷记得你上次把视频播放到哪里?),账户鉴权保密(支付宝怎么确保你是按照自己的意愿付款?)......都需要用到它。
单纯地禁止cookie往往会造成灾难。
所以审查cookie需要一些技能和工具:
第一方/第三方:
为了营销而进行的用户追踪功能通常是第三方(的域名)提供的,所以第三方cookie更可能用于追踪。但是对于一个特大号的服务/系统而言,第一方和第三方的区别就会模糊。
用户信息和服务内容可能会分别存放在不同的域名下。
如,在阻止所有第三方cookie时,可能会在登录hotmail/skydrive等微软live服务时出现困难。这种情况下,可以通过设定按照域名、第一方第三方、是否一旦退出浏览器时便抛弃等不同来区分黑/白名单,
提供追踪与其它功能的代码来自同一个域名。这种情况下,审查就会变得困难,往往需要直接针对特定cookie进行处理。目前的网页设计都推崇内容和样式分离的异步模式,因此,执行不同任务的javascript通常也会分开,以.js文件的形式发放。这时可以通过阻止特定javascript代码文件的方法以进行来自用户的审查。
Adobe公司和浏览器开发商进行了合作,以确保用户可以轻松地审查flash cookie;现代的浏览器可以审查flash(原生的点击播放功能,或通过扩展程序),以及flash cookie等(其它的plugin也是一样)
3,定向技术
a,所有通过UA的来源都是可以伪造的
b,通过地域(ip地址)的定向难以伪造,只能通过使用代理服务器进行匿名化。
c,回头客,频次定向是利用cookie的,因此第三方的回头客定向比较容易排除,但那些需要用户登录的站点,几乎不可能审查。因为明确标明了“你的”登录历史一定会出现在对方的服务器日志里。但基于网页异步执行的特点,通过审查javascript,还是有机会能减少被搜集的信息量。
d,人群定向是难以审查的,因为这种定向主要来源于你的活动历史,以及你周围(同一类)用户的活动历史
e,并发/时段/网页/关键词定向,这些内容往往是由服务器完成,除非用户能阻断用于提交信息的可执行代码(通常是javascript),否则不太可能审查它们。
4,Do Not Track Header(不要追踪)
DNT也是现代浏览器的一项功能。(唯一的例外是所有源自Chromium的浏览器,包括Google Chrome均不支持)
如果你是Twitter的用户,则可以放心地使用DNT功能,twitter已经宣布支持识别DNT。
为什么?技术上,Do-Not-Track做了这些事情:
当浏览器访问一个网站时,它在向目标网站发送的HTTP header中增加了一句“DNT: 1”
所以是否将带有DNT header请求的用户做别的处理,完全是服务商单方面的事务。
5,浏览器
以上的方法通常都能用于桌面浏览器。移动终端上的浏览器,特别是应用(APP)中内置的统计是难以审查的。
相对简单的方法是,在移动设备的host中,将用于追踪的服务器域名导向一个无效的Ip地址(如指代本地的127.0.0.1)。显然这么做,至少会丧失设备的保修。
如果和广告过不去,记得把它的追踪部分也审查掉,虽然你不会马上感到差异,但这是广告的命根。
来源:fcerebel投稿