2012年6月18日星期一

如何反制互联网精准广告定向

  介绍用户一方可以对精准广告定向进行的审查。这样有一个平衡:广告商是自由的,用户也是自由的,双方都能,且应该对它们手上的信息进行审查。那么,用户如何反制互联网精准广告定向?

  这篇投稿是补充牛国柱的《互联网精准广告定向技术》,在作者前一篇文章《是谁在偷窥我们的网络隐私》已简单介绍了广告统计的原理,《互联网精准广告定向技术》则给出了详细说明。

  放任追踪的后果:

  作者在某个社交网站用目前使用的邮箱注册了帐号a。有一天用老的email注册了账户b并登入,该社交网站第一个提醒我应该加的好友就是a。

  它其实知道b和a是同一个人。

  这就是社交图谱,更广泛地说,是用户(没有注意到而提供的)信息价值。

  再回到牛国柱的文章,这篇文章脉络很好,按照广告追踪所涉及的不同“门路”进行分类。

  本文也以同样的分类,来介绍根据“门路”不同,用户如何对它受到的追踪进行审查。

  1,Http Header之User-Agent

  有了UA,网站才能根据你希望的语言,版面(手机版?桌面版?)向你提供网页。它在广告上的用途无非是大致统计使用者的浏览器,操作系统,语言等元信息。

  UA只是一个明文字符串,浏览器通常都允许将其自定义。通过扩展程序,可以按照网站域名(或其它几乎任何条件)伪造不同的UA

  2,Cookie(包括flash cookie)

  在广告行业以外,Cookie也是必不可少的东西。它几乎是让服务器记住你的唯一方法:登录,记住你最后一次访问的页面(为什么优酷记得你上次把视频播放到哪里?),账户鉴权保密(支付宝怎么确保你是按照自己的意愿付款?)......都需要用到它。

  单纯地禁止cookie往往会造成灾难。

  所以审查cookie需要一些技能和工具:

  第一方/第三方:

  为了营销而进行的用户追踪功能通常是第三方(的域名)提供的,所以第三方cookie更可能用于追踪。但是对于一个特大号的服务/系统而言,第一方和第三方的区别就会模糊。

  用户信息和服务内容可能会分别存放在不同的域名下。

  如,在阻止所有第三方cookie时,可能会在登录hotmail/skydrive等微软live服务时出现困难。这种情况下,可以通过设定按照域名、第一方第三方、是否一旦退出浏览器时便抛弃等不同来区分黑/白名单,

  提供追踪与其它功能的代码来自同一个域名。这种情况下,审查就会变得困难,往往需要直接针对特定cookie进行处理。目前的网页设计都推崇内容和样式分离的异步模式,因此,执行不同任务的javascript通常也会分开,以.js文件的形式发放。这时可以通过阻止特定javascript代码文件的方法以进行来自用户的审查。

  Adobe公司和浏览器开发商进行了合作,以确保用户可以轻松地审查flash cookie;现代的浏览器可以审查flash(原生的点击播放功能,或通过扩展程序),以及flash cookie等(其它的plugin也是一样)

  3,定向技术

  a,所有通过UA的来源都是可以伪造的

  b,通过地域(ip地址)的定向难以伪造,只能通过使用代理服务器进行匿名化。

  c,回头客,频次定向是利用cookie的,因此第三方的回头客定向比较容易排除,但那些需要用户登录的站点,几乎不可能审查。因为明确标明了“你的”登录历史一定会出现在对方的服务器日志里。但基于网页异步执行的特点,通过审查javascript,还是有机会能减少被搜集的信息量。

  d,人群定向是难以审查的,因为这种定向主要来源于你的活动历史,以及你周围(同一类)用户的活动历史

  e,并发/时段/网页/关键词定向,这些内容往往是由服务器完成,除非用户能阻断用于提交信息的可执行代码(通常是javascript),否则不太可能审查它们。

  4,Do Not Track Header(不要追踪)

  DNT也是现代浏览器的一项功能。(唯一的例外是所有源自Chromium的浏览器,包括Google Chrome均不支持)

  如果你是twitter的用户,则可以放心地使用DNT功能,twitter已经宣布支持识别DNT。

  为什么?技术上,Do-Not-Track做了这些事情:

  当浏览器访问一个网站时,它在向目标网站发送的HTTP header中增加了一句“DNT: 1”

  所以是否将带有DNT header请求的用户做别的处理,完全是服务商单方面的事务。

  5,浏览器

  以上的方法通常都能用于桌面浏览器。移动终端上的浏览器,特别是应用(APP)中内置的统计是难以审查的。

  相对简单的方法是,在移动设备的host中,将用于追踪的服务器域名导向一个无效的Ip地址(如指代本地的127.0.0.1)。显然这么做,至少会丧失设备的保修。

  如果和广告过不去,记得把它的追踪部分也审查掉,虽然你不会马上感到差异,但这是广告的命根。

  来源:fcerebel投稿