大数据时代的个人窘境——已向虚空付此身

6.14图片模板

徐翰

在过去的一周发生的诸多事件之中,6月3日曝出的PRISM事件称得上是全球性的大事,一位前CIA职员向美国媒体揭露了美国政府这一绝密的深度监听项目的存在。一方面,PRISM事件促使人们反思政府、私人企业和其他机构对公民个人隐私的所作所为,另一方面,你我这样的普通人难免自问:“它们会怎样用我的数据?”但我们往往连“它们”是谁都不知道。

我们绝大多数人都不会愿意随便交出自己的个人信息,能说的越少越好。即使是被要求披露的上市公司,也无不是在不同程度地打着擦边球,尽量少披露信息。对个人而言,如果只是为了识别个体本身,我们也许不需要交出太多数据,哈佛大学教授Latanya Sweeney在十几年前的研究就指出,只需要性别、生日和邮政编码就可以唯一地识别出87%的美国公民。

事实上,如今想要隐匿身份反而是不可能的。美国科技记者Gina Kolata今年发表文章指出,如今一个遗传学专家可以从1000个匿名的基因组计划的数据库、家谱网站和谷歌搜索的公开结果中识别出5个人及其家人。普林斯顿大学的Aarvind Narayanan认为如此丰富的公开数据,已经让锁定个人“在算法上成为可能”,换句话说,这个时代不存在完全的匿名。 MIT的研究人员则已经证明,即使您的手机位置数据是匿名的,但只要有关于手机位置4个不同的数据点,研究者依然可以锁定您本人的身份。

上市公司至少知道自己的披露是以上市、投融资等为目的,而大多数普通消费者并不知道自己交出的个人数据将被怎样地利用。

2012年产生的2.8ZB(差不多10.7亿块1TB的硬盘能装下)的数据中有3/4是像你我这样的个人产生的,例如用PC或者手机下载电影、文档、音乐、发送email等等;而任何形式的数据都可以被利用——从您手机的位置到您分享的音乐。这些数据被类似数据经纪商Acxiom这样的机构所搜集,并与互联网公司分享。我们当然不会忘记Facebook上市时宣称它掌握每个用户多达100MB信息的事情。
如果您已经觉得像被拍了裸体照片一样难受,那么有些企业的所作所为简直就是给您彻彻底底地照了张X光片。

一家明尼苏达州的企业Miinome已计划利用个人DNA数据进行营销,其三位创始人认为每年进行基因测序的人数正在以指数增加,尽管目前搜集、存储、分享和分析一个人的DNA数据的技术尚不完全成熟,但他们相信,未来完全可以基于一个人的DNA进行营销。到那一天,不是性格决定您的命运,而是基因决定您的广告!

还没结束。基于您的历史数据,研究者们还能部分预测您的未来,微软和罗切斯特大学的研究者就表示他们可以从GPS记录的307个人以及396辆车的数据预测一个人未来80周的大概位置。精度?80%!

我们也许交出了太多的个人数据而不自知,而这些数据在不远的将来也许会颇有价值,但很可能到那个时候,我们已经毫无数据所有权可言。PRISM事件的影响可能十分深远,至少科技巨头应该开始后悔炮制出“大数据”这个名词——现在,数据越大,消费者越坐立不安。

 

其它落款