新浪新闻

背锅侠小扎:Facebook的数据泄漏门

地球日报

关注
  来源:西雅图雷尼尔
  FB股价暴跌
  2018年的扎克伯格,可以说是流年不利。进中国99.99%是没戏了。又是前员工报出公司的问题,又是公司减少news feeds的比例。公司的股价一直在170~190之间波动。但是这周以来,公司的股票急速下跌,FB 深陷数据泄漏门
  Cambridge Analytica是谁?
  非常非常巧,我们在2016年大选结束之后从大数据的角度分析过为什么大选中民调基本上都预测错了的原因。
  原文在这里《大数据是否已死? 从2016美国大选看大数据》
  其中我们着重提到了Trump内部的数据分析团队,Cambridge Analytica。
  连线杂志和CBS 在Trump胜选后,采访了特朗普竞选团队的数据分析总监
  Matt Oczkowski。
  这是一家有着80位员工的英国公司,在华盛顿和纽约有分支机构的小公司。他们公司中有12名成员,专门分析挖据特朗普的民调数据。
  特朗普团队的民调数据来源于5000个样本。
  数据的来源非常广泛,历史投票数据,商业数据,竞选数据。(参加rally的情况,app下载的情况,集会参与情况)具体模型是这家公司的核心机密,肯定不会细说。
  在这次大选中,最后一个星期,当缺席投票,早投票,投票率数据出现后,特朗普的大数据分析团队,发现了几个趋势:
  然后根据这些数据更新他们原有模型的时候,发现特朗普在铁锈带(如俄亥俄州,密歇根州,爱荷华州,威斯康星州)胜出的概率飙升!
  最后几天,特朗普几乎就天天泡在那几个州,最多一天开4场集会来催票。
  结果就是几十年从来没有翻红的州,翻红了。
  然而作为川普大数据团队,他们现在还有有点没有想明白为啥投票率会是这个变化。他本人说,我只是个分析数据的。
  从现在的情况看, CambriageAnalytica肯定是说了谎的,用于训练模型的数据,远不止5000。他们获取训练样本数据的行为严重踩线了。
  踩线的数据样本
  用户画像技术
  这个做大数据的都知道,根据用户的使用习惯,消费习惯,可以给用户画像。能够比较准确地预测用户的行为,问题是如何采集大量的数据。
  所以有一群很聪明的研究人员在2014年就开始了通过Facebook收集用户数据信息。方法很简单,就是利用一个app,让他们授权app访问facebook的信息。
  2014年,英国剑桥大学心理测试学中心的研究人员正在进行一个项目,根据人们在Facebook上表现出的喜好,通过技术手段绘制个人的性格特征。研究人员付给受访者一笔小钱,让他们下载一款app,并参加个性测试,而该程序将会从受访者的个人资料和好友资料中收集隐私数据和信息。在当时,这种“学术测试”是被Facebook所允许的。研究人员称通过测试,他们能够比父母或者伴侣更了解这些受访者。
  剑桥分析看到了其中的商机与求之不得的数据,所以找到了剑桥心理测试学中心,但是剑桥心理测试中心拒绝了剑桥分析。但是剑桥分析利用同单个教授合作的方法,绕过了剑桥心理测试中心。他们与同在研究中心工作的教授:Aleksandr Kogan进行了合作。
  俄裔教授Aleksandr Kogan
  Kogan教授的身份很复杂,他是俄罗斯裔,又是美国人。即在圣彼得堡州立大学任助理教授,同时也在剑桥大学心理测试学中心工作。他既拿美国人钱,又拿俄罗斯人钱,研究Facebook用户的情绪变化。
  Kogan教授在与剑桥分析合作之后,快速的开发出了一款自己的App,名为“This is your digital life(你的数字生活)”,里面会对受访者进行人格测验,而这个APP还能同时获的大量的用户数据,诸如:他们喜欢什么、在哪儿居住等等。
  自2014年6月开始,Kogan教授就开始为剑桥分析收集Facebook用户的数据,而后者为他负担成本,根据公司邮件和财务数据显示,整个计划共耗资超过80万美元,项目结束后Kogan教授还可以保留数据副本,用于他自己的研究。
  在2014年,这项合作是符合当时的Facebook规定,平台政策允许应用程序可以读取个人的好友信息,但只能作为改善用户体验,不能转手出售,更不能用于广告营销或其他用途。这个其实很难界定,比如剑桥这种行为,在当时只是采集了数据,进行了用户画像。没有直接去营销,没有转售原始数据。而且即便对方用于营销,你很难有证据。所以之后不久,Facebook意识到了问题,Facebook就在2014年底停掉了类似的合作项目。但是很多公司已经抓去了大量的用户数据。
  Kogan们的方法是非常有效和廉价的,剑桥分析通过Kogan之手获得了,5000万份!其中3000万份收到了足够详细的信息,让他们足以将用户与其他数据源进行匹配,并且完成用户画像的的建立。
  泄露的邮件,里面透露了用户画像,采集的信息维度。
  这个事情当中FB是比较无辜的,FB作为平台已经做了该做的事情。而且即便今后FB对于这类问题的处理也会存在一个两难。
  俄案,FB数据泄露案的背后
  所有的这一切,都要回到2016年的大选。本质上都是民主党和共和党建制派直到今天也无法接受特朗普集团的当选的事实。
  当重大挫折之后,心理学上对悲伤一般有这几个阶段的划分:
  ①否认(失落) DENIAL
  ② 愤怒 ANGER
  ③ 协商(迷茫) BARGAINING
  ④ 绝望(消极) DEPRESSION
  ⑤接受 ACCEPTANCE
  当2016年美国大选结束之后,整个美国的左翼,精英阶层基本上还停留在前面两个阶段:拒绝和愤怒。
  最典型的表现,比如说 Not My President 运动
  美国民主选举中少有的拒绝
  很多人直到今年依然不明白,为什么特朗普会赢? 按照他们的模型,数据,调查,特朗普是不可能赢的。
  但是最后特朗普赢了,那肯定是对方耍了花招。比如说,肯定是邪恶帝国俄罗斯人捣鬼了-所以通俄门,就出来了。通俄们到现在都没有任何solid的证据,证明特朗普的获胜和俄罗斯之间有什么必然关系。所以特朗普愤怒地呼喊,通俄们是21世纪的witch hunting!
  据我的了解,俄罗斯确实有可能在FB,Twitter上搞搞小动作,发发假新闻,但是可以说这些事情对于大选的影响微乎其微。但是要说特朗普需要和俄罗斯联合要赢取2016大选几乎是不可能的事情。
  通俄门轰轰烈烈搞了一年多,到现在为止,没有任何结果。
  所以当通俄门走下去是条死路的情况下,第二个大新闻爆出来了,FB数据泄漏门。事情很简单,本质就是利用用户信息,进行用户画像,然后针对性投放广告。利用这种办法,能够大大提高资金利用效率和广告效果。
  具体操作中里面有几个问题
  这个一直以来比较模糊,关键是谁干的。这也解释了为什么FB后续追责响应比较慢。
  如果是奥巴马干的,那就是创新,如果是特朗普旗下团队干的,那就是违规。
  奥巴马用就是创新
  特朗普团队用就是丑闻
  而且剑桥分析团队,以及剑桥Kogan团队收集数据的违规行为远远发生在特朗普宣布竞选之前。更不要说Facebook的用户往往不是特朗普的铁杆支持者。
  是谁把Trump送进了白宫?
  2016年如果说是大选,其实更是一场草根的非典型革命,只是最后借了共和党的壳子而已。
  特朗普的基本盘,主要是全球化利益受损的人,传统老工业区的产业工人。也就是希拉里所说的the deplorable。
  悲惨世界的变形,Les Deplorables
  特朗普的铁杆支持者
  特朗普特色的rally,一天飞2~3个地方,场场几万人规模的rally这个才是基本盘
  如果你看不到这些事实,你就无法理解特朗普为什么会当选。
  无论是传统民主党和传统的共和党想要翻身,首先要看到这个矛盾。如果连问题都看不到,如何才能解决问题?
  小结
  不同人眼里有不同的美国,现实中的美国前所未有的分裂。都已经2018了,还是有无数人在否认现实。
  特朗普被他们所看不起的红脖子们抬进了白宫。你可以说他是民粹,可以鄙视他大嘴巴。但是必须要承认,他现在就是美国的总统,2016年大选已经过去快两年了。美国现在有一大堆的问题需要解决,基础设施的问题,凝聚力的问题,安全的问题,教育的问题,无数的问题,堆积如山的问题要解决。为了对抗而对抗,为了反对而反对,是没有出路的。
  小扎只是背锅的,党争是绝对没有出路的。
  长按二维码关注我们。坚持篇篇原创。
  转发就是最大的支持!
  本文作者系新浪国际旗下“地球日报”自媒体联盟成员,授权稿件,转载需获原作者许可。文章言论不代表新浪观点。
加载中...