1999年,一架波音767客机坠入美国马萨诸塞州楠塔基特岛附近的大西洋里,乘客和机组人员全部遇难。时间再放远一点1996—1999年间有多家航空公司的客机在楠塔基特岛附近海域坠毁,于是人们的联想模式自动开启,楠塔基特岛很象百慕大三角,借助于传媒的力量,人们对飞行,由其是在楠塔基特岛附近飞行产生了巨大的恐惧,仿佛那将注定是一场死亡之旅。 事情的真相究竟是怎样呢?如果我们只关注坠机,那么在视野中会出现四个巨大的黑点,将它们连起来就是整个失事的夜空;但假如我们在整个天空中不仅画下代表失事的黑点,还划下无数代表安全穿越楠塔基特岛的白点,整个夜空就完全是另一种景象,四个小小的黑点置身于白色的海洋之中,人们几乎找不到它们了。
![别开玩笑了 日剧 别让数据和你开玩笑](http://img.aihuau.com/images/a/06020206/020609440814910089.jpeg)
同样的一件事,用不同的统计方法、叙述语言来讲解,得到的是完全不同的结果,数据在不同的视角间切换展现的将是完全不同的世界。在《数据统治世界》一书中,纽约大学统计学教授冯启思将统计学原理应用于人们普遍聚焦的现实生活领域,用语言代替公式,用案例代替模型,深入浅出地阐述了数据在公共决策及个人生活领域所起到的至关重要的作用。 书中,作者分五个章节分别列举了利用“知觉管理”解决拥堵之害、相关与因果关系在实践中不同应用、分层与分类比较的公平性、假阳性与假阴性在统计杠杆中的两难选择,以及小概率事件对人们心智的影响等内容。每章通过人们耳熟能详的一正一反两个案例,讲述“数据”的双面性,例如在第一章中,同样的“知觉管理”模式,迪士尼乐园的游客手持FP卡并没有减少等待时间却感觉良好,高速公路“匝道控制”实际减少了车辆平均等待时间,但司机却感觉等待时间被延长了。在不同情境下,人们的感觉是有差异的,而且感觉不能被简单量化,在享有自由与被控制之间,是产生人们巨大心理差异的原因。 当然,在该书中,作者的目的并非讲述心理学,而是指引读者更多的关注数据在现实中的应用,更多的关注生活细节。 同时,作者也分析了各种数据同人们开的“玩笑”,鉴于现实生活不同于理论假设,面对涉及大范围、大规模样本的数据统计,其结果永远无法指向完美,而涉及到个体,甚至可能是倾覆式的黑色幽默。在假阴性与假阳性的论述中,读者会发现原来所谓的科学鉴定,仍然存在那么多风险因素,任何科学指标的划定都绝非百分之百的准确。在很多大型体育赛事赛前的兴奋剂检测中,要想避免误伤假阳性,就要在一定程度上容忍假阴性,而要想将假阴性一网打尽,就要令一部分假阳性蒙冤。 数据远没有我们看上去的那么单纯,一个平均值数据,如采用拿来主义拿来即用,那么它一定不会放过和你开玩笑的机会。鉴于数据分布的随机性,以及隐藏在数据表象下的复杂性,审慎利用数据,在利用之前,追踪数据的来源及可信度,因时因地分析数据的变异性及适用性,数据才会成为决策的朋友。理解数据无法涵盖一切变量,重视变异,允许偏差,应是各种数字化决策的常态。