专著推荐 《数据之巅》:数据决策的时代
一、 作者与大数据
涂子沛,江西吉安人,1996年本科毕业于华中科技大学计算机系,毕业后进入了与专业毫不相关的国家公共机关工作,计10年左右,期间在中山大学攻读MBA(公共管理硕士),后辞去公职,考入美国卡内基梅隆大学攻读获信息科学硕士学位,那份意志与勇气非常人所能选择。毕业后,在美国从事IT行业的工作,之后以自己的专业背景加上扎实的人文功底,捕捉到了人类进入数据与信息时代的巨大浪潮,开始撰写相关专栏文章,并于2012年出版著作《大数据》,2014年出版《数据之巅》,在中国社会开大数据之先河,引发了大数据战略、数据治国和开放数据的讨论,历史学家许倬云先生盛赞其“为华文世界开创了一个重要话题”。下面是关于《数据之巅》的评语:
涂子沛先生开启了一道大门,我相信,后面会有更多的发展,让大家进入这一个重要的现代文化园地。 ——许倬云著名历史学家、美国匹兹堡大学历史系荣誉讲座教授
在《数据之巅》这本书中,涂先生跳到了哲学思考的层面,以统计学的社会应用为切入点,解构数据文化在美国政治、经济乃至军事发展上起到的关键作用,一环扣一环,构思精巧,故事生动,逻辑清晰,读起来实在“解渴”。感谢涂先生的智慧,为时代贡献了一部杰作!——郭为神州数码控股有限公司董事局主席
涂子沛先生的《数据之巅》通过追溯梳理美国的数据历史、展望人类的数据未来,给中国社会提出了一个数据时代的新命题——如何构建数据文化?本书引人入胜、发人深思,是不可不读的好书。——马蔚华招商银行前行长
数据本无大小,但运用数据的立场却分出大小,是谓大数据。数据表示的是过去,但表达的是未来,所以观察数据需要有历史观。涂子沛先生的这本新作《数据之巅》以大历史、大数据、大社会、大进步的格局,通过数据将遥远拉近,将悠久缩短,将巨大归聚,将过程简直。无论你从事何业或研究何题,都值得认真阅读这部巅峰之作。——朱小黄中信银行行长、中信集团监事长
大数据是互联网金融的基础支柱。互联网金融是云计算、大数据、社交网络这个移动互联大时代里的小时代。时代潮流,浩浩荡荡!涂子沛先生的大数据系列著作,带您观时代大潮!——肖风通联数据董事长、万向信托董事长
涂子沛先生《数据之巅》一书的历史高度和现实意义,超出了他的《大数据》。如果说他上部书开启了中国人对大数据的认识,此书则从历史的角度来说明,对数据的理解和掌握是人类文明进步的标志。中国人在“初数时代”是被动的、落后的,黄仁宇在他的名著《万历十五年》中也将中国明朝未能走向资本主义归结为中国人不能在“数目字上管理国家”。在新世纪的大数据时代,我们能否成为参与者甚至领导者?子沛这本书中有诸多可贵的思考和启示,我向读者推荐。——田溯宁中国宽带资本董事长
涂先生深思熟虑,用语殷殷,穿行在中美两国的历史中,努力发掘各个大数据改变观念,改造社会,改革制度的故事,无论人与事件,都是栩栩如生,发人深省。这本书让我们有目标有信心,也给我们创新的无限空间。——王巍中国金融博物馆理事长
大数据的江湖有两派,国家治理派和产业升级派。涂子沛先生无疑是国家治理派的宗师,这本书在美国200多年的政界商海、刀光剑影中勾勒出雄浑的数据思维、文化、价值观和方法论。临到尾处,我的期待愈来愈强。他的第一本书《大数据》在通篇的历史视角、西方视角后,煞费苦心附上一篇“挑战中国”的尾声,把人拉回当下、令人掩卷忧思;这次果不其然,子沛以整整一章的浓墨重彩,挑战了“智慧城市”这一兼具进行时和未来时的话题,而当涉及中国元素时,子沛的行文中出现了暖色调,那种欣赏和希冀让人宽慰之极、意犹未尽!期待《数据之巅》之后,山不穷,峰更高。——吴甘沙英特尔中国研究院院长
涂子沛先生已经成为中国大数据和数据分析领域最前沿的思想者和专家,如果您想了解大数据的历史、现实和未来,这本书将是您的必读书目。——托马斯·H·达文波特巴布森学院教授,麻省理工学院数字商务中心研究员
二、涂子沛:数据可以治国,还可以强国
一提到大数据,很多人的第一反应,是数据在商业领域中的作用,所津津乐道的,也是精准营销,即通过数据洞察用户的需要、扩大营销收入。我认为,数据的作用远不局限于此,数据不仅可以治国,还可以强国。
数据可以治国
数据治国,是指要凭借对数据的有效收集、处理和分析来治理国家,决定国家的大政方针和具体政策。
从定义看,数据是对客观世界进行量化和记录的结果。量化,是人类进行科学研究最根本的手段,就此而言,数据治国也可以理解为“用定量分析、实证研究的科学方法来治理国家”。此外,数据表示的是过去,表达的却是未来。数据之中蕴藏着社会发展的规律,“数据治国”的提法,也暗含着“人类可以更好的把握未来”之意。
回顾人类的历史,任何一个国家的治理,都需要参照数据,但由于信息技术的进步、记录手段的普及,物理世界的状态、个人的社会行为得到了前所未有的记录,这种记录的粒度越来越细、维度越来越多、频度越来越密,形成了“大数据”。今天的数据治国,含义远远超出了“参照数据”。
例如,当前国人关心的头号问题,莫过于空气质量。要解决好这个问题,从环境的监测、传感器的安装,到空气标准的设立、污染原因的分析,再到高污染、高能耗产业的转型、智能电网、智能电表的使用和普及,整个治理链条都贯穿了数据。又例如交通拥堵,如今很多城市,立交桥高达三四层、地铁线也在快速扩张,却赶不上车辆增加的速度,在资源增长空间有限的情况下,唯一的出路,是用好大数据,对城市的状态进行实时的分析和预测,不断优化现有资源的使用情况。还有当下智慧城市的建设,大数据的作用可谓重中之重。
无论是东方、西方,今天都有政府在不断尝试,试图把“凭借数据来治理社会”的模式推到极致。大概2000起,美国国防部高级项目研究所(DARPA)就在尝试建立一个超级数据库,把全社会每一个人的基本资料、信用卡交易信息、医疗保险记录、出入境记录、航空和酒店信息、电子邮件、电话记录、网络搜索记录等等数据都整合到一起,然后通过数据挖掘和监控,在大量的信息当中发现“信号”,实现有效的社会治理和管控。这个计划被称为“万维信息触角”,因为可能侵犯公民的隐私,在美国国会不断受阻,但美国国防部却屡次变换名目、暗中推动项目进展。最终因为后来大面积曝光,引发了震惊世界的“斯诺登事件”。
西边不亮东边亮。2002年,新加坡的国防部长在美国访问,他获知万维信息触角计划之后,大为赞赏。新加坡于是重金引进、聘请美国国防部的工作人员,在他们的帮助下,新加坡快速建立了一套万维信息触角,命名为“风险评估和全景扫瞄”(RAHS)。
RAHS最初的目的,是通过全社会的数据联通和挖掘,在错综复杂的社会现象中发现恐怖袭击、流行病疫情等突发事件的“信号”,达到未雨绸缪、有效治理的目的。这之后,因为行之有效,新加坡政府将系统不断扩大,推广到经济、文化、社会管理的种种领域。房屋管理局用它来了解人们对于住房体系的批评和期待、人口部门通过它掌握大众的生育态度变化、旅游部门用它来预测各地游客数量的周期、食品部门通过它决策是否应该减少对进口食品的依赖等等,从这个角度说,新加坡是数据治国的一个实验室,它不仅将大数据用于情报和反恐,还用于构建和谐社会。
在中国,特别要强调的是,数据治国不是“数字治国”。一些官员一谈起辖区人口面积、GDP增长幅度、项目投资多少、惠及领域若干、利税增加几何都有“数”在胸,还特别喜欢用“三项原则、五个重点、八项规定”等等数字范式对工作进行总结,各项工作的考核也都与数据挂钩,大有唯“数据”盛行之势,这不是不好,但这些都是孤立的、静态的数字,并不是“数据治国”的真义。大数据时代,数据治国更关注的是动态的数据、系统化的数据、以不间断“流”的形式存在的、成片的、活的数据,它们应该成为公共决策的资源为政府和社会广泛使用。归根结底,公共决策最重要的依据将是系统的、成片的、动态的数据流,而不是个人经验和长官意志,过去深入群众、实地考察的工作方法虽然仍然有效,但对社会治理而言,系统采集的数据、科学分析的结果更为重要。
数据还可以强国
数据还可以强国,这是因为,数据正在成为各行各业最重要的创新资源。
以农业为例,来自天气、土壤和农作物的数据,可以实现自动化的灌溉、防治虫灾、决定如何种植和收割,节省水利资源、提高单位产量;在教育领域,以大数据为基础的在线智能学习平台(MOOC),可以突破教室的限制,让成千上万的学生同时得到个性化的教学和辅导;再以医疗领域为例,IBM公司的Watson系统可以快速的检索几百万名患者的病例、最新的医疗研究报告和成果,做出更快、更准确的诊断;工业领域更不待言,汽车、飞机正在被大数据改造,成为无人驾驶汽车、无人驾驶飞机;还有金融领域,利用电商平台的交易数据,阿里小贷可以在几分钟之内判断企业的信用,为近百万小微企业发放贷款。今年初,阿里巴巴又推出了基于个体消费者的“芝麻信用”,用的创新资源还是数据。一百年前的美国,用了几十年的时间才建立全民信用体系。因为无处不在的充沛数据,今天中国的全民信用体系可能在更短的时间内、以更低的成本就可以建立起来。
毫不夸张的说,基于数据的创新将带动人类社会的各个领域都实现巨大的飞跃,这种飞跃是前人难以想象的。今天的年轻人面临的创新机会要远远多于前几代人,因为他们拥有人类有史以来最伟大的创新资源:数据。
和其它的创新资源相比,数据之所以伟大,是因为它不会被它所激发的思想和创新所消耗,它可以重复使用、同时被无数人使用,此数据和彼数据整合,还可以产生新的价值和效用,在空间的拓展中、在时间的延伸中,数据的能量将
但要成就数据的“伟大”,还有个前提,这就是数据的开放。对于“开放数据”,中国社会目前还存在不少误解。一是将开放等同于公开,其实开放和公开是两个完全不同的概念。公开是信息层面的,是一条一条的;开放是数据库资源层面的,是一片一片的。开放数据,指的是将原始的数据及其相关的元数据以可以下载的电子格式让第三方自由使用。开放也不一定代表免费,因为开放是有成本的,企业可以以收费的形式开放数据。开放也可以有层次、有范围,针对某个特定的组织和群体开放,不一定面对全体社会大众。
开放数据之于当下中国社会的意义,在于推动知识经济和网络经济的发展,在于促进中国经济由粗放向精细、从“制造”向“创造”的转型升级,在于释放社会生产力、催生创新。通过开放更多的数据,让创新的资源自由的流动,李克强总理提出的“大众创业、万众创新“才能更快、更好在中国大地成为燎原之势。
大众创新、创业的趋势,也可以在美国社会的发展过程中观察到。根据美国科学基金会(NSF)的数据,1981年,大公司(超过25000人)的研发投入占全美研发投入的70%,可谓主导了美国的创新;到2007年,大公司的研发投入仍然在上升,但格局却发生了改变,虽然绝对数量增长了4倍,其占全美研发投入的比例却下降到35%。同期,1000人以下小公司的研发投入增长了50倍,其占全美的比例从1981年的4%上升到2007年的24%。这些数据表明,研发和创新在呈现分散化、在向小公司和个人转移,其中最根本的原因,就是知识、信息,特别是数据资源的深度开放,不再受大公司、大组织的垄断,不再是精英阶层的专利。
文化靠沉淀,文明靠创新。创新,才是一个国家持续发展、不断迈向强大的真正动力。今天的中国,创新已经成为共识。就此而言,数据强国我们正在路上。
三、《数据之巅》目录
推荐序一进入一个重要的现代文化园地/许倬云 //XV
推荐序二一部精彩纷呈的时代杰作/郭为 //XIX
推荐序三大数据可以创造未来/王巍 //XXIII
第一部分小数据之历史
第一章初数时代:奠基共和
克服民主的劣势:用数据分权//004
制度创新:变对抗为合作的魔法棒//010
两党之争:无法精确分割的权力//013
亚拉巴马悖论:没有完美的方案//021
有数初成:共和政治反哺数据文化//027
中国往事:第一次现代意义上的人口普查//035
第二章内战时代:终结奴隶制的灯塔
人口普查:南方最大的敌人//040
用数据辩论:南北战争的序幕//046
用数据远征:向大海进军//053
政治计算:解放黑奴的真正原因//069
兵家和数据:中国历史上的吉光片羽//074
第三章爆发:镀金时代的三重崛起
用数据预测:转变思维方式//083
总统之死:专业化的悲情序曲//089
世纪巅峰:大数据驱动的创新//102
和政治分家:劳工统计的异军突起//110
姑娘、棉花和数据:究竟谁在推动历史//116
尘封的瑰宝:中国的数据可视化先驱//122
第四章量化:进步时代的数据大潮
用数据决策:水利工程中的数据竞争//138
冲击量化的极限:给生命定价//146
“平托”风波:福特公司的道德危机//151
用数据来审判:理性的必然选择//159
代理人需要监督:成本收益分析方法的未来//163
思考中国话题:民族复兴能否量化?//172
第五章抽样时代:统计革命的福祉
从选票到电影票:和《乱世佳人》共舞//178
用数据跨界:质量大师是怎样炼成的//188
旋转质量的飞轮:日本崛起//193
世纪之问:日本行,为什么我们不行?//203
第二部分大数据的崛起
第六章开放时代:内开放的历程
内开放1.0:数据承载知情权 //217
内开放2.0:用数据制衡 //219
悲剧现场的第一个问题:普查局的数据之痛//224
LEHD项目:开放数据的使用权//229
内开放3.0:用数据推动创新 //244
2012年:来自中国的组织创新//250
第七章大数据时代:通往计算型的智能社会
世上本没有数:正解大数据//255
改变世界的三股力量:大数据的成因//259
有数据,还要有计算:计算型社会的兴起//270
普适计算:即将到来的超级数据爆炸//278
数据和计算:第三次工业革命的CPU//280
数据之巅:通向智能型社会的挑战//288
第八章智慧城市:正在拍打世界的浪潮
西方和东方:聪明和智慧//303
目标锁定“城市平台”:神州数码对话录 //309
众包、众智和众创:让大众解决大众的问题//315
云、隐私和未来:中国和美国的不同挑战//325
结语把握后发优势:把科技符号变成文化符号//335
后记蝴蝶振翅 //341
附《大数据》目录
序言一大数据:为华文世界提出一个重要话题/许倬云
■ 序言二中国的雄心应该拓展到大数据领域/托马斯·H·达文波特
■ 序幕新总统的第一天
一人一票:把“黑”人送进“白”宫
大国新政:阳光是最好的防腐剂
■ 上篇帝国风云
■ 第一章历史争战《信息自由法》
第四股力量:知情权的起点
国会议员:孤独的战争
白宫当家人:一个妥协者和机动者
政府VS. 社会:旧剧情重现新时代
■ 第二章数据帝国的兴起
摩尔定律:全世界半个世纪的发展规律
最小数据集:上升到立法高度的开路先锋
民意几时有:选票催生的创新
普适计算:计算机本身将从人们的视线中消失
“大数据”战略:争夺全世界的下一个前沿
■ 第三章数据治国
循“数”管理:平安大道怎样铺
数据“验”平权:民权史上的碑石
数据“打”假:最大的争议就是福利滥用
CompStat :街头警察的创新传奇
■ 第四章商务智能的前世今生
起源:从数据到知识的挑战和跨越
结蛹:数据仓库之厚积薄发
蚕动:联机分析之惊艳
破茧:数据挖掘之智能生命的产生
化蝶:数据可视化的华丽上演
■ 中篇法则博弈
■ 第五章帝国的法则
收集法则:减负,为人民减负
使用法则:隐私,文明社会的共识
发布法则:免费,人民已经交税
管理法则:质量,互联网时代的根本
■ 第六章《数据质量法》的困局
产业界“俘虏”政府:数据背后的政经战争
美式“旋转门”:权、名、利大串场
“掺沙子”法案:国会对付总统的独门秘器
环保“风险门”:公共利益常常无人代表
集体行动的逻辑:人人都想“搭便车”
三权之歧:什么是真正的“和谐”
■ 第七章全国隐私风波
《一九八四》:零隐私的恐惧
大数据就是“老大哥”:中央数据银行之争
百年纠结:统一身份证
“9·11”大拐点:以反恐的名义向左转
万维信息触角计划:追踪恐怖分子的“数据脚印”
6 种改变政府的力量:山姆大叔大退让
■ 下篇公民故事
■ 第八章数据开放运动
一个新的世界:从软件开源到数据开放
总统的雄心:公共财政支出透明
数据民主:印裔首席信息官的崛起
Data.Gov:从旗舰初航到保“数”运动
大众创新:航班延误之候机经济学
■ 第九章试金石:白宫访客记录
总统在见谁:大医改中的“小”插曲
全体美国人的房子:白宫
步步妥协:总统与草根的对决
从白宫安保到政治监督:执著的公民改变世界
■ 第十章矿难中的歌声和数据
集体行动的号角:你站在哪一边
可以避免的悲剧:数据揭示的全景式真相
默认公开推定:和矿难赛跑的原则
唯一的道路:民主时时都要“争”
■ 外篇天下趋势
■ 视界一大趋势
数据权:大不列颠的硕果
大合流: 国际开放联盟
云计算:新的航向
再造互联网:从网页相连到数据相“联”
■ 视界二大挑战
逐鹿政坛:得数据者得天下
数据竞争:企业赢之道
下一波浪潮:从大数据到大社会
■ 尾声挑战中国:摘下“差不多先生”的文化标签
■ 大事记 20世纪大萧条后美国信息开放、技术创新之路
■ 译名表美国政府机构ABC
■ 后记搭建“大数据”的世界
更多阅读
动漫推荐《青之文学》青涩文学 青之文学
正因名作,历久弥新《青之文学》以漫画的形式描述着曾经给日本带来巨大影响力的历史名作,别有一番滋味!正因名作,无论处于什么样的时代也同样会给人们带来深刻的思考,正因于此,经久不衰!1、人间失格(丧失为人的资格)原著:大宰治作画:小畑健
《上帝之城》被上帝忽视的地方 上帝之城 西瓜影音
相关影评: 更多>> 我也看过这部电影 最初,听到这个名字的时候,我以为这是部像《天使之城》那样,很浪漫的一部影片,事实是,这是一部很真实的影片。位于巴西的里约热内卢,里约热内卢是一个很美的海边城市,拥有世界上最大的耶稣雕像,因此称只为
序邓小川诗集《微风如你》:穿过黑夜的火车序一 张德明
感谢张老师精彩的序和鼓励!序邓小川诗集《微风如你》:穿过黑夜的火车(序一)张德明迷醉于石椅上的梦境一阵断然的鸣笛划开寂静的夜空一列火车开进了黑夜猫舔舐流血的伤口秃鹫,断翅忍着巨痛奔跑,一列火车驶进了我们的睡眠梦里有
现实版《虐童疑云》:打破幼儿教育的恶性循环————————▲
总第720期2012-11-01现实版《虐童疑云》:打破幼儿教育的恶性循环导语:"老师好……"这是孩子们每天来到幼儿园的第一句话。幼儿园本该是儿童快乐学习与成长的地方,因为少数无良老师的所作所为,让孩子们幼小的心灵蒙上了阴影,更让家长
电影发狂 《公众之敌》:迈克尔·曼的走火影评)
迈克尔·曼执导的《公众之敌》全美票房收入了9,710万美元,全球票房高达2亿美元,成绩不俗。这部卡司超凡的枪战片有着约翰尼·德普、克里斯汀·贝尔和玛丽昂·歌迪亚这样的一线红星,但看完之后总觉得这部电影捂热了《盗火线》余温之余欠