数据不说谎 大数据之下的世界pdf

2019年7月25日12:24:09 2 136
摘要

专业数据分析团队“城市数据团”全新力作,“团支书”结合社会热点,用大数据和数据挖掘分析数据背后的故事。趣味性强,语言幽默,知识丰富,教会读者用大数据做出正确的判断。

数据不说谎 大数据之下的世界 内容简介

这是一本让你“脑洞大开”的图书,让你尝试从大数据角度来解读这个世界,你会发现,有些问题,和你的直觉完全不一样。本书内容分为三部分:第一部分可概括为“脑洞大开”,以淘宝、旅游、餐馆取名等不同的角度切入,说明数据可以用于做许多有趣的事情。第二部分数据与工作,包括了做公务员、二三线城市的衰落、创业等若干热门话题。第三部分数据与生活,包括用数据帮助理解生活现象、用数据挖掘生活中的趣味、以及用数字看房市三个专题。

数据不说谎 大数据之下的世界 目录

第1章 数据,另一种视角 / / 0011.1数据之下的中国 / / 003

1.1.12015年,中国人是怎么花钱的 / / 003

1.1.2游遍全国,我们的假期够吗 / / 017

1.1.3淘宝改变了哪些城市 / / 025

1.2数据之下的城市 / / 35

1.2.1人口疏解,让城市更拥堵 / / 035

1.2.2在上海上班,地铁和开车哪个快 / / 048

1.2.3上海餐馆取名大法 / / 056

第2章 数据之于工作 / / 0672.1学习/就业指南 / / 069

2.1.1好好学习,是另一种童年 / / 069

2.1.2应该去哪里买书呢 / / 077

2.1.3月薪多少才配坐高铁 / / 086

2.1.4哪些公务员最辛苦 / / 095

2.1.5奔赴大城市,还是回家乡 / / 103

2.2在创业的风口上 / / 112

2.2.1一个估值10亿美元的养猪O2O项目 / / 112

2.2.2大鹏猪肉,为红烧而生 / / 121

2.2.3如何在上海开一家靠谱的餐馆 / / 130

2.2.4快捷连锁酒店选址的空间陷阱 / / 140

第3章 数据之于生活 / / 153
3.1理性生活: 那些你所不知道的事 / / 155

3.1.1你的消费水平给上海拖后腿了吗 / / 156

3.1.2如何面对注定平庸的人生 / / 165

3.1.3下雨天外卖会变多吗 / / 175

3.1.4“双12”规避“假折扣”指南 / / 183

3.1.5上海的水源安全吗 / / 189

3.1.6“控制人口”——开给上海的一剂毒药 / / 198

3.2感性生活: 八卦新玩法 / / 212

3.2.1高颜值的人都在哪儿 / / 212

3.2.2中国正在二次元化吗 / / 221

3.2.3如何像白富美一样生活 / / 232

3.2.4长三角城市那些不得不说的八卦 / / 242

3.2.5上海哪所高校的吃货最幸福 / / 249

3.3生活之重: 生为房奴 / / 259

3.3.1上海的房子都被谁买走了 / / 259

3.3.2上海购房攻略 / / 268

3.3.3遥不可及的学区梦 / / 278

3.3.4房地产泡沫有多大 / / 287

附录1:我们是怎么学会玩城市数据的? / / 297

附录2:城市数据团工作方法简介 / / 305

数据不说谎 大数据之下的世界 精彩文摘

第1章

数据,另一种视角你消费吗?旅游吗?上班吗?

你知道别人是怎么消费、怎么旅游、怎么上班的吗?

我们对于世界和城市的认知,往往来源于自己和身边其他人的生活经验。

所以,我们的认知往往是主观化和碎片化的。

但是,当我们拥有了“数据”这个工具的时候,我们就获得了重新认识世界的机会。

1.1数据之下的中国

本节内容主要涉及一个主题:如何脑洞大开地搜集和利用各种数据,以非常规的方式呈现出中国经济发展的三个截面。

数据之下的中国,是一个让你既熟悉又新鲜的中国。

1.1.12015年,中国人是怎么花钱的

在一波接一波的寒潮侵袭之后,期盼已久的春节假期终于到了。同事同学们纷纷放假回家,连亲爱的学姐也不在上海,只留我一个人凄冷地坐在工作台前,独自迎接假期前最难熬的几天。

一个人的时候,总是会想很多。

是的。回首即将逝去的羊年,我感慨万千。虽然不出意外地又(为什么要加一个又字呢)穷困潦倒地度过了漫长的一年,但幸运的是在这期间认识了不少天南海北的朋友。

因此,虽然还在孤独地加班,但我仍然心系着祖国人民,安静地准备完成春节前的最后一项数据工作:

数据不说谎:大数据之下的世界第1章数据,另一种视角0000年度全国消费数据总盘点。

好吧,问题来了——

Q1:2015年,全国人民到底花了多少钱?

2015年全球范围内可使用银联卡商户共3390万家,ATM共200万台,境外共发行银联卡5200万张。

根据刷卡交易统计,2015年全年,全国人民的刷卡交易总金额达到53.9万亿元。

53.9万亿元,是个什么概念呢?

我们可以想象一下:如果把这53.9万亿元全换成100元的人民币钞票,并将其一张一张紧挨着排列起来的话,这些钱大概可以绕地球赤道2100圈;从地球排到太阳的话,可以走一半多一点的路程。

假如这还想象不出来的话,我们可以换个角度来看:

根据国家统计局的数据,2015年,全国GDP总额约为67.7万亿元。也就是说,仅是刷卡消费,全国人民就刷掉了年度国内生产总值的79.6%。

亲爱的,你2015年创造了多少GDP?又刷掉了多少份额呢?

算好了吗?

好的话,我们不妨再来研究一下第二个问题,看看你的消费和全国总体水平相比如何呢?问题来了。

Q2:这53.9万亿元,都是怎么花掉的呢?

首先,让我们来看看这些钱是在什么时间内被花掉的呢?

我们统计了境内日均刷卡的交易金额,并将其细分到每一个小时。2015年日均逐小时交易曲线见图11,银联卡交易类型占比见图12。

图11日均逐小时交易曲线

图122015年银联卡交易类型占比

假如我们把2015年全年浓缩到一天来看的话,可以发现:14:00~15:00和8:00~9:00是全国人民刷卡的高峰时段,分别占全天交易总额的12%与8%。

亲爱的,你的卡是不是在这个时段内被刷爆的呢?

看完了交易时间,我们再来看一下交易的类型。我们将年度刷卡交易总金额分配到交易类型上,如下所述。

(1)从全国尺度上来看,最多的刷卡交易金额发生在批发行业,份额第一,大概可以购买16个阿里巴巴。

(2)份额第二的是金融行业,大概可以购买7个中国工商银行。

(3)份额第三的是零售行业(俗称买买买),大概可以购买5个沃尔玛。

也许你会觉得,这种全国宏观尺度上的消费特征,和个人没什么关系。那么,我们不妨从个人消费者的角度出发,看一下与市民生活关系最大的消费门类吧。

一般而言,各种消费类型中,与市民生活关系最大的应该是衣食住行金融教育六个大类。结果如何呢?

(1)排名第一:金融。毫无悬念。

(2)排名第二:住房。其交易总额大约是金融类的三分之一。

(3)排名第三:旅游。虽然交易总额排名第三,但也不过是住房类的零头而已。

(4)排名第四:衣(衣物类零售)。其总额大约是旅游的三分之一。

(5)排名第五:吃(餐饮)。交易总额与衣物类零售不相伯仲。

(6)排名最后:教育。其交易总额大约是餐饮的70%。没错,这个结果毫不意外、发人深省。

亲爱的,你的消费结构和全国人民相比,究竟怎样呢?

每个人的消费结构自然千奇百怪。

且不说个人,即使从省市的角度上去区分,也可以看到消费结构上的巨大差异。我们来看看:

Q3:全国各省的消费结构有什么样的偏好呢?

我们仍然将数据聚焦在衣物、餐饮、住房、旅游、金融和教育六个大类上。然后将各类消费金额占总消费金额的比例作为消费偏好的核心指标,分配到各省,可以得到以下结果。

(1)衣物类消费偏好前五名省市:云南、浙江、甘肃、山西、湖北。

想必云南四季如春,民族众多,姑娘们想怎么打扮就怎么打扮吧。见图13。

(2)餐饮类消费偏好前五名省市:海南、上海、西藏、宁夏、北京。

吃货集聚在上海、北京,这点毫不意外。但没想到海南、西藏、宁夏等边远地区的吃货能量同样惊人,见图14。

图13各省衣物类消费占比

图14各省餐饮类消费占比(3)住房类消费偏好前五名省市:海南、四川、贵州、北京、安徽。

非常出乎意料的,前三名竟然不是以高房价著称的北上广哦!看来虽然北上广的绝对房价居高不下,但从真实的消费结构上,海南和四川的房价水平也不容小觑。相比北京排名第四,而上海甚至都没有挤进前五,见图15。

图15各省住房类消费占比

(4)旅游类消费偏好前五名省市:西藏、海南、青海、新疆、云南。

从图16可以看到,西部的旅游消费偏好明显高于东部。而排名前五的省市,也都是以旅游胜地著称的地区。

图16各省旅游类消费占比

(5)金融类消费偏好前五名省市:福建、重庆、广东、湖南、上海。

从图17可以看到,我国东南地区在金融类消费偏好中可谓一枝独秀,福建省拔得头筹。排名前五的省市中,上海市已经是最北方的地区了。

图17各省金融类消费占比

(6)教育类消费偏好前五名省市:陕西、四川、北京、海南、湖南。

从图18可以看到,陕西省、四川省在教育类消费上的偏好明显高于全国其他地区。我在想,这些地方的孩子们是不是从幼儿园就开始上补习班了?

图18各省教育类消费占比

说明一下:本书消费数据中没有统计到中国台湾地区的数据,所以地图上台湾地区的颜色与其他省市不同。

看完各省的比较,我们不妨再来聚焦北上广深四个一线城市的情况。

00哪个城市最土豪呢?

从卡均消费金额的平均数来看,

深圳市人民卡均消费金额达到11.7万元,高居首位;广州市以7.6万元居第二位;而上海市以6.4万元的微弱优势战胜北京市的6.3万元,位居第三。

在感叹深圳市人民真土豪的同时,你是不是发现自己又拖后腿了?没关系,我们再来看看中位数,这次数字就变得和谐多了,见图19。

图192015年四大城市卡均消费金额(中位数)(单位:元)深圳市人民卡均消费的中位数金额达到20000元,仍然居首,北京市、上海市以15000元并列第二,而广州市则以11000元收尾。

顺便说一句题外话:从刷卡消费特征上看,四个城市的市民最爱的餐饮品牌也截然不同。

(1)北京市民最爱海底捞,热气腾腾的火锅既热闹又抵御寒气。

(2)上海市民则最爱王品,上海市民依然很小资,对牛排情有独钟。

(3)广州市民最爱百胜(肯德基、必胜客的老东家),原来除了当地特色美食,肯德基、必胜客等西式快餐同样也受市民欢迎。

(4)深圳市民则最爱春满园,经典粤式老牌餐厅还是深深地征服了深圳人民的胃口,让其他外来饮食逊色不少。

以上,我们盘点了全国刷卡总交易、各类型及各省市交易的特征。接下来,我们聚焦进入一个更核心的问题:

Q4:2015年,都是哪些人在花钱呢?

我们以上海为参照吧。

我们选出了常住城市在上海、一年中刷卡交易笔数在20笔以上的银行卡50万张,作为研究的样本。并按照性别、年龄将持卡人分为6组,统计其在零售方面的消费特征。

结论来了:

男性花钱多、老人花钱多。

首先,我们不区分消费类别,计算出各个分组的刷卡交易总金额,得到图110。

图1102015年交易金额的年龄性别分布

从交易总金额来看,各个分组之间的差异并不太明显,但仍然可以看到:

(1)消费最多的是老年男性,其次是中年男性和青年男性;

(2)而在女性组中消费能力最强的中年女性,其消费份额也没能超过男性组中份额最小的青年男性。

这不科学啊!难道女性的花钱能力还不如男性?

我们再计算出每个组别的人均(取中位数,下同)刷卡交易金额,见图111。

图111各组持卡人年均交易金额(单位:元)

没错,无论在哪个年龄组,男性的人均交易金额都比女性要高。

另外,可怕的是,随着年龄的增长,男性会花得越来越多!

图书网:数据不说谎 大数据之下的世界pdf

恭喜,此资源为免费资源,请先
声明:本站所有资源收集于互联网,只做学习和交流使用,版权归著作人和出版社所有,请在下载后24小时之内自觉删除,若作商业用途,请购买正版,由于未及时购买和付费发生的侵权行为,与本站无关。本站发布的内容若侵犯到您的权益,请联系站长删除,我们将及时处理!
  • 我的微信
  • 扫一扫加好友
  • weinxin
  • 微信公众号
  • 扫一扫关注
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:2   其中:访客  2   博主  0

    • 1982465187 1982465187 2

      数据不说谎 大数据之下的世界

      • …… …… 2

        好书