一、 数据分析的步骤是什么?
数据分析的步骤一般分为以下 5 步:
第 1 步:明确问题
数据分析的目标,是为了解决生活或工作中遇到的问题。例如,你是某店铺的运营,想知道每个月店铺购买量最多的商品有哪些,以方便指定运营活动计划。运营活动结束后,你想评估这次活动的效果如何。这些问题都需要数据分析来解决。
而解决问题的第 1 步就是要明确问题,这可以为你后面的数据分析工作提供目标。没有经验的数据分析工作者,一开始没有明确清楚问题,就开始用分析工具操作,导致最后分析了半天却离目标越来越远。只有先定义清楚要研究的问题,才是数据分析开始的第一步。
例如,经过和业务部门沟通后,问题明确为:与上周数据对比发现,深圳地区的店铺销售额下降了 30%,原因是什么?其中,销售额 = 付费人数 X 客单价(这里的付费人数是指进入店铺产生购买行为的人数)。
加载中…
第 2 步:理解数据
理解数据,就好比在追一个女孩子之前,你需要做好理解她的爱好一样。知己知彼,才能百战百胜。
拿到数据以后,可以按下图的步骤来理解数据。
加载中…
1)弄清楚数据里每一列的含义。例如拿到一份 Excel 数据,要理解清楚每一列表示什么意思。不懂的地方,要和数据提供方沟通清楚。
2)对数据进行分类,有助于后期的分析。通常将数据分为 3 类:用户数据(我是谁)、行为数据(我做了什么)、产品数据(卖什么)。
用户数据:我是谁。用户数据是指用户的基本情况,包括姓名、性别、邮箱、年龄、家庭住址、教育水平、职业等。
行为数据:我做了什么。行为数据是记录用户做过什么的数据。例如知乎上,用户行为可以是用户在某个回答下的停留时间、浏览过哪些回答、购买了哪些产品等。行为数据主要包括用户做了哪些行为、发生行为的时间等。
产品数据:卖什么。一个平台里的东西都可以看作产品,例如知乎里的商品、优酷上的视频、公众号里的文章都可以看作产品。产品数据包括产品名称、产品类别、产品评论、库存等。
例如,拿到深圳地区的店铺销售 Excel 数据以后,和业务部门沟通清楚 Excel 里每一列的含义是什么,把数据分类。
第 3 步:数据清洗
数据清洗,也叫数据预处理。很多数据并不符合数据分析的标准,这时候就需要对数据进行「整容」,弄成我们希望的样子。例如,对深圳地区的店铺销售数据进行清洗,删除重复数据、对缺失值处理、对异常值处理等等。
第 4 步:数据分析
对上一步清洗后的数据进行分析,完成第 1 步里的分析目标。 如何展开分析呢?就要用到我们前面介绍的数据分析思维来展开。
例如,为了找到深圳地区的店铺销售额下降的原因,使用多维度拆解分析方法,将销售额按照指标定义(付费人数 X 客单价)拆解为付费人数、客单价两个维度。有可能是付费人数比上周下降导致这周销售额下降,也有可能是客单价比上周下降导致这周销售额下降。然后,使用假设检验、对比分析等分析方法进一步验证,知道找到问题的原因。
加载中…
第 5 步:数据可视化
百闻不如一见,把数据进行可视化是观察数据变化的最好方式。同时,与他人交流你的成果最好的展示方式也是图表。将得出的分析结果用图形的方式展示出来,最终形成数据分析报告。
加载中…
如果用做饭来比喻数据分析的步骤,就是:明确问题(做什么饭),理解数据(有哪些食材),数据清洗(洗菜和切菜),数据分析(炒菜),数据可视化(上菜)。
加载中…
例如,现在我要做一碗面(明确问题:做什么饭),先准备好葱姜蒜、挂面(理解数据:有哪些食材),然后把葱姜蒜切成小块(数据清洗:洗菜和切菜)。准备好这些以后,就可以把准备好的食材放到锅里炒一下,然后加上面(数据分析:炒菜),最后一碗热腾腾的面就放到了饭桌上(数据可视化:上菜)。
如果把数据分析胜任力模型里的内容对应到数据分析的步骤里,每个步骤需要哪些能力呢?
加载中…
首先,明确问题、理解数据需要和业务部门沟通清楚业务需求,理解问题里的指标,和熟悉某行业的业务流程,需要沟通能力、业务知识。
数据清洗需要用分析工具来操作,并且需要统计学来理解和知道分析结果数据代表什么含义。
数据分析需要用分析思维来指导如何展开分析。
数据可视化需要用到可视化工具,最终需要用 PPT 来完成数据分析报告,然后将分析报告汇报给你的领导和客户。
加载中…
二、什么是数据分析报告?
报告是指多一件事情的总结。在日常工作里,你需要用报告向领导汇报工作总结。在日常生活里,每年末的时候,我也会写一篇文章《一个普通人一年可以做哪些事情?》来总结自己每年做了哪些事情。相信你和我一样,也会收到各大平台会发的一个年度报告,以此来总结在这个平台上你一年做了什么。例如,下面是我在知乎的 2020 年度报告。
加载中…
数据分析报告,顾名思义就是数据分析+报告,也就是对完成的数据分析项目进入总结,然后形成报告。
一个数据分析项目,不能只是说结论,而是要把分析的来龙去脉说清楚,所以需要一份报告来让看你数据分析项目的人觉得你是有理有据。数据分析报告通常会制作成 Word、PPT,其中 PPT 方便演示给看报告的人。数据分析报告主要有 4 个作用。
加载中…
1.展示分析目标
报告以某一种形式将分析目标、分析目标、分析结果、建议组织在一起,这相当于一个数据分析项目的总结,以便看报告的人可以快速了解为什么去分析,这个分析项目的背景和目的是什么。
2.知道分析结论
看报告的人可以选择自己感兴趣的部分去看报告,往往他们最想知道分析结果,通过报告中的「分析结论」部分可以快速知道。
3.提供决策依据
数据分析报告的「建议部分」可以为决策者提供依据。
4.验证分析质量
一千个读者,就有一千个哈姆雷特。同样的,同一个数据,不同人的分析角度不同,往往得出的结论也会有差别。通过对报告中使用的分析方法、数据处理等的描述,可以检验数据分析的质量,结论是否可靠。
常用的几种数据分析报告有:行业分析报告、专题分析报告、日常数据通报、综合分析报告等。
1)行业分析报告
行业分析报告是对某一行业进行系统分析研究,一遍了解这一行业的发展状况。例如,在线教育行业研究报告、电商行业研究报告。
2)专题分析报告
专题分析报告是对某一问题进行专门分析研究,例如上海店铺销售下降分析报告,针对上海店铺销售下降这一问题进行专门分析研究。
3)日常数据通报
日常数据通报是某个时间范围内定期做的报表,用来来监督这段时间的数据变化。例如日报、周报、月报等。
4)综合分析报告
综合分析报告是对一个地区、公司或者部门业务进行全面评价。例如世界经济发展报告、深圳地区白领收入报告、某公司运营报告等。
三、如何制作一份数据分析报告?
加载中…
数据分析报告最常用的是「总-分-总」这样的金字塔结构,由开篇、正文和结尾三部分组成。这种结构可以让整个数据分析报告清晰。
1)开篇
数据分析报告的第 1 部分开篇部分用于介绍清楚分析背景、目的、分析思路,也就是为什么要开展此次分析?通过分析要解决什么问题?如何开展此次分析、主要通过哪几方面开展分析的?
如果把数据分析报告比喻成地图的话,把看报告的用户比喻成想从 A 点到 B 点的人,那么开篇部分就是这份地图上从 A 点 B 点的路线,让用户可以知道整体报告是做什么的。
2)正文
数据分析报告的第 2 部分正文是详细来论证第 1 部分中的分析目的,主要包括具体分析过程和结果。
3)结尾
数据分析报告的第 3 部分结尾,相当于一份报告的总结,包括分析结论、建议。
举个例子,市面上各类求职 App 很多,各个 App 用户人群有什么不同呢?经过分析以后,你把分析总结写成了《招聘类 APP 用户人群分析报告》,这份报告长的目录如下图这样。
加载中…
第一部分是开篇(分析背景与目的)
分析背景主要阐述为什么要开展此次分析?有何意义?这个数据分析报告案例里可以这样写:
各个招聘 App 在「金三银四」的招聘高峰期也迎来了用户爆发式增长。各个 App 的用户有什么不同呢?
分析目的主要写通过此次分析要解决什么问题?达到何种目的?
例如这个数据分析报告案例里可以这样写:期望通过对各个招聘 App 的用户分析,为找工作的你提供参考与指导。
这部分我们还要写出报告的分析思路,清晰地展示数据报告的分析结构,方便用户就自己所关心的部分重点阅读。分析思路是指通过哪几方面开展分析。例如这个数据分析报告案例里可以这样写:
1)通过用户数据量分析,知道哪些招聘 APP 户使用最多?
2)通过用户形象分析,知道使用招聘 APP 的都是些什么人?
3)通过用户地域分析,知道各家招聘 APP 用户都是哪些城市的人在使用?
4)通过工作地点分析,知道这些想找工作的人都在哪些地方工作?
第二部分正文围绕第一部分里的分析背景、分析目的、分析思路展开,最后在第三部分结尾(结论与建议)总结前面的分析。