数据分析知识总结

数据分析整体流程

明确问题:先把问题定义清除

搭建框架:再把问题考虑全面,找到主线

数据提取:MySQL、Hive为主

数据处理:Excel、R、Python为主

数据分析:数据分析方法论为主

数据展现:Tableau、Excel、R、Python

撰写报告:考验文笔功底,整体逻辑性

报告演讲:沟通能力、表达能力、被提问能力

报告闭环:最难也是最大价值体现

流量波动模型

  • 常识判断(是否是重要的节假日)
  • 竞品数据(同行数据是否有变化)
  • 外部事件(社会负面新闻对品牌有影响)
  • 产品变化(产品发布新版本、功能有缺陷)
  • 用户行为(订单区域分布是否有变化)
  • 数据问题(数据采集口径是否有变化)

数据分析模型

AARRR模型

AARRR是一个用于研究用户增长的数据分析模型,是Acquisition、Activation、Retention、Revenue、Refer,这个五个单词的缩写,分别对应用户生命周期中的用户获取、用户激活、用户留存、获得收益、推荐传播这5个重要环节。

PEST模型

PEST分析是指宏观环境的分析,宏观环境又称一般环境,是指一切影响行业和企业的宏观因素。对宏观环境因素作分析,不同行业和企业根据自身特点和经营需要,分析的具体内容会有差异,但一般都应对政治(Political)、经济(Economic)、社会(Social)和技术(Technological)这四大类影响企业的主要外部环境因素进行分析。

RFM模型

RFM 分析就是通过三个关键指标对客户进行观察和分类,判断每类细分用户的价值。针对不同的特征的客户进行相应的营销策略。客户数据库中有3个神奇的要素,这3个要素构成了数据分析最好的指标:最近一次消费 (Recency)、消费频率 (Frequency)、消费金额 (Monetary)。

  • 最近一次消费时间 (Recency):客户距离最近的一次采购时间的间隔。
  • 最近一段时间内消费频次 (Frequency):指客户在限定的期间内所购买的次数。
  • 最近一段时间内消费金额 (Monetary):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。

SWOT模型

(strengths)是优势、W (weaknesses)是劣势、O (opportunities)是机会、T (threats)是威胁。按照企业竞争战略的完整概念,战略应是一个企业“能够做的”(即组织的强项和弱项)和“可能做的”(即环境的机会和威胁)之间的有机组合。

5W2H模型

对选定的项目、工序或操作,都要从原因(何因Why)、对象(何事What)、地点(何地Where)、时间(何时When)、人员(何人Who)、方法(何法How)等多个方面提出问题进行思考。

  • What:是什么?明确具体做什么?
  • Who:谁来做?关键人物是谁?
  • When: 何时完成?什么时机最适宜?时间节点是?
  • Where: 在哪里做?从哪里入手?
  • Why: 为什么做?有没有替代方案?
  • How: 怎么做?怎么样?如何实施?如何提高效率?
  • How much: 做到什么程度?要花多少钱?

ABC分析(帕累托)

ABC 分类法全称应为 ABC 分类库存控制法。又称帕累托分析法或巴雷托分析法、柏拉图分析、主次因分析法 、ABC分析法、ABC 管理法,平常也称之为「80 对 20」规则。
在ABC分析法的分析图中,有两个纵坐标,一个横坐标,几个长方形,一条曲线,左边纵坐标表示频数,右边纵坐标表示频率,以百分数表示。横坐标表示影响质量的各项因素,按影响大小从左向右排列,曲线表示各种影响因素大小的累计百分数。一般地,是将曲线的累计频率分为三级,与之相对应的因素分为三类:

  • A类因素,发生累计频率为0%~80%,是主要影响因素。
  • B类因素,发生累计频率为80%~90%,是次要影响因素。
  • C类因素,发生累计频率为90%~100%,是一般影响因素。

KANO模型

KANO模型是对用户需求分类和优先排序的有用工具,以分析用户需求对用户满意的影响为基础,体现了产品性能和用户满意之间的非线性关系。按照卡诺模型,会将需求分解为基本需求,期望需求,以及兴奋需求,无差异需求,和反期望需求五个部分。