第1章 数据分析那些事儿 数据分析分类:

  • 描述性数据分析
  • 探索性数据分析:侧重于在数据之中发现新的特征
  • 验证性数据分析:侧重于验证已有假设的真伪证明

另一个角度看:描述性数据分析属于初级数据分析,常见方法有对比分析法、平均分析法、交叉分析法、分组分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等,工作中用到的就是这个;探索性数据分析和验证性数据分析属于高级数据分析,常见方法有相关分析、因子分析、回归分析、聚类分析法、判别分析法、主成分分析法、对应分析法、时间序列等

数据分析作用:

  • 现状分析
  • 原因分析
  • 预测分析

数据分析六步曲:

  1. 明确分析目的和思路: 明确分析目的后,梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从那几个角度进行分析,采用哪些分析指标,确保分析框架的体系化。

** 如何使分析框架体系化:** 以营销、管理等理论为指导,结合实际业务情况,搭建分析框架,确保数据分析维度的完整性,分析结果的有效性及正确性。

常见的营销方面里面模型有4P、用户使用行为、STP理论、SWOT等,常见管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等;

举例: 以PEST分析理论为指导,搭建的互联网行业分析框架 互联网行业分析: 政治: 国家出台了哪些相关政策?有何影响?制约还是侧进? 相关法律有哪些?有何影响? 经济: GDP及增长率、进出口总额及增长率 消费价格指数、失业率、居民可支配收入 社会: 在人口规模、性别比例、年龄结构、人口分布、生活方式、购买习惯、教育状况、城市、宗教信仰状况等方面,网民与全国人民有何区别? 技术: 技术的发明、传播、更新、商品化速度,技术发展趋势 国家重点支持项目,国家投入的研发费用,专利个数

  1. 数据收集 数据来源: 数据库 公开出版物:《中国统计年鉴》《中国社会统计年鉴》《中国人口统计年鉴》《世界经济年鉴》《世界发展报告》等统计年鉴或报告。 互联网 市场调查

  2. 数据处理 数据清晰 数据转化 数据提取 数据计算

  3. 数据分析 先确定合适的数据分析方法

数据分析与数据挖掘的关系? 数据挖掘是一种高级的数据分析方法,从大量的数据中挖掘出有用的信息,侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。

  1. 数据展现 一般常用表格和图形的方式来展现数据分析结果。常见数据图表有饼图、柱形图、条形图、折线图、散点图、雷达图等。 一般情况下,能用图就不用表,能用表就不用文字。

  2. 报告撰写 通过报告,把数据分析的起因、过程、结果及建议完整地呈现出来,供决策者参考。 一份好的数据报告应该有: 一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然; 需要有明确的结论; 一定要有建议或解决方案。

常用数据分析指标和术语

  1. 平均数 包括算法平均数、调和平均数和几何平均数

  2. 绝对数与相对数

  3. 百分比与百分点

  4. 频数与频率

  5. 比例与比率

  6. 倍数与番数

  7. 同比与环比 同比是指与历史同时期进行比较得到的数值,反映的是事务发展的相对情况,例如2010.12与2009.12相比; 环比是指与前一个统计期进行比较得到的数值,反映的是事务逐期发展的情况,例如2010.12与2010.11相比

111111111111111111111