数据分析中主要的分析方法

  • 聚类分析 (怎么判断用户属于哪一类)
  • 回归分析 (怎么跳出对目标有影响的变量)
  • 分类预测分析 (怎么跳出对目标有影响的变量)
  • 组间差异分析

与统计概念连接起来的重点

  • 聚类分析:数据之间的距离
  • 分类分析:各种分布下的假设检验、数据距离
  • 回归分析:正态分布

四个方法的内在联系

  • 聚类分析:我们的用户由哪些群体组成?这些群体有哪些明显的特征?
  • 回归分析:未来销售趋势是什么样的?我们的营销投入是如何营销销售额的?
  • 分类分析:如何筛选出最值得去营销的客户
  • 组间差异分析:不同客户群,营销渠道和方案的ROI有显著差异吗?

数据分析驱动业务的根本目标

  • 最小的营销投入产生最大的销售收入

聚类分析方法

1.聚类分析是什么

把相似的分析对象,根据各自特征分成不同的组别的统计方法

2.常见的聚类分析应用场景

  • 客户分群(segmentation)
  • 由此衍生出对客户的画像工作

客户分群的目的

目的是利用顾客特征属性将顾客总体分成若干顾客群组使得组内顾客特征相似,同时不同组的顾客之间的特征差异较为明显。

客户分群的数据维度

  • 消费行为习惯数据
  • 消费者对产品的态度
  • 消费者自身的人口统计学特征
  • 顾客们消费行为的度量如RFM(时长,频率,金额)等数据

客户管理和市场营销的从业者们的应用

基于顾客的个人,行为和交易等数据对顾客和市场进行分群
然后深入了解和认识各个顾客群体,指定更有效的顾客管理
策略和更具针对性的市场营销策略

基于聚类的客户分群的作用

能帮助我们更清楚的认识客户,类似于这里从左图到右图的差别

凭着经验和有限数据去理解客户—认识是模糊的
采用了聚类方法明确了区分不同客户的特征

有助于我们回答下面这些关键的问题:
如何能够为不同客群提供定制化的产品或者服务
如何设定品牌的主要形象和定位
如何根据顾客需求,挖掘新的产品和服务机会

某个旅游企业对用户数据的积累

实现对不同客户的差异化策略
制定针对性的旅游产品
目的:通过聚类分析实现客户分群
数据:自身数据及第三方公司合作

具体工作流程:
K-Means聚类

K-Means聚类

<mark>核心:</mark>

  • 将所有的观测之间划分到K个群体
  • 使得群体和群体之间的距离尽量大
  • 同时,群体内部的观测之间的“距离和”最小

<mark>是一种快速聚类法</mark>

  • 采用该方法得到的结果比较简单易懂
  • 对计算机的性能要求不高
  • 应用也比较广泛

具体的工作流程

分层聚类不需要事前确定要聚到多少类
后期根据业务核对数据的了解确定类的个数


计算数据之间的距离


距离越大相似度越低,距离越小相似度越高

聚类分析非常注重落地效果

注意点:

  • 聚类之后的用户分群是否有明显的特征?
  • 聚类之后用户分群是否有足够数量的用户?
  • 这些分群是否能够被触达?分群结果必须是可操作的,如果我们分群中出现了很多无法触达的客群,比如没有手机号,微信或者邮件等任何一一个联系方式,那么
    即便再有价值的分群,也是对企业来说没有可操作空间的