Python Analysis 24
题目描述:
现有某店铺会员消费情况sales.csv。包含以下字段:
- user_id:会员编号;
- recency:最近一次消费距离当天的天数;
- frequency:一段时间内消费的次数;
- monetary:一段时间内消费的总金额。
请你对用户划分类型并统计各类型的用户的个数。
输入描述:
数据集可以从当前目录下sales.csv读取。
输出描述:
请你先对每个用户销售情况的每个特征进行评分,分值为1-4分。再将所有评分按照一定的权重相加得到RFM值后对用户划分为8种。输出各类型用户的个数。
评分规则如下: 对于recency特征,值越小越好。对于frequency和monetary值越大越好。如对于recency:
- 数值小于等于下四分位数则评为4分;
- 大于下四分位数并且小于等于中位数则评为3分;
- 大于中位数且小于等于上四分位数则评为2分;
- 大于上四分位数则评为1分。
对于frequency和monetary则方法刚好相反。
请你将按照recency、frequency、monetary的评分按照0.3、0.4、0.3的权重求和,得到新的列RFM,在按照评分结果将数据划分为8等分,得到每个用户对应的类型,类型依次为:潜在客户,一般发展客户,一般保持客户,一般价值客户,重要挽留客户,重要发展客户,重要保持客户,高价值客户。划分时按左开右闭方式进行划分(即不包含左边,包含右边,如潜在用户的范围为大于0小于等于所有数值的1/7的位置)。如用户NC0008的评分分别为1、1、2,则其评分RFM为10.3+10.4+2*0.3=1.3,
根据其在整体RFM中的分布情况,为潜在用户。
输出结果为计算完得分并划分类型后的数据的前5行及各类型客户的个数(中间用空格分隔)。
以上数据集的输出如下: