3行代码搞定

一、题意解读和解题步骤

1、题意理解

题目:统计连续2天及以上在该店铺购物的用户及其对应的次数
这题的难点在于如何判断连续。
做过之前如果忘了可以点击这里:真题SQL12连续签到 基本上就会做这道题了。

判断连续日期的方法:
1、对日期去重后进行排序(或者直接用dense_rank进行排序);
2、日期减去排序对应序号的天数如果是一个相同的值,则说明这些日期就是连续的。
3、对连续的日期再次排序就得到了最大的连续数列。

2、解题步骤

解题思路:首先对日期进行排序,其次判断连续日期,并查询统计连续天数>=2的用户即可。
1)对日期进行排序
SELECT DISTINCT sales_date,user_id,DENSE_RANK()OVER(PARTITION BY user_id ORDER BY sales_date)rk FROM sales_tb

2)判断连续日期,并查询统计连续天数>=2的用户
  • 使用date_sub()函数并聚合后判断日期连续
  • 如果sales_date 减去rk(天)是相同的日期,则说明他们这些天都是连续的日期(所以要使用dense_rank()并且对日期进行去重,不然重复的日期也会被记作连续的天数)。
GROUP BY user_id,DATE_SUB(sales_date,INTERVAL rk DAY) HAVING COUNT(1)>=2
#判断连续日期,对每个用户的连续购买日期进行聚类并统计,如果统计后天数大于等于2则为连续用户
完整代码
SELECT user_id,COUNT(1) days_count
FROM (SELECT DISTINCT sales_date,user_id,DENSE_RANK()OVER(PARTITION BY user_id ORDER BY sales_date)rk FROM sales_tb)t1
GROUP BY user_id,DATE_SUB(sales_date,INTERVAL rk DAY) HAVING COUNT(1)>=2;