这个题目关键的是找到每天的新用户数和次日的新用户留存数
容易忽略的是留存为0的日期
SELECT a.date,ROUND(COUNT(DISTINCT login.user_id)/ COUNT(a.user_id),3) AS p FROM (
这个查询是为了找到每天的新用户数
SELECT user_id,MIN(date) AS date FROM login GROUP BY user_id) AS a
和原表login联结的条件也容易出错,这里要根据用户id和日期两个条件来进行联结
日期的限定条件那里不能使用where,如果使用where相当于查找的是所有登陆记录里,连续两天都登陆的记录
LEFT JOIN login ON login.user_id=a.user_id AND login.date=DATE_ADD(a.date,INTERVAL 1 DAY) GROUP BY a.date
这里的group by 后面不能使用login.date,因为a.date包含login.date
以上计算只算出了次日留存率不为0的日期,没有次日留存的日期需要使用union补充上
UNION SELECT date,0.000 AS p FROM login WHERE date NOT IN( SELECT MIN(date) FROM login GROUP BY user_id)
最后不要忘记使用order by排序
ORDER BY date