# select count(distinct q2.device_id)/count(distinct q1.device_id) as avg_ret # from question_practice_detail q1 # left join question_practice_detail q2 # on q1.device_id=q2.device_id and # datediff(q2.date,q1.date)=1 select count(distinct q2.device_id,q2.date)/count(distinct q1.device_id,q1.date) as avg_ret from question_practice_detail q1 left join question_practice_detail q2 on q1.device_id=q2.device_id and datediff(q2.date,q1.date)=1
由于其他大佬的题解已讲的很详细,这里仅补充解释注释代码为何计算出0.5:
(此图为借用,用于下述解释说明)
按注释代码,手工模拟计算可得
2315 8-14 2;8-15 2 此用户出现了同一天答了不止一次题的情况
3214 8-16 1
加粗数字为符合题目条件的device_id出现次数
distinct单独去重device_id后,q2的count为2315 1 + 3214 1 = 2, q1的count(参考借用图)为2138+2315+3214+6543 = 4。
故计算出来的结果就是0.5。
故若要唯一标识left join后的整个联结表,需要用 device_id与date来统一标识题目要求的分子及分母数据。