WITH t AS (
SELECT
MONTH(p.fdate) AS `month`
,ROW_NUMBER() OVER(partition by MONTH(p.fdate) ORDER BY COUNT(s.song_name) DESC, p.song_id) AS ranking
,s.song_name
,COUNT(s.song_name) AS play_pv
FROM
play_log p
LEFT JOIN song_info s ON p.song_id = s.song_id
LEFT JOIN user_info u ON p.user_id = u.user_id
WHERE
YEAR(p.fdate) = 2022 -- 在2022年
AND u.age BETWEEN 18 AND 25 -- 18-25岁用户
AND s.singer_name = '周杰伦' -- 周杰伦的歌曲
GROUP BY MONTH(p.fdate), s.song_name, p.song_id -- 窗口函数中用到song_id,所以分组时要加上
)
SELECT * FROM t WHERE ranking <= 3 -- 每个月播放次数top 3
;
GROUP BY
和 PARTITION BY
的基本概念
GROUP BY
:这是用于对查询结果进行分组汇总的操作。它会按照指定的列把数据划分成不同的组,接着可以针对每个组运用聚合函数(像 COUNT
、SUM
、AVG
等)来计算统计值。PARTITION BY
:这属于窗口函数的一部分,它会把结果集划分成若干个分区。窗口函数会在每个分区内开展计算,不会对结果集进行实际的分组,而是在原结果集的基础上新增一列计算结果。
