WITH t AS (
	SELECT
		MONTH(p.fdate) AS `month`
		,ROW_NUMBER() OVER(partition by MONTH(p.fdate) ORDER BY COUNT(s.song_name) DESC, p.song_id) AS ranking
		,s.song_name 
		,COUNT(s.song_name) AS play_pv
	FROM 
        play_log p 
        LEFT JOIN song_info s ON p.song_id = s.song_id
        LEFT JOIN user_info u ON p.user_id = u.user_id
	WHERE 
        YEAR(p.fdate) = 2022         -- 在2022年
		AND u.age BETWEEN 18 AND 25  -- 18-25岁用户
		AND s.singer_name = '周杰伦'  -- 周杰伦的歌曲
	GROUP BY MONTH(p.fdate), s.song_name, p.song_id  -- 窗口函数中用到song_id,所以分组时要加上
)
SELECT * FROM t WHERE ranking <= 3  -- 每个月播放次数top 3
;

GROUP BY 和 PARTITION BY 的基本概念

  • GROUP BY:这是用于对查询结果进行分组汇总的操作。它会按照指定的列把数据划分成不同的组,接着可以针对每个组运用聚合函数(像 COUNTSUMAVG 等)来计算统计值。
  • PARTITION BY:这属于窗口函数的一部分,它会把结果集划分成若干个分区。窗口函数会在每个分区内开展计算,不会对结果集进行实际的分组,而是在原结果集的基础上新增一列计算结果。