alt

MEGRE

MEGRE语句,在SQL的生态圈中,一直都隶属于一个比较重要的位置。

要知道,在实际的项目应用中,我们经常需要从上游数据源,进行原始数据的抽取、清洗、存储、分析等操作,特别是在存储这一环节,MEGRE的作用尤为突出。

举个例子:

我们需要完成对上游维度信息的抽取,根据我们的设定,数仓在每日执行抽取任务之前,需要对数仓已有的维度信息进行判断,如果已有的,要核对是否与最新的数据相匹配,不匹配则进行更新操作;如果是没有的,则需要执行插入操作。

常规的实现方法需要分别编写SQL语句进行条件判断,分别执行更新和插入操作,这样会显得代码非常的臃肿,性能也不是特别好,针对这种情况,使用MEGRE语句尤为的适合。

函数介绍

MEGRE语法如下:

MERGE 目标表
USING 源表
ON 匹配条件
WHEN MATCHED
THEN 语句
WHEN NOT MATCHED BY TARGET --如何和目标表不匹配
THEN 语句
WHEN NOT MATCHED BY SOURCE --如何和源表不匹配
THEN 语句;

注意:

1.最后语句的分号不可以被省略;

2.源表可以是一个物理表,也可以是一个子查询语句。

使用实例

案例数据:

在白茶本机的数据库中,存在名为”CaseData”的数据库,执行下面的语句,生成我们需要的源表和目标表。

CREATE TABLE TargetTable (
    UserID INT PRIMARY KEY,
    UserName VARCHAR(255) NOT NULL,
    Amount DECIMAL(10, 2)
);
INSERT INTO TargetTable(UserID, UserName, Amount)
VALUES(1, '张三', 15000),
      (2, '李四', 25000),
      (3, '王五', 13000),
      (4, '陈六', 10000);
--------------上面生成目标表,下面生成源表--------------
CREATE TABLE SourceTable (
    UserID INT PRIMARY KEY,
    UserName VARCHAR(255) NOT NULL,
    Amount DECIMAL(10, 2)
);
INSERT INTO SourceTable(UserID, UserName, Amount)
VALUES(1, '张三', 15000),
      (3, '王五', 14000),
      (4, '陈六', 20000),
      (5, '赵七', 10000),
      (6, '钱九', 10000);

结果如下:

alt

我们来查看一下表的数据。

alt

假设TargetTable表是数仓目前已有的数据,SourceTable表是每日更新的上游数据,我们现在要根据SourceTable表对TargetTable进行数据更新。

更新规则如下:

1.若TargetTable表和SourceTable表都有的数据,则需要更新为SourceTable表中的记录;

2.若TargetTable表有的记录,且SourceTable表没有,则这些记录需要被清除掉;

3.若TargetTable表没有记录,且SourceTable表有,则需要将SourceTable表中的记录插入到TargetTable表中。

根据上述要求,我们可以编辑如下SQL语句:

MERGE TargetTable
USING SourceTable
ON (TargetTable.UserID = SourceTable.UserID)
WHEN MATCHED THEN
UPDATE
SET TargetTable.UserName = SourceTable.UserName,
    TargetTable.Amount = SourceTable.Amount
WHEN NOT MATCHED BY TARGET THEN
INSERT (UserID, UserName, Amount)
VALUES (
        SourceTable.UserID,
        SourceTable.UserName,
        SourceTable.Amount
    )
WHEN NOT MATCHED BY SOURCE THEN 
DELETE;

结果如下: alt alt alt alt

这里是白茶,一个PowerBI的初学者。 alt