Oracle 數(shù)據(jù)倉庫 ETL 技術(shù)之多表插入語句

作者: 不剪發(fā)的Tony老師
畢業(yè)于北京航空航天大學(xué),十多年數(shù)據(jù)庫管理與開發(fā)經(jīng)驗(yàn),目前在一家全球性的金融公司從事數(shù)據(jù)庫架構(gòu)設(shè)計(jì)。CSDN學(xué)院簽約講師以及GitChat專欄作者。csdn上的博客收藏于以下地址:https://tonydong.blog.csdn.net

文章目錄

        創(chuàng)建示例表
        無條件的 INSERT ALL 語句
        有條件的 INSERT ALL 語句
        有條件的 INSERT FIRST 語句
        多表插入語句的限制

大家好!我是只談技術(shù)不剪發(fā)的 Tony 老師。

ETL(提取、轉(zhuǎn)換、加載)是指從源系統(tǒng)中提取數(shù)據(jù)并將其放入數(shù)據(jù)倉庫的過程。Oracle 數(shù)據(jù)庫為 ETL 流程提供了豐富的功能,今天我們就給大家介紹一下 Oracle 多表插入語句,也就是 INSERT ALL 語句。

如果覺得文章有用,歡迎評論??、點(diǎn)贊??、推薦??
創(chuàng)建示例表

我們首先創(chuàng)建一個(gè)源數(shù)據(jù)表和三個(gè)目標(biāo)表:

CREATE TABLE src_table(
  id INTEGER NOT NULL PRIMARY KEY,
  name VARCHAR2(10) NOT NULL
);
INSERT INTO src_table VALUES (1, '張三');
INSERT INTO src_table VALUES (2, '李四');
INSERT INTO src_table VALUES (3, '王五');

CREATE TABLE tgt_t1 AS
SELECT * FROM src_table WHERE 1=0;

CREATE TABLE tgt_t2 AS
SELECT * FROM src_table WHERE 1=0;

CREATE TABLE tgt_t3 AS
SELECT * FROM src_table WHERE 1=0;

 

無條件的 INSERT ALL 語句

INSERT ALL 語句可以用于將多行輸入插入一個(gè)或者多個(gè)表中,因此也被稱為多表插入語句。第一種形式的 INSERT ALL 語句是無條件的插入語句,源數(shù)據(jù)中的每一行數(shù)據(jù)都會(huì)被插入到每個(gè)目標(biāo)表中。例如:

INSERT ALL
  INTO tgt_t1(id, name) VALUES(id, name)
  INTO tgt_t2(id, name) VALUES(id, name)
  INTO tgt_t3(id, name) VALUES(id, name)
SELECT * FROM src_table;

SELECT * FROM tgt_t1;
ID|NAME  |
--|------|
 1|張三  |
 2|李四  |
 3|王五  |

SELECT * FROM tgt_t2;
ID|NAME  |
--|------|
 1|張三  |
 2|李四  |
 3|王五  |

SELECT * FROM tgt_t3;
ID|NAME  |
--|------|
 1|張三  |
 2|李四  |
 3|王五  |

 

執(zhí)行以上多表插入語句之后,三個(gè)目標(biāo)表中都生成了 3 條記錄。

我們也可以多次插入相同的表,實(shí)現(xiàn)一個(gè)插入語句插入多行數(shù)據(jù)的效果。例如:

TRUNCATE TABLE tgt_t1;

INSERT ALL
  INTO tgt_t1(id, name) VALUES(4, '趙六')
  INTO tgt_t1(id, name) VALUES(5, '孫七')
  INTO tgt_t1(id, name) VALUES(6, '周八')
SELECT 1 FROM dual;

SELECT * FROM tgt_t1;
ID|NAME  |
--|------|
 4|趙六  |
 5|孫七  |
 6|周八  |

 

在以上插入語句中,tgt_t1 出現(xiàn)了三次,最終在該表中插入了 3 條記錄。這種語法和其他數(shù)據(jù)庫中的以下多行插入語句效果相同:

-- MySQL、SQL Server、PostgreSQL以及SQLite
INSERT INTO tgt_t1(id, name)
VALUES(4, '趙六'), (5, '孫七'), (6, '周八');

 

另外,這種無條件的 INSERT ALL 語句還可以實(shí)現(xiàn)列轉(zhuǎn)行(PIVOT)的功能。例如:

CREATE TABLE src_pivot(
  id INTEGER NOT NULL PRIMARY KEY,
  name1 VARCHAR2(10) NOT NULL,
  name2 VARCHAR2(10) NOT NULL,
  name3 VARCHAR2(10) NOT NULL
);
INSERT INTO src_pivot VALUES (1, '張三', '李四', '王五');

TRUNCATE TABLE tgt_t1;

INSERT ALL
  INTO tgt_t1(id, name) VALUES(id, name1)
  INTO tgt_t1(id, name) VALUES(id, name2)
  INTO tgt_t1(id, name) VALUES(id, name3)
SELECT * FROM src_pivot;

SELECT * FROM tgt_t1;
ID|NAME  |
--|------|
 1|張三  |
 1|李四  |
 1|王五  |

 

src_pivot 表中包含了 3 個(gè)名字字段,我們通過 INSERT ALL 語句將其轉(zhuǎn)換 3 行記錄。
有條件的 INSERT ALL 語句

第一種形式的 INSERT ALL 語句是有條件的插入語句,可以將滿足不同條件的數(shù)據(jù)插入不同的表中。例如:

TRUNCATE TABLE tgt_t1;
TRUNCATE TABLE tgt_t2;
TRUNCATE TABLE tgt_t3;

INSERT ALL
  WHEN id <= 1 THEN
    INTO tgt_t1(id, name) VALUES(id, name)
  WHEN id BETWEEN 1 AND 2 THEN
    INTO tgt_t2(id, name) VALUES(id, name)
  ELSE
    INTO tgt_t3(id, name) VALUES(id, name)
SELECT * FROM src_table;

SELECT * FROM tgt_t1;
ID|NAME  |
--|------|
 1|張三  |
 
SELECT * FROM tgt_t2;
ID|NAME  |
--|------|
 1|張三  |
 2|李四  |

SELECT * FROM tgt_t3;
ID|NAME  |
--|------|
 3|王五  |

 

tgt_t1 中插入了 1 條數(shù)據(jù),因?yàn)?id 小于等于 1 的記錄只有 1 個(gè)。tgt_t2 中插入了 2 條數(shù)據(jù),包括 id 等于 1 的記錄。也就是說,前面的 WHEN 子句不會(huì)影響后續(xù)的條件判斷,每個(gè)條件都會(huì)單獨(dú)進(jìn)行判斷。tgt_t3 中插入了 1 條數(shù)據(jù),ELSE 分支只會(huì)插入不滿足前面所有條件的數(shù)據(jù)。

    ??有條件的多表插入語句最多支持 127 個(gè) WHEN 子句。

有條件的 INSERT FIRST 語句

有條件的 INSERT FIRST 的原理和 CASE 表達(dá)式類似,只會(huì)執(zhí)行第一個(gè)滿足條件的插入語句,然后繼續(xù)處理源數(shù)據(jù)中的其他記錄。例如:

TRUNCATE TABLE tgt_t1;
TRUNCATE TABLE tgt_t2;
TRUNCATE TABLE tgt_t3;

INSERT FIRST
  WHEN id <= 1 THEN
    INTO tgt_t1(id, name) VALUES(id, name)
  WHEN id BETWEEN 1 AND 2 THEN
    INTO tgt_t2(id, name) VALUES(id, name)
  ELSE
    INTO tgt_t3(id, name) VALUES(id, name)
SELECT * FROM src_table;

SELECT * FROM tgt_t1;
ID|NAME  |
--|------|
 1|張三  |
 
SELECT * FROM tgt_t2;
ID|NAME  |
--|------|
 2|李四  |

SELECT * FROM tgt_t3;
ID|NAME  |
--|------|
 3|王五  |

 

以上語句和上一個(gè)示例的差別在于源數(shù)據(jù)中的每個(gè)記錄只會(huì)插入一次,tgt_t2 中不會(huì)插入 id 等于 1 的數(shù)據(jù)。
多表插入語句的限制

Oracle 多表插入語句存在以下限制:

    多表插入只能針對表執(zhí)行插入操作,不支持視圖或者物化視圖。
    多表插入語句不能通過 DB Link 針對遠(yuǎn)程表執(zhí)行插入操作。
    多表插入語句不能通針對嵌套表執(zhí)行插入操作。
    所有 INSERT INTO 子句中的字段總數(shù)量不能超過 999 個(gè)。
    多表插入語句中不能使用序列。多表插入語句被看作是單個(gè)語句,因此只會(huì)產(chǎn)生一個(gè)序列值并且用于所有的數(shù)據(jù)行,這樣會(huì)導(dǎo)致數(shù)據(jù)問題。
    多表插入語句不能和執(zhí)行計(jì)劃穩(wěn)定性功能一起使用。
    如果任何目標(biāo)并使用了 PARALLEL 提示,整個(gè)語句都會(huì)被并行化處理。如果沒有目標(biāo)表使用 PARALLEL 提示,只有定義了 PARALLEL 屬性的目標(biāo)表才會(huì)被并行化處理。
    如果多表插入語句中的任何表是索引組織表,或者定義了位圖索引,都不會(huì)進(jìn)行并行化處理。