INTERSECT 算子用于对左右孩子算子输出进行交集运算,并进行去重。
OceanBase 数据库支持的 INTERSECT 算子包括 MERGE INTERSECT DISTINCT 和 HASH INTERSECT DISTINCT。
MERGE INTERSECT DISTINCT
如下示例中,Q1 对两个查询使用 INTERSECT 联接,c1 有可用排序,0 号算子生成了 MERGE INTERSECT DISTINCT 进行求取交集、去重。由于 c2 无可用排序,所以在 3 号算子上分配了 SORT 算子进行排序。算子执行时从左右子节点读取有序输入,利用有序输入进行 MERGE,实现去重并得到交集结果。
obclient>CREATE TABLE t1(c1 INT PRIMARY KEY, c2 INT);Query OK, 0 rows affected (0.12 sec)obclient>INSERT INTO t1 VALUES(1,1);Query OK, 1 rows affected (0.12 sec)obclient>INSERT INTO t1 VALUES(2,2);Query OK, 1 rows affected (0.12 sec)Q1:obclient>EXPLAIN select c1 FROM t1 INTERSECT SELECT c2 FROM t1\G;*************************** 1. row ***************************Query Plan:=================================================|ID|OPERATOR|name|EST. ROWS|COST|-------------------------------------------------|0 |MERGE INTERSECT DISTINCT||2|77||1 | TABLE Scan|T1|2|37||2 | SORT||2|39||3 |TABLE scan|T1|2|37|=================================================Outputs & filters:-------------------------------------0 - output([INTERSECT(T1.C1, T1.C2)]), filter(nil)1 - output([T1.C1]), filter(nil),access([T1.C1]), Partitions(p0)2 - output([T1.C2]), filter(nil), sort_keys([T1.C2, ASC])3 - output([T1.C2]), filter(nil),access([T1.C2]), partitions(p0)
上述示例中,执行计划展示中的 outputs & filters 详细列出了所有 INTERSECT 算子的输出信息如下:
信息名称 |
含义 |
---|---|
该算子的输出表达式。 使用 INTERSECT 联接的两个子算子对应输出,即表示交集运算输出结果中的一列,括号内部为左右子节点对应此列的输出列。 |
|
该算子上的过滤条件。 由于示例中 INTERSECT 算子没有设置 filter,所以为 nil。 |
HASH INTERSECT DISTINCT
如下例所示,Q2 对两个查询使用 INTERSECT 进行联接,不可利用排序,0 号算子使用 HASH INTERSECT DISTINCT 进行求取交集、去重。算子执行时先读取一侧子节点输出建立哈希表并去重,再读取另一侧子节点利用哈希表求取交集并去重。
Q2:obclient>EXPLAIN SELECT c2 FROM t1 INTERSECT SELECT c2 FROM t1\G;*************************** 1. row ***************************Query Plan:================================================|ID|OPERATOR|NAME|EST. ROWS|COST|------------------------------------------------|0 |HASH INTERSECT DISTINCT||2|77||1 | TABLE SCAN|T1|2|37||2 | TABLE SCAN|T1|2|37|================================================Outputs & filters:-------------------------------------0 - output([INTERSECT(T1.C2, T1.C2)]), filter(nil)1 - output([T1.C2]), filter(nil),access([T1.C2]), partitions(p0)2 - output([T1.C2]), filter(nil),access([T1.C2]), partitions(p0)
上述示例的执行计划展示中的 outputs & filters 详细列出了 HASH INTERSECT DISTINCT 算子的输出信息,字段的含义与 MERGE INTERSECT DISTINCT 算子相同。
发表评论