sql – 对非分层数据的Oracle分层查询

MsSQL 2020-06-08

我将一个Oracle表中的数据组织成可以包含循环的图(参见示例).

CREATE TABLE T (parent INTEGER,child INTEGER)
               AS select 1 parent,2 child from dual
        union all select 1 parent,8 child from dual
        union all select 2 parent,3 child from dual
        union all select 2 parent,4 child from dual
        union all select 2 parent,8 child from dual
        union all select 3 parent,4 child from dual
        union all select 3 parent,6 child from dual
        union all select 4 parent,5 child from dual
        union all select 5 parent,8 child from dual
        union all select 6 parent,5 child from dual
        union all select 7 parent,3 child from dual
        union all select 7 parent,5 child from dual
        union all select 8 parent,6 child from dual

我的目标是获得节点X的所有后代(孩子,孩子的孩子等)的节点.假设2.我的预期结果是：3,4,5,6,8.

我知道我可以设计一个这样的查询：

SELECT child,sys_connect_by_path(child,'/')
   FROM T
  START WITH parent = 2
CONNECT BY NOCYCLE PRIOR child = PARENT;

这样一个查询的问题是,它会遍历所有可能的路径,直到它们循环,并且在我的实际数据中有太多的路径.结果包括许多重复 – 这里是：

child | sys_connect_by_path (for information)
3     | /3
4     | /3/4
5     | /3/4/5
8     | /3/4/5/8
6     | /3/4/5/8/6
6     | /3/6
5     | /3/6/5
8     | /3/6/5/8
4     | /4
5     | /4/5
8     | /4/5/8
6     | /4/5/8/6
8     | /8
6     | /8/6
5     | /8/6/5

我的实际数据要复杂得多.这样的查询的执行成本是如此巨大,使得我的TEMP表空间(可自动扩展)达到10Gb(最初为500Mb),并且由于磁盘已满,我的数据库实际上被破坏.

我试图设计这样的查询(递归WITH子句)：

WITH descendants(node) AS
( SELECT 2 node FROM dual
  UNION ALL
  (
  SELECT child
    FROM T
   INNER JOIN descendants D
      ON T.parent = D.node
   MINUS SELECT node FROM descendants
  )
)
SELECT * FROM descendants

我遇到的问题是：

>使用Oracle 10g,这没有实现(ORA-32033：不支持的列别名,一些客户使用Oracle 9或10)
>使用Oracle 11g,我得到ORA-32041：递归WITH子句中的UNION ALL操作必须只有两个分支.如果我删除了MINUS子句,我将获得循环(ORA-32044：在执行递归WITH查询时检测到循环).

您如何查询我的原始数据以有效地获得这些节点3,8？ PL / sql 解决方案也受到欢迎.

谢谢.

解决方法

您到达任何子节点的预期最大深度是多少？

如果它相对较小,您可以循环下来,同时检查您已访问的节点,以这样的方式…

(注意,我不是Oracle专家,所以这更接近于伪代码与一些真正的sql混合在一起)

CREATE TABLE myMap (parent INT,child INT);

INSERT INTO myTable SELECT NULL,2 FROM DUAL;

WHILE (sql%ROWCOUNT > 0)
LOOP

  INSERT INTO
    myMap
  SELECT DISTINCT
    dataMap.parent,dataMap.child
  FROM
    myMap
  INNER JOIN
    dataMap
      ON myMap.child = dataMap.parent
  WHERE
    NOT EXISTS (SELECT * FROM myMap WHERE parent = dataMap.parent)

END LOOP;

根据性能,您可能还希望在myMap中有一个深度字段;优化连接,以便只加入最近的节点.这意味着两个指标;一个用于JOIN(深度),一个用于NOT EXISTS(父).

编辑

添加了DISTINCT关键字,以避免以下情况…
– 节点2映射到3和4
– 节点3和4都映射到节点5
– 节点5的所有子节点现在将被处理两次

GROUP BY或许多其他选项可以用来满足这一点,而不是DISTINCT.只是它自己的“不存在”是不够的.

SQL Server2012高可用之日志传送测试

（一）日志传送架构（1.1）相关服务器主服务器：用于生产的服务器，上面运行这生产SQL Server数据库...

SQL server事物复制报错：要复制的 LOB 数据的长度(xxxxx)超出了配置的最大值 65536

(一)事故背景最近在SQL Server 2012生产数据库上配置完事物复制（发布订阅）后，生产数据库业务出现了...

SQL Server2012高可用之事物复制(发布订阅)测试

（一）测试目的目前公司使用的SQL SERVER 2012高可用环境为主备模式，其中主库可执行读写操作，备库既...

使用zabbix监控sql server的发布订阅

（一）背景个人在使用sql server时，用到了sql server的发布订阅来做主从同步，类似MySQL的异步复制。在...