与 WHERE 子句一起使用时优化 Oracle CONNECT BY

发布于 2024-07-26 07:13:01 字数 927 浏览 3 评论 0原文

Oracle START WITH ... CONNECT BY 子句在同一查询中在应用WHERE 条件之前应用。因此，WHERE 约束无助于优化 CONNECT BY。

例如，以下查询可能会执行全表扫描（忽略 dept_id 上的选择性）：

SELECT * FROM employees 
WHERE dept_id = 'SALE'
START WITH manager_id is null
CONNECT BY PRIOR employee_id = manager_id

我尝试通过两种方式提高性能：

查询 A：

SELECT * FROM employees 
START WITH manager_id is null AND dept_id = 'SALE'
CONNECT BY PRIOR employee_id = manager_id

查询 B：

SELECT * FROM (
               SELECT * FROM employees 
                WHERE dept_id = 'SALE'
              )
START WITH manager_id is null
CONNECT BY PRIOR employee_id = manager_id

虽然这两个查询的效果都比原始查询好得多，在 Oracle 10g 第 2 版上，查询 B 的性能确实比 A 好得多。

对于 CONNECT BY 和 WHERE 子句，您是否有类似的性能优化需要处理？您如何解释查询 B 比查询 A 做得更好？

原文

Oracle START WITH ... CONNECT BY clause is applied before applying WHERE condition in the same query. Thus, WHERE constraints won't help optimize CONNECT BY.

For example, the following query will likely perform full table scan (ignoring selectivity on dept_id):

SELECT * FROM employees 
WHERE dept_id = 'SALE'
START WITH manager_id is null
CONNECT BY PRIOR employee_id = manager_id

I tried to improve performance in 2 ways:

query A:

SELECT * FROM employees 
START WITH manager_id is null AND dept_id = 'SALE'
CONNECT BY PRIOR employee_id = manager_id

query B:

SELECT * FROM (
               SELECT * FROM employees 
                WHERE dept_id = 'SALE'
              )
START WITH manager_id is null
CONNECT BY PRIOR employee_id = manager_id

While both queries did much better than original, on Oracle 10g Release 2, query B did performed much better than A.

Did you have similar performance optimization to deal with with respect to CONNECT BY and WHERE clauses? How would you explain query B doing much better than query A?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

纵性 2024-08-02 07:13:01

查询 A 表示从销售部门的经理开始，然后获取他们的所有员工。 Oracle 不“知道”查询返回的所有员工都在销售部门，因此在执行 CONNECT 之前它无法使用该信息来减少要使用的数据集经过。

查询 B 显式将要处理的数据集减少到仅限销售部门的员工，Oracle 可以在执行 CONNECT BY 之前执行此操作。

回复收藏 0 原文

多孤肩上扛 2024-08-02 07:13:01

这应该会提供最终的性能：

CREATE INDEX i_employees_employee_manager_dept ON employees (employee_id,manager_id,dept_id);
CREATE INDEX i_employees_manager_employee_dept ON employees (manager_id,employee_id,dept_id);

SELECT * FROM employees  
START WITH manager_id is null AND dept_id = 'SALE' 
CONNECT BY PRIOR employee_id = manager_id AND dept_id = 'SALE'

请注意，您确实需要索引和 AND 条件才能使优化发挥作用。

This should give the ultimate performance:

CREATE INDEX i_employees_employee_manager_dept ON employees (employee_id,manager_id,dept_id);
CREATE INDEX i_employees_manager_employee_dept ON employees (manager_id,employee_id,dept_id);

SELECT * FROM employees  
START WITH manager_id is null AND dept_id = 'SALE' 
CONNECT BY PRIOR employee_id = manager_id AND dept_id = 'SALE'

Note that you do need both index and both AND conditions for the optimization to work.

回复收藏 0 原文

長街聽風 2024-08-02 07:13:01

这是一个类似的查询，长话短说，使用嵌套 sql 比使用先前选项的双连接运行得更快。

'SELECT level, XMLElement("elemento", XMLAttributes(codigo_funcion as "Codigo",
                                                    nombre_funcion as "Nombre",
                                                    objetivos as "Objetivos",
                                                     descripcion as "Descripción",
                                                    ''rightHanging'' as "layout"))
   FROM (
           SELECT * FROM dithe_codigo_funcion 
           WHERE nodo_raiz = ''PEP''
    )      
   START WITH codigo_funcion = ''PEP'' 
   CONNECT BY PRIOR codigo_funcion = nivel_anterior';

所以我没有太多专业知识的建议是使用嵌套sql来过滤。

This is a similar query, long story short it worked faster using the nested sql than the double connect by prior option.

'SELECT level, XMLElement("elemento", XMLAttributes(codigo_funcion as "Codigo",
                                                    nombre_funcion as "Nombre",
                                                    objetivos as "Objetivos",
                                                     descripcion as "Descripción",
                                                    ''rightHanging'' as "layout"))
   FROM (
           SELECT * FROM dithe_codigo_funcion 
           WHERE nodo_raiz = ''PEP''
    )      
   START WITH codigo_funcion = ''PEP'' 
   CONNECT BY PRIOR codigo_funcion = nivel_anterior';

So my recommendation without much expertise is to use the nested sql to filter.

回复收藏 0 原文