DB2公共表表达式WITH语句使用.docx

上传人:b****6 文档编号:6983006 上传时间:2023-01-14 格式:DOCX 页数:10 大小:19.67KB
下载 相关 举报
DB2公共表表达式WITH语句使用.docx_第1页
第1页 / 共10页
DB2公共表表达式WITH语句使用.docx_第2页
第2页 / 共10页
DB2公共表表达式WITH语句使用.docx_第3页
第3页 / 共10页
DB2公共表表达式WITH语句使用.docx_第4页
第4页 / 共10页
DB2公共表表达式WITH语句使用.docx_第5页
第5页 / 共10页
点击查看更多>>
下载资源
资源描述

DB2公共表表达式WITH语句使用.docx

《DB2公共表表达式WITH语句使用.docx》由会员分享,可在线阅读,更多相关《DB2公共表表达式WITH语句使用.docx(10页珍藏版)》请在冰豆网上搜索。

DB2公共表表达式WITH语句使用.docx

DB2公共表表达式WITH语句使用

 

WITH语句

----start

   说起WITH语句,除了那些第一次听说WITH语句的人,大部分人都觉得它是用来做递归查询的。

其实那只是它的一个用途而已,它的本名正如我们标题写的那样,叫做:

公共表表达式(CommonTableExpression),从字面理解,大家觉得它是用来干嘛的呢?

其实,它是用来定义临时集合的。

啊?

VALUES语句不是用来定义临时集合的吗?

怎么WITH语句也用来定义临时集合呢?

它们有什么区别呢?

 

VALUES语句是用明确的值来定义临时集合的,如下:

[c-sharp] 

1.VALUES (1,2), (1,3),(2,1)  

 

WITH语句是用查询(也就是select语句)来定义临时集合的,从这个角度讲,有点像视图,不过不是视图,大家千万别误解。

如下:

[c-sharp]

1.CREATE TABLE USER (  

2.NAME VARCHAR(20) NOT NULL,---姓名  

3.SEX INTEGER,---性别(1、男   2、女)  

4.BIRTHDAY DATE---生日  

5.);  

[c-sharp] 

1.WITH TEST(NAME_TEST, BDAY_TEST) AS  

2.(  

3.SELECT NAME,BIRTHDAY FROM USER--语句1  

4.)  

5.SELECT NAME_TEST FROM TEST WHERE BDAY_TEST='1949-10-1';--语句2  

 

下面我们来解释一下,首先语句1执行,它会产生一个有两列(NAME,BIRTHDAY)的结果集;接着,我们将这个结果集命名为test,并且将列名重命名为NAME_TEST,BDAY_TEST;最后我们执行语句2,从这个临时集合中找到生日是1949-10-1,也就是共和国的同龄人。

 

怎么样?

如果你感觉不好理解,请仔细的分析一下上面的语句。

下面我们举个VALUES语句和WITH语句结合使用的例子,如下:

[c-sharp]

1.WITH TEST(NAME_TEST, BDAY_TEST) AS  

2.(  

3.VALUES ('张三','1997-7-1'),('李四','1949-10-1')  

4.)  

5.SELECT NAME_TEST FROM TEST WHERE BDAY_TEST='1949-10-1'  

从上面的介绍和WITH语句不为大多数人所熟悉可以猜测,WITH语句是为复杂的查询为设计的,的确是这样的,下面我们举个复杂的例子,想提高技术的朋友可千万不能错过。

考虑下面的情况:

[c-sharp] 

1.CREATE TABLE USER  

2.(  

3.NAME VARCHAR(20) NOT NULL,--姓名  

4.DEGREE INTEGER NOT NULL,--学历(1、专科 2、本科 3、硕士 4、博士)  

5.STARTWORKDATE date NOT NULL,--入职时间  

6.SALARY1 FLOAT NOT NULL,--基本工资  

7.SALARY2 FLOAT NOT NULL--奖金  

8.);  

 

假设现在让你查询一下那些1、学历是硕士或博士 2、学历相同,入职年份也相同,但是工资(基本工资+奖金)却比相同条件员工的平均工资低的员工。

(哈哈,可能是要涨工资),不知道你听明白问题没有?

该怎么查询呢?

我们是这样想的:

 

1、查询学历是硕士或博士的那些员工得到结果集1,如下:

[c-sharp] 

1.SELECT NAME,DEGREE,YEAR(STARTWORKDATE) AS WORDDATE, SALARY1+SALARY2 AS SALARY FROM USER WHERE DEGREE IN (3,4);  

 

2、根据学历和入职年份分组,求平均工资得到结果集2,如下:

[c-sharp] 

1.SELECT DEGREE,YEAR(STARTWORKDATE) AS WORDDATE, AVG(SALARY1+SALARY2) AS AVG_SALARY   

2.FROM USER WHERE DEGREE IN (3,4)  

3.GROUP BY DEGREE,YEAR(STARTWORKDATE)  

 

3、以学历和入职年份为条件 联合两个结果集,查找工资<平均工资 的员工,以下是完整的SQL:

[c-sharp] 

1.WITH TEMP1(NAME,DEGREE,WORDDATE,SALARY) AS   

2.(  

3.SELECT NAME,DEGREE,YEAR(STARTWORKDATE) AS WORDDATE, SALARY1+SALARY2 AS SALARY FROM USER WHERE DEGREE IN (3,4)  

4.),  

5.TEMP2 (DEGREE,WORDDATE,AVG_SALARY) AS  

6.(  

7.SELECT DEGREE,YEAR(STARTWORKDATE) AS WORDDATE, AVG(SALARY1+SALARY2) AS AVG_SALARY   

8.FROM USER WHERE DEGREE IN (3,4)  

9.GROUP BY DEGREE,YEAR(STARTWORKDATE)  

10.)  

11.SELECT NAME FROM TEMP1, TEMP2 WHERE   

12.=   

13.AND =   

14.AND SALARY

 

查询结果完全正确,但我们还有改善的空间,在查询结果集2的时候,我们是从user表中取得数据的。

其实此时结果集1已经查询出来了,我们完全可以从结果集1中通过分组得到结果集2,而不用从uer表中得到结果集2,比较上面和下面的语句你就可以知道我说的是什么意思了!

[c-sharp] 

1.WITH TEMP1(NAME,DEGREE,WORDDATE,SALARY) AS   

2.(  

3.SELECT NAME,DEGREE,YEAR(STARTWORKDATE) AS WORDDATE, SALARY1+SALARY2 AS SALARY FROM USER WHERE DEGREE IN (3,4)  

4.),  

5.TEMP2 (DEGREE,WORDDATE,AVG_SALARY) AS  

6.(  

7.SELECT DEGREE,WORDDATE, AVG(SALARY) AS AVG_SALARY   

8.FROM TEMP1  

9.GROUP BY DEGREE,WORDDATE  

10.)  

11.SELECT NAME FROM TEMP1, TEMP2 WHERE   

12.=   

13.AND =   

14.AND SALARY

 

可能有些朋友会说,我不用WITH语句也可以查出来,的确是这样,如下:

[c-sharp]

1.SELECT  FROM USER AS U,  

2.(  

3.SELECT DEGREE,YEAR(STARTWORKDATE) AS WORDDATE, AVG(SALARY1+SALARY2) AS AVG_SALARY   

4.FROM USER WHERE DEGREE IN (3,4)  

5.GROUP BY DEGREE,YEAR(STARTWORKDATE)  

6.) AS G  

7.WHERE =  

8.AND YEAR=  

9.AND (SALARY1+SALARY2)<;  

那使用WITH和不使用WITH,这两种写法有什么区别呢?

一般情况下这两种写法在性能上不会有太大差异,但是,

1、当USER表的记录很多

2、硕士或博士(DEGREEIN(3,4))在USER表中的比例很少

 

当满足以上条件时,这两种写法在性能的差异将会显现出来,为什么呢?

因为不使用WITH写法的语句访问了2次USER表,如果DEGREE字段又没有索引,性能差异将会非常明显。

 

   当你看到这时,如果很好的理解了上面的内容,我相信你会对WITH语句有了一定的体会。

然而WITH语句能做的还不止这些,下面给大家介绍一下,如何用WITH语句做递归查询。

递归查询的一个典型的例子是对树状结构的表进行查询,考虑如下的情况:

[c-sharp] 

1.论坛首页  

2.--数据库开发  

3.----DB2  

4.------DB2 文章1  

5.--------DB2 文章1 的评论1  

6.--------DB2 文章1 的评论2  

7.------DB2 文章2  

8.----Oracle  

9.--Java技术  

 

以上是一个论坛的典型例子,下面我们新建一个表来存储以上信息。

[c-sharp] 

1.CREATE TABLE BBS  

2.(  

3.PARENTID INTEGER NOT NULL,  

4.ID INTEGER NOT NULL,  

5.NAME VARCHAR(200) NOT NULL---板块、文章、评论等。

  

6.);  

7.insert into bbs (PARENTID,ID,NAME) values   

8.(0,0,'论坛首页'),  

9.(0,1,'数据库开发'),  

10.(1,11,'DB2'),  

11.(11,111,'DB2 文章1'),  

12.(111,1111,'DB2 文章1 的评论1'),  

13.(111,1112,'DB2 文章1 的评论2'),  

14.(11,112,'DB2 文章2'),  

15.(1,12,'Oracle'),  

16.(0,2,'Java技术');  

 

现在万事兼备了,我们开始查询吧。

假设现在让你查询一下‘DB2文章1’的所有评论,有人说,这还不简单,如下这样就可以了。

[c-sharp] 

1.SELECT * FROM BBS WHERE PARENTID=(SELECT ID FROM BBS WHERE NAME='DB2');  

 

答案完全正确。

那么,现在让你查询一下DB2的所有文章及评论,怎么办?

传统的方法就很难查询了,这时候递归查询就派上用场了,如下:

[c-sharp] 

1.WITH TEMP(PARENTID,ID,NAME) AS  

2.(  

3.SELECT PARENTID,ID,NAME FROM BBS WHERE NAME='DB2'---语句1  

4.UNION ALL---语句2  

5.SELECT ,, FROM BBS AS B, TEMP AS T WHERE =语句3  

6.)  

7.SELECT NAME FROM TEMP;---语句4  

 

运行后,我们发现,结果完全正确,那它到底是怎么运行的呢?

下面我们详细讲解一下。

1、首先,语句1将会执行,它只执行一次,作为循环的起点。

得到结果集:

DB2

2、接着,将循环执行语句3,这里我们有必要详细介绍一下。

首先语句3的意图是什么呢?

说白了,它就是查找语句1产生结果集(DB2)的下一级,那么在目录树中DB2的下一级是什么呢?

是‘DB2文章1’和‘DB2文章2’,并且把查询到的结果集作为下一次循环的起点,然后查询它们的下一级,直到没有下一级为止。

怎么样?

还没明白?

哈哈,不要紧,我们一步一步来:

首先,语句1产生结果集:

DB2,作为循环的起点,把它和BBS表关联来查找它的下一级,查询后的结果为:

‘DB2文章1’和‘DB2文章2’

接着,把上次的查询结果(也就是‘DB2文章1’和‘DB2文章2’)和BBS表关联来查找它们的下一级,查询后的结果为:

‘DB2文章1的评论1’和‘DB2文章1的评论2’。

然后,在把上次的查询结果(也就是‘DB2文章1的评论1’和‘DB2文章1的评论2’)和BBS表关联来查找它们的下一级,此时,没有结果返回,循环结束。

3、第三,将执行语句2,将所有的结果集放在一起,最终得到temp结果集。

4、最后,我们通过语句4 从temp临时集合中得到我们期望的查询结果。

怎么样,这回理解了吧,如果还没有理解,那么我也无能为力了。

需要特别提醒的是

1、一定要注意语句3的关联条件,否则很容易就写成死循环了。

2、语句2必须是UNIONALL

最后请大家猜想一下,把语句1的where子句去掉,将会产生什么样的结果呢?

DB2递归实现字符串分组连接操作

db2中的递归查询使用with来实现,也称为公共表达式,公共表达式在select语句的开始部分采用with子句的形式,在使用公共表达式的查询中可以多次使用它,并且公共表达式还可以通过取别名来连接到他本身,这样的话就可以达到循环的目的。

 

递归查询通常有3个部分需要定义:

 

一:

一个公共表达式形式的虚拟表。

二:

一个初始化表。

三:

一个与虚拟表进行完全内连接的辅助表。

 

需要使用UNIONall合并上边3个查询,然后用select从递归输出中得到最终的结果。

 

大体上如下形式

withXX(x1,x2,x3)as -------@0

select,froma ----@1

unionall ----@2

select*froma,xxwhere=------@3

select...fromxxwhere....-------@4

 

@0:

为with体,即虚拟表

@1:

为初始化表,这里需要定义初始化的一些行,也就是你递归的出发点,或者说父行,这部分逻辑只执行一次,它的结果作为虚拟表递归的初始化内容。

@2:

这里必须用UNIONall

@3:

这里需要定义递归的条件(辅助表),这里定义递归的逻辑,需要注意的是父行和子行进行连接的时候逻辑一定要清楚父子关系,不然很容易变成死循环的,这里首先将初始化表的结果作为条件进行查询,在把执行的结果添加到虚拟表中,只要这里能查询出来记录,那么就会进行下一步递归循环。

@4:

这里就是对虚拟表的查询语句。

 

需求:

一张实时表,一个人每到一个地方,就有一条记录存在,存放样例:

张三上海

张三杭州

.....

要求,按人名进行汇总,将他到过的地方拼接,中间用'#'分隔

数据准备:

--创建表:

CREATETABLERecursive_Test

(User_NameVARCHAR(12),

 CityVARCHAR(12));

--数据插入

INSERTINTORecursive_Test(User_Name,City)

   values('张三','杭州'),('张三','郑州'),('李四','杭州'),

       ('张三','南昌'),('李四','广州'),('王五','北京');

-----递归实现:

WITHRecursive_Test_Par(User_Name,City,Rk_Num)as(

SELECTUser_Name,City,ROW_NUMBER()OVER(PARTITIONBYUser_Name)--分组,生成序列,自我关联之用

FROMRecursive_Test

),

City_Join(User_Name,City,R_Num)as(

SELECTUser_Name,CAST(CityASVARCHAR(100)),Rk_NumfromRecursive_Test_ParWHERERk_Num=1

UNIONALL

SELECT,CAST||'#'||ASVARCHAR(100)),+1

 fromCity_Joina1,Recursive_Test_Parb1

WHERE=and=

) 

SELECT,FROMCity_JoinaINNERJOIN

   (SELECTUser_Name,max(R_Num)R_NumfromCity_Join

    GROUPBYUser_Name)b

ON=and=;

 

(另:

WITHRECURSIVE_TEST_PAR(USER_NAME,CITY,RK_NUM)AS(

SELECTUSER_NAME,CITY,ROW_NUMBER()OVER(PARTITIONBYUSER_NAME)

FROMRECURSIVE_TEST)

CITY_JOIN(USER_NAME,CITY,R_NUM)AS(

SELECTUSER_NAME,CAST(CITYASVARCHAR(100)),RK_NUM

FROMRECURSIVE_TEST_PARWHERERK_NUM=1

UNIONALL

SELECT,CASTASVARCHAR(100)||'#'||,

FROMRECURSIVE_TEST_PARA,CITY_JOINB

WHERE=AND=

SELECT,A.CITYFROMCITY_JOINAINNERJOIN

(SELECTUSER_NAME,MAX(R_NUM)R_NUMFROMCITY_JOIN

GROUPBYUSER_NAME)B

ON=AND=

 --结果:

 

王五

北京

李四

杭州#广州

张三

杭州#郑州#南昌

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 院校资料

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1