用SQL SERVER 2005新提供的命令实现行列转换

文/doll-net  出处/博客园

在将一张表里指定的编号(2-4个),按照名称统计编号的数量,仅有一个编号数据的不显示。
模拟表结构如下:
CREATE TABLE TEMP
(
    T_ID    INT,
    T_NAME    NVARCHAR(5)
)

插入一些数据:
INSERT TEMP    SELECT 1,'A'
UNION ALL    SELECT 2,'B'
UNION ALL    SELECT 3,'C'
UNION ALL    SELECT 4,'D'
UNION ALL    SELECT 1,'C'
UNION ALL    SELECT 4,'B'
UNION ALL    SELECT 4,'C'
UNION ALL    SELECT 2,'A'

实际应得到的数据为:
T_ID1      T_ID2      T_ID3      T_ID4      T_NAME
----------- ----------- ----------- ----------- ------
1          1          0          0          A
0          1          0          1          B
1          0          1          1          C

应为编号是给出的,那么得想办法得到符合条件的T_NAME,这样的话需要根据 T_ID和T_NAME分组数据然后将有多个编号的数据过滤出来,这里需要将结果集自连一下,变量表示不可以进行JOIN操作,临时表的话我不大想在这里用,所幸SQL SERVER 2005 提供了一个新的语法 CTE(COMMON TABLE EXPRESSION)公共表表达式,不用创建临时表,并且可以进行JOIN操作,遗憾的是必须紧跟着使用,在后面的语句就不能用了.用CTE实现这个功能:
WITH _TEMP AS
(
    SELECT T_ID,T_NAME FROM TEMP WHERE T_ID IN (1,2,3,4) GROUP BY T_ID,T_NAME
)
SELECT DISTINCT _TEMP.T_NAME FROM _TEMP JOIN _TEMP TEMP_TEMP
    ON _TEMP.T_NAME=TEMP_TEMP.T_NAME WHERE _TEMP.T_ID<>TEMP_TEMP.T_ID

查询的数据为:
T_NAME
------
A
B
C

这样符合条件的T_NAME数据就取出来了,现在定义一个变量,将这个数据组合起来作为条件去取出符合条件的数据:
DECLARE @NAMES NVARCHAR(20)
SET @NAMES = '';
WITH _TEMP AS
(
    SELECT T_ID,T_NAME FROM TEMP WHERE T_ID IN (1,2,3,4) GROUP BY T_ID,T_NAME
)
SELECT @NAMES = @NAMES + '''' + _TEMP.T_NAME + ''',' FROM _TEMP JOIN _TEMP TEMP_TEMP
    ON _TEMP.T_NAME=TEMP_TEMP.T_NAME WHERE _TEMP.T_ID<>TEMP_TEMP.T_ID
SET @NAMES = LEFT(@NAMES,LEN(@NAMES)-1)
EXEC('SELECT T_ID,T_NAME FROM TEMP WHERE T_ID IN (1,2,3,4) AND T_NAME IN ('+@NAMES+')')
--查询出的数据为:
T_ID        T_NAME
----------- ------
1          A
2          B
3          C
1          C
4          B
4          C
2          A

现在需要做的事情就是按T_NAME统计T_ID并实现行列转换,在SQL 2005之前的版本可能需要些CASE语块,如果列数不确定的话就更麻烦了,现在SQL 2005提供了 PIVOT 运算符来实现行列转换,完整的SQL语句:
DECLARE @NAMES NVARCHAR(20)
SET @NAMES = '';
WITH _TEMP AS
(
    SELECT T_ID,T_NAME FROM TEMP WHERE T_ID IN (1,2,3,4) GROUP BY T_ID,T_NAME
)
SELECT @NAMES = @NAMES + '''' + _TEMP.T_NAME + ''',' FROM _TEMP JOIN _TEMP TEMP_TEMP
    ON _TEMP.T_NAME=TEMP_TEMP.T_NAME WHERE _TEMP.T_ID<>TEMP_TEMP.T_ID
SET @NAMES = LEFT(@NAMES,LEN(@NAMES)-1)
DECLARE @EXEC_SQL VARCHAR(1000)
SET @EXEC_SQL =('SELECT [1][T_ID1],[2][T_ID2],[3][T_ID3],[4][T_ID4],T_NAME FROM
(SELECT T_ID,T_NAME FROM TEMP WHERE T_ID IN (1,2,3,4) AND T_NAME IN ('+@NAMES+'))G
PIVOT
(
    COUNT(T_ID)
    FOR T_ID IN ([1],[2],[3],[4])
)P')
EXEC( @EXEC_SQL)

因为符合条件的T_NAME不会很多,所以这里使用 IN 运算符,并用SQL 2005 的一些新特性实现要求。
发送过去后,在真实环境(一百二十多万条数据)执行了下,速度还是很快的。

 感谢原创者的辛勤劳动,希望对您有所帮助,转载请注明原出处。
 您可能对 [SQL Server] 的这些文章也感兴趣:

SQL Server 7.0 入门(六)
Sql server中时间查询的一个比较快的语句
SQL Server 2005数据库开发概述(1)
删除SqlServer发布与复制订阅数据库
SQL Server 2008 中文试用版发布及下载
影响SQL server性能的三个关键
SQL Server 2008中的新语句:MERGE
托管 UDT 使您能够扩展 SQL Server 的类型系统
SQL Server安全规划全攻略
在企业管理器里删除不需要的SQLSERVER注册
拼吾爱变形金刚