sql – 将分隔列拆分为单独表的高效查询

我有一些数据包括一个带有分隔数据的列.基本上在同一列中有多个记录:
A0434168.A2367943.A18456972.A0135374.A0080362.A0084546.A0100991.A0064071.A0100858

值具有可变长度,并以句点分隔.我一直在尝试使用游标为这些数据创建一个查找表.由于数据量大,光标不合理地慢.

我的光标如下所示:

DECLARE @ptr nvarchar(160)
DECLARE @aui nvarchar(15)
DECLARE @getmrhier3 CURSOR 

SET @getmrhier3 = CURSOR FOR
    SELECT  cast(ptr as nvarchar(160)),aui
    FROM    mrhier3
    FORWARD_ONLY
OPEN @getmrhier3
FETCH NEXT
    FROM @getmrhier3 INTO @ptr,@aui

WHILE @@FETCH_STATUS = 0
BEGIN
    if(len(@ptr) > 0)
    begin
        if(charindex('.',@ptr) > 0)
        begin
            insert into mrhierlookup(hieraui,aui)
            values      (substring(@ptr,charindex('.',@ptr)),@aui)

            update  mrhier3
            set     ptr = substring(@ptr,@ptr)+1,LEN(@ptr))
            where   aui = @aui 
              and   ptr = @ptr
        end
        else
        begin
            insert into mrhierlookup(hieraui,aui)
            values      (@ptr,@aui)

            update  mrhier3
            set     ptr = ''
            where   aui = @aui 
              and   ptr = @ptr
        end
    end
    FETCH NEXT
        FROM @getmrhier3 INTO @ptr,@aui
END

CLOSE       @getmrhier3
DEALLOCATE  @getmrhier3

当前版本的游标只适用于列的前导值.所有长度都是任意的.该列最多约150个字符.

使用当前数据集,构建查找表可能需要数天时间.它将有数百万条记录.

是否有更好的方法可以有效地(快速地)将这些数据解析到一个单独的表中,以便更快地执行连接操作?

解决方法

创建拆分功能
CREATE FUNCTION dbo.SplitStrings(@List NVARCHAR(MAX))
RETURNS TABLE
AS
   RETURN ( SELECT Item FROM
       ( SELECT Item = x.i.value('(./text())[1]','nvarchar(max)')
         FROM ( SELECT [XML] = CONVERT(XML,'<i>'
         + REPLACE(@List,'.','</i><i>') + '</i>').query('.')
           ) AS a CROSS APPLY [XML].nodes('i') AS x(i) ) AS y
       WHERE Item IS NOT NULL
   );
GO

然后摆脱所有光标和循环废话并执行此操作:

INSERT dbo.mrhierlookup
(
  heiraui,aui
)
SELECT s.Item,m.aui
  FROM dbo.mrhier3 AS m
  CROSS APPLY dbo.SplitStrings(m.ptr) AS s
GROUP BY s.Item,m.aui;

相关文章

(一)日志传送架构 (1.1)相关服务器 主服务器 :用于生产的服务器,上面运行这生产SQL Server数据库...
(一)事故背景 最近在SQL Server 2012生产数据库上配置完事物复制(发布订阅)后,生产数据库业务出现了...
(一)测试目的 目前公司使用的SQL SERVER 2012高可用环境为主备模式,其中主库可执行读写操作,备库既...
(一)背景个人在使用sql server时,用到了sql server的发布订阅来做主从同步,类似MySQL的异步复制。在...
UNION和OR谓词 找出 product 和 product2 中售价高于 500 的商品的基本信息. select * from product wh...
datawhale组队学习task03