Sql 根据标识符将两行合并为一行

发布于09月10日

我的数据集如下所示:

LBID	ADDRESS	FI	LI
101	7283	JOHN	SMITH
101	7283	JANE	JONES

由于John和Jane具有相同的LBID和相同的地址，因此我希望输出如下所示:

LBID	ADDRESS	FI	LI	FI2	LI2
101	7283	JOHN	SMITH	JANE	JONES

我在Stack Overflow上判断了类似的问题，但它们都处理具有Null的列.我的没有一个是空的.

我试了STUFF次、STRING_AGG次和JOIN次手术，但都不能达到我想要的效果.我最近的一次try 是:

SELECT LBID, ADDRESS, STRING_AGG(FI, '& ') AS FI, LI
FROM TABLENAME
GROUP BY LBID, ADDRESS, LI

但由于姓氏不同，它仍然将其放在两个不同的行.

你对如何做到这一点有什么 idea 吗？

推荐答案

如果您假设一个最多有两个记录重复的固定模式，则可以使用ROW_NUMBER窗口函数计算重复记录.因为它最多只能取值2(两个重复的值)，所以您可以使用典型的透视方法来解决这个问题，并为每一行提取相应的rownum.

WITH cte AS (
    SELECT *, ROW_NUMBER() OVER(PARTITION BY LBID, ADDRESS ORDER BY FI) AS rn
    FROM tab
)
SELECT LBID, ADDRESS,
       MAX(CASE WHEN rn = 1 THEN FI END) AS FI1,
       MAX(CASE WHEN rn = 1 THEN LI END) AS LI1,
       MAX(CASE WHEN rn = 2 THEN FI END) AS FI2,
       MAX(CASE WHEN rn = 2 THEN LI END) AS LI2
FROM cte
GROUP BY LBID, ADDRESS

查看演示here.

输出:

LBID	ADDRESS	FI	LI	FI2	LI2
101	7283	JOHN	SMITH	JANE	JONES

如果您有2条以上的重复记录，那么在最终的查询中添加更多的Pivotal元素就足够了，并提取耦合的"rn="，如下面的伪代码所示:

WITH cte AS (
    SELECT *, ROW_NUMBER() OVER(PARTITION BY LBID, ADDRESS ORDER BY FI) AS rn
    FROM tab
)
SELECT LBID, ADDRESS,
       MAX(CASE WHEN rn = 1 THEN FI END) AS FI1,
       MAX(CASE WHEN rn = 1 THEN LI END) AS LI1,
       MAX(CASE WHEN rn = 2 THEN FI END) AS FI2,
       MAX(CASE WHEN rn = 2 THEN LI END) AS LI2,
       ...
       ...
       MAX(CASE WHEN rn = <n> THEN FI END) AS FI<n>
       MAX(CASE WHEN rn = <n> THEN LI END) AS LI<n>
FROM cte
GROUP BY LBID, ADDRESS

如果您不知道每个(LBID，地址)最多可以有多少重复记录，则可以运行查询以了解该值:

SELECT TOP(1) COUNT(1) AS cnt
FROM tab
GROUP BY LBID, ADDRESS
ORDER BY cnt DESC

该值将是要提取的几个关键元素的数量:

       MAX(CASE WHEN rn = <n> THEN FI END) AS FI<n>
       MAX(CASE WHEN rn = <n> THEN LI END) AS LI<n>

对于示例表的特定情况，为2(根据第一个查询).

如果每个地址有如此多的重复记录，并且想要一种通用的方法，那么您将转向动态查询.然而，这种方法的性能可能会较差，并且容易出现SQL注入.

Sql相关问答推荐

Select /过滤postgr中的树 struct

Access 365将文本转换回BigInt

Django将字符串筛选为整数？

基于多列比较连接两个表

PostgreSQL：使用JSONB中的字段使用jsonb_to_Records()填充记录

获得第三名或最老的记录

导出部分条形码字符串GS1-128

如何在SQL中从多个查询进行分组

使用与JOIN一起使用的查询后进行分页和排序

在SQL中转换差异表的多列

如何在 SQL Server 中解决这个复杂的窗口查询？

PostgreSQL：从多个字段收集特定指标的最后一个条目

创建具有多个子查询的 SQL 视图

标量子查询中的窗口函数不起作用

使用ALTER TABLE无法删除列

SQL 函数 DIFFERENCE 返回有趣的分数

在 SQL 查询中创建滚动日期

具有日期时间条件的存储过程

PostgreSQL Select 具有两列的自引用

如何刷新在视图之上创建的表

实用课程推荐