mysql – 如何通过多个元组(行)找到共享一个属性(列)的对?

我试图在这个简化的例子中找到喜欢同一组电视节目的用户

假设我有一张桌子,每个用户都可以获得他们喜欢的每个电视节目的参赛作品:

|USER | Show        |
|-----|-------------|
|001  | Lost        |
|001  | South Park  |
|002  | Lost        |
|003  | Lost        |
|003  | South Park  |
|004  | South Park  |
|005  | Lost        |
|006  | Lost        |

然后我想得到一个结果:

|USER1 |USER2 |
|------|------|
|001   |003   |
|003   |001   |
|002   |005   |
|002   |006   |
|005   |002   |
|005   |006   |
|006   |002   |
|006   |005   |

或者更好的版本是:

|USER1 |USER2 |
|------|------|
|001   |003   |
|002   |005   |
|002   |006   |
|005   |006   |

基本上说:用户1喜欢与用户3相同的节目集.

我一直在玩GROUP BY和JOIN,但我仍然找不到答案:(.

到目前为止,我发现使用了

SELECT s1.User as USER1,s2.User as USER2,s1.Show as Show 
FROM Shows s1 JOIN (SELECT * FROM Shows) s2 
ON s1.Shows=s2.Shows AND s1.User!=s2.User;

这产生了成对的用户和他们共同的展示.但我不知道从哪里开始.

最佳答案
如果您可以接受CSV而不是列表结果,则可以简单地将表分组两次:

SELECT GROUP_CONCAT(User) FROM (
  SELECT   User,GROUP_CONCAT(DISTINCT `Show` ORDER BY `Show` SEPARATOR 0x1e) AS s
  FROM     Shows
  GROUP BY User
) t GROUP BY s

否则,您可以将以上子查询加入到自身:

SELECT DISTINCT LEAST(t.User,u.User) AS User1,GREATEST(t.User,u.User) AS User2
FROM (
  SELECT   User,GROUP_CONCAT(DISTINCT `Show` ORDER BY `Show` SEPARATOR 0x1e) AS s
  FROM     Shows
  GROUP BY User
) t JOIN (
  SELECT   User,GROUP_CONCAT(DISTINCT `Show` ORDER BY `Show` SEPARATOR 0x1e) AS s
  FROM     Shows
  GROUP BY User
) u USING (s)
WHERE t.User <> u.User

sqlfiddle上看到它们.

当然,如果保证在Shows表中不存在重复(User,Show)对,则可以通过从GROUP_CONCAT()聚合中删除DISTINCT关键字来提高性能.

相关文章

昨天的考试过程中,有个考点的服务器蓝屏重启后发现Mysql启动不了(5.6.45 x32版本,使用innoDB),重装后...
整数类型 标准 SQL 中支持 INTEGER 和 SMALLINT 这两种类型,MySQL 数据库除了支持这两种类型以外,还扩...
一条 SQL 查询语句结构如下: SELECT DISTINCT &lt;select_list&gt; FROM &lt;left_table&...
数据备份 1. 备份数据库 使用 mysqldump 命令可以将数据库中的数据备份成一个文本文件,表的结构和数据...
概述 在实际工作中,在关系数据库(MySQL、PostgreSQL)的单表数据量上亿后,往往会出现查询和分析变慢...
概述 触发器是 MySQL 的数据库对象之一,不需要程序调用或手工启动,而是由事件来触发、激活,从而实现...