myTable id | elements ---+------------ 1 |ab,cd,efg,hi 2 |jk,lm,no,pq 3 |rstuv,wxyz select id,unnest(string_to_array(elements,',')) AS elem from myTable id | elem ---+----- 1 | ab 1 | cd 1 | efg 1 | hi 2 | jk ...@H_403_2@如何包含元素编号?也就是说:
id | elem | nr ---+------+--- 1 | ab | 1 1 | cd | 2 1 | efg | 3 1 | hi | 4 2 | jk | 1 ...@H_403_2@我想要源字符串中每个元素的原始位置。我试过与窗口函数(row_number(),rank()等),但我总是得到1.也许是因为他们在源表的同一行?
我知道这是一个坏的表设计。这不是我的,我只是试图解决它。
使用WITH ORDINALITY
设置返回功能:
When a function in the
FROM
clause is suffixed byWITH ORDINALITY
,a
bigint
column is appended to the output which starts from 1 and
increments by 1 for each row of the function’s output. This is most
useful in the case of set returning functions such asUNNEST()
.
结合LATERAL
feature in pg 9.3+,并根据这个thread on pgsql-hackers,上面的查询现在可以写成:
SELECT t.id,a.elem,a.nr FROM tbl AS t LEFT JOIN LATERAL unnest(string_to_array(t.elements,')) WITH ORDINALITY AS a(elem,nr) ON TRUE;@H_403_2@LEFT JOIN … ON TRUE保留左表中的所有行,即使右表的表达式没有返回任何行。如果这是没有关系,你可以使用这个另外等价,更简洁的形式与隐式CROSS JOIN LATERAL:
SELECT t.id,a.nr FROM tbl t,unnest(string_to_array(t.elements,')) WITH ORDINALITY a(elem,nr);@H_403_2@或者更简单如果基于实际数组(arr是数组列):
SELECT t.id,unnest(t.arr) WITH ORDINALITY a(elem,nr);@H_403_2@甚至,用最小的语法:
SELECT id,a,ordinality FROM tbl,unnest(arr) WITH ORDINALITY a;@H_403_2@a是自动的表和列别名。添加的序数列的默认名称为ordinality。但是添加显式列别名和表格限定列会更好(更安全,更清晰)。
Postgres 8.4 – 9.3
使用row_number()OVER(PARTITION BY id ORDER BY elem),您可以根据排序顺序获取数字,而不是字符串中原始序数位置的序数。
你可以简单地省略ORDER BY:
SELECT *,row_number() OVER (PARTITION by id) AS nr FROM (SELECT id,regexp_split_to_table(elements,') AS elem FROM tbl) t;@H_403_2@虽然这通常工作,我从来没有看到它在简单的查询中断,Postgresql断言没有关于没有ORDER BY的行的顺序。它恰好工作,由于实施细节。
要保证空白分隔字符串中元素的序数:
SELECT id,arr[nr] AS elem,nr FROM ( SELECT *,generate_subscripts(arr,1) AS nr FROM (SELECT id,string_to_array(elements,' ') AS arr FROM tbl) t ) sub;@H_403_2@或者更简单如果基于一个实际的数组:
SELECT id,nr FROM (SELECT *,generate_subscripts(arr,1) AS nr FROM tbl) t;@H_403_2@相关回答dba.SE:
> How to preserve the original order of elements in an unnested array?
Postgres 8.1 – 8.4
这些功能都不可用,但是:
RETURNS TABLE
,generate_subscripts()
,unnest()
,array_length()
。
但这工作:CREATE FUNCTION f_unnest_ord(anyarray,OUT val anyelement,OUT ordinality integer) RETURNS SETOF record LANGUAGE sql IMMUTABLE AS 'SELECT $1[i],i - array_lower($1,1) + 1 FROM generate_series(array_lower($1,1),array_upper($1,1)) i';@H_403_2@特别注意,数组索引可以不同于元素的序数位置。考虑这个演示具有扩展功能:
CREATE FUNCTION f_unnest_ord_idx(anyarray,OUT ordinality int,OUT idx int) RETURNS SETOF record LANGUAGE sql IMMUTABLE AS 'SELECT $1[i],1) + 1,i FROM generate_series(array_lower($1,1)) i'; SELECT id,arr,(rec).* FROM ( SELECT *,f_unnest_ord_idx(arr) AS rec FROM (VALUES (1,'{a,b,c}'::text[]) -- short for: '[1:3]={a,c}',(2,'[5:7]={a,c}'),(3,'[-9:-7]={a,c}') ) t(id,arr) ) sub; id | arr | val | ordinality | idx ----+-----------------+-----+------------+----- 1 | {a,c} | a | 1 | 1 1 | {a,c} | b | 2 | 2 1 | {a,c} | c | 3 | 3 2 | [5:7]={a,c} | a | 1 | 5 2 | [5:7]={a,c} | b | 2 | 6 2 | [5:7]={a,c} | c | 3 | 7 3 | [-9:-7]={a,c} | a | 1 | -9 3 | [-9:-7]={a,c} | b | 2 | -8 3 | [-9:-7]={a,c} | c | 3 | -7@H_403_2@比较:
> Normalize array subscripts for 1-dimensional array so they start with 1