PostgreSQL uncest () พร้อมหมายเลของค์ประกอบ


90

เมื่อฉันมีคอลัมน์ที่มีค่าที่แยกจากกันฉันสามารถใช้unnest()ฟังก์ชัน:

myTable
id | elements
---+------------
1  |ab,cd,efg,hi
2  |jk,lm,no,pq
3  |rstuv,wxyz

select id, unnest(string_to_array(elements, ',')) AS elem
from myTable

id | elem
---+-----
1  | ab
1  | cd
1  | efg
1  | hi
2  | jk
...

ฉันจะใส่หมายเลของค์ประกอบได้อย่างไร ได้แก่ :

id | elem | nr
---+------+---
1  | ab   | 1
1  | cd   | 2
1  | efg  | 3
1  | hi   | 4
2  | jk   | 1
...

ฉันต้องการตำแหน่งเดิมของแต่ละองค์ประกอบในสตริงต้นทาง ฉันได้พยายามที่มีฟังก์ชั่นหน้าต่าง ( row_number(), rank()ฯลฯ ) แต่ฉันมักจะได้รับ1แต่ฉันมักจะได้รับ อาจเป็นเพราะอยู่ในแถวเดียวกันของตารางต้นทาง?

ฉันรู้ว่ามันเป็นการออกแบบโต๊ะที่ไม่ดี ไม่ใช่ของฉันฉันแค่พยายามแก้ไข

คำตอบ:


184

Postgres 9.4 หรือใหม่กว่า

ใช้WITH ORDINALITYสำหรับฟังก์ชั่นคืนชุด:

เมื่อมีฟังก์ชั่นในFROMประโยคเป็น suffixed โดยWITH ORDINALITYเป็น bigintคอลัมน์ถูกผนวกเข้ากับการส่งออกซึ่งจะเริ่มตั้งแต่วันที่ 1 และเพิ่มทีละ 1 โดยแถวของการส่งออกฟังก์ชั่นของแต่ละคน สิ่งนี้มีประโยชน์มากที่สุดในกรณีของฟังก์ชันที่ส่งคืนชุดเช่นunnest().

ร่วมกับLATERALคุณสมบัติในหน้า 9.3+และตามหัวข้อนี้ใน pgsql-hackersแบบสอบถามข้างต้นสามารถเขียนเป็น:

SELECT t.id, a.elem, a.nr
FROM   tbl AS t
LEFT   JOIN LATERAL unnest(string_to_array(t.elements, ','))
                    WITH ORDINALITY AS a(elem, nr) ON TRUE;

LEFT JOIN ... ON TRUEรักษาแถวทั้งหมดในตารางด้านซ้ายแม้ว่านิพจน์ตารางไปทางขวาจะไม่ส่งคืนแถวก็ตาม หากไม่มีข้อกังวลใด ๆ คุณสามารถใช้สิ่งนี้เทียบเท่าได้ใช้รูปแบบverbose น้อยกว่าโดยมีนัยCROSS JOIN LATERAL:

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(string_to_array(t.elements, ',')) WITH ORDINALITY a(elem, nr);

หรือง่ายกว่าถ้าขึ้นอยู่กับ อาร์เรย์จริง ( arrเป็นคอลัมน์อาร์เรย์):

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(t.arr) WITH ORDINALITY a(elem, nr);

หรือแม้กระทั่งด้วยไวยากรณ์ขั้นต่ำ:

SELECT id, a, ordinality
FROM   tbl, unnest(arr) WITH ORDINALITY a;

a เป็นตารางโดยอัตโนมัติ นามแฝงของและคอลัมน์ชื่อเริ่มต้นของคอลัมน์ ordinality ordinalityเพิ่มเป็น แต่จะดีกว่า (ปลอดภัยกว่าสะอาดกว่า) ในการเพิ่มชื่อแทนคอลัมน์ที่ชัดเจนและคอลัมน์ที่มีคุณสมบัติตามตาราง

Postgres 8.4 - 9.3

ด้วย row_number() OVER (PARTITION BY id ORDER BY elem)คุณได้รับตัวเลขตามลำดับการจัดเรียงไม่ใช่หมายเลขลำดับของตำแหน่งลำดับเดิมในสตริง

คุณสามารถละเว้นได้ ORDER BY :

SELECT *, row_number() OVER (PARTITION by id) AS nr
FROM  (SELECT id, regexp_split_to_table(elements, ',') AS elem FROM tbl) t;

แม้ว่าสิ่งนี้จะใช้งานได้ตามปกติและฉันไม่เคยเห็นมันล้มเหลวในแบบสอบถามง่ายๆ แต่ PostgreSQL ไม่ได้ยืนยันอะไรเกี่ยวกับลำดับของแถวที่ไม่มี ORDER BYยืนยันไม่มีอะไรที่เกี่ยวข้องกับการสั่งซื้อของแถวโดยไม่ต้อง เกิดขึ้นกับการทำงานเนื่องจากรายละเอียดการใช้งาน

ในการรับประกันจำนวนองค์ประกอบตามลำดับในสตริงที่คั่นว่าง:

SELECT id, arr[nr] AS elem, nr
FROM  (
   SELECT *, generate_subscripts(arr, 1) AS nr
   FROM  (SELECT id, string_to_array(elements, ' ') AS arr FROM tbl) t
   ) sub;

หรือง่ายกว่าถ้าอิงจากอาร์เรย์จริง :

SELECT id, arr[nr] AS elem, nr
FROM  (SELECT *, generate_subscripts(arr, 1) AS nr FROM tbl) t;

คำตอบที่เกี่ยวข้องกับ dba.SE:

Postgres 8.1 - 8.4

RETURNS TABLEไม่มีคุณสมบัติเหล่านี้มีอยู่ยัง: generate_subscripts(), unnest(), array_length(), แต่ใช้งานได้:

CREATE FUNCTION f_unnest_ord(anyarray, OUT val anyelement, OUT ordinality integer)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

โดยเฉพาะอย่างยิ่งดัชนีอาร์เรย์อาจแตกต่างจากตำแหน่งลำดับขององค์ประกอบ พิจารณาการสาธิตนี้พร้อมฟังก์ชั่นเพิ่มเติม :

CREATE FUNCTION f_unnest_ord_idx(anyarray, OUT val anyelement, OUT ordinality int, OUT idx int)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1, i
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

SELECT id, arr, (rec).*
FROM  (
   SELECT *, f_unnest_ord_idx(arr) AS rec
   FROM  (VALUES (1, '{a,b,c}'::text[])  --  short for: '[1:3]={a,b,c}'
               , (2, '[5:7]={a,b,c}')
               , (3, '[-9:-7]={a,b,c}')
      ) t(id, arr)
   ) sub;

 id |       arr       | val | ordinality | idx
----+-----------------+-----+------------+-----
  1 | {a,b,c}         | a   |          1 |   1
  1 | {a,b,c}         | b   |          2 |   2
  1 | {a,b,c}         | c   |          3 |   3
  2 | [5:7]={a,b,c}   | a   |          1 |   5
  2 | [5:7]={a,b,c}   | b   |          2 |   6
  2 | [5:7]={a,b,c}   | c   |          3 |   7
  3 | [-9:-7]={a,b,c} | a   |          1 |  -9
  3 | [-9:-7]={a,b,c} | b   |          2 |  -8
  3 | [-9:-7]={a,b,c} | c   |          3 |  -7

เปรียบเทียบ:


10
คำตอบนี้เป็นหนึ่งในคำตอบที่ครอบคลุมที่สุดใน SO เกี่ยวกับ PostgreSQL ขอบคุณเออร์วิน
Alexandros

เราสามารถปรับฟังก์ชั่นuncest2ด้านล่างเป็นผลตอบแทนตารางจริง (ไม่ใช่แถวปลอม) ในเวอร์ชัน pg ใหม่ได้หรือไม่
Peter Krauss

@ erwin-brandstetter คุณช่วยอธิบายให้ละเอียดว่าทำไม / ถ้าWITH ORDINALITYเป็นที่ต้องการมากกว่าgenerate_subscripts()? สำหรับฉันแล้วดูเหมือนว่าgenerate_subscripts()จะดีกว่าเนื่องจากแสดงตำแหน่งองค์ประกอบจริงในอาร์เรย์ สิ่งนี้มีประโยชน์เช่นเมื่ออัปเดตอาร์เรย์ ... ฉันควรใช้WITH ORDINALITYแทนหรือไม่
losthorse

1
@losthorse: ฉันจะร่างแบบนี้: WITH ORDINALITYเป็นวิธีแก้ปัญหาทั่วไปในการรับหมายเลขแถวสำหรับฟังก์ชันที่ส่งคืนชุดใด ๆในแบบสอบถาม SQL เป็นวิธีที่เร็วและเชื่อถือได้และยังทำงานได้อย่างสมบูรณ์แบบสำหรับอาร์เรย์แบบ 1 มิติที่อิง 1 มิติ (ค่าเริ่มต้นสำหรับอาร์เรย์ Postgres ให้พิจารณาสิ่งนี้ ) หากคุณทำงานกับอาร์เรย์ประเภทอื่น ๆ (คนส่วนใหญ่ไม่ทำ) และคุณจำเป็นต้องเก็บรักษา / ทำงานกับตัวห้อยดั้งเดิมgenerate_subscripts()นั่นคือหนทางที่จะไป แต่unnest()แบนทุกอย่างเพื่อเริ่มต้นด้วย ...
Erwin Brandstetter

1
@ z0r_ The manual: Table functions appearing in FROM can also be preceded by the key word LATERAL, but for functions the key word is optional; the function's arguments can contain references to columns provided by preceding FROM items in any case.
Erwin Brandstetter

9

ลอง:

select v.*, row_number() over (partition by id order by elem) rn from
(select
    id,
    unnest(string_to_array(elements, ',')) AS elem
 from myTable) v

6

ใช้ฟังก์ชั่นห้อยฝ่ายผลิต
http://www.postgresql.org/docs/current/static/functions-srf.html#FUNCTIONS-SRF-SUBSCRIPTS

ตัวอย่างเช่น:

SELECT 
  id
  , elements[i] AS elem
  , i AS nr
FROM
  ( SELECT 
      id
      , elements
      , generate_subscripts(elements, 1) AS i
    FROM
      ( SELECT
          id
          , string_to_array(elements, ',') AS elements
        FROM
          myTable
      ) AS foo
  ) bar
;

เพิ่มเติมง่ายๆ:

SELECT
  id
  , unnest(elements) AS elem
  , generate_subscripts(elements, 1) AS nr
FROM
  ( SELECT
      id
      , string_to_array(elements, ',') AS elements
    FROM
      myTable
  ) AS foo
;

3

หากลำดับขององค์ประกอบไม่สำคัญคุณสามารถทำได้

select 
  id, elem, row_number() over (partition by id) as nr
from (
  select
      id,
      unnest(string_to_array(elements, ',')) AS elem
  from myTable
) a

0

unnest2() เป็นการออกกำลังกาย

รุ่นเก่าก่อน v8.4 PG unnest()ต้องการผู้ใช้กำหนด เราสามารถปรับฟังก์ชันเก่านี้เพื่อส่งคืนองค์ประกอบด้วยดัชนี:

CREATE FUNCTION unnest2(anyarray)
  RETURNS setof record  AS
$BODY$
  SELECT $1[i], i
  FROM   generate_series(array_lower($1,1),
                         array_upper($1,1)) i;
$BODY$ LANGUAGE sql IMMUTABLE;

2
สิ่งนี้จะใช้ไม่ได้ก่อน pg v8.4 เนื่องจากRETURNS TABLEยังไม่มี ฉันเพิ่มบทหนึ่งในคำตอบของฉันเพื่อพูดคุยเกี่ยวกับวิธีแก้ปัญหา
Erwin Brandstetter

1
@ErwinBrandstetter คำตอบของคุณสอนได้ดีมากและคุณกำลังขัดข้อความเมื่อ 4 ปีที่แล้ว (!) ... คุณกำลังเขียนหนังสือ PostgreSQL โดยใช้ข้อความ SO ของคุณหรือไม่? :-)
Peter Krauss

สวัสดีทุกมันเป็นวิกิพีเดียคุณสามารถแก้ไข (!) ... setof recordแต่ตกลงฉันจะได้รับการแก้ไข
Peter Krauss
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.