เรียงลำดับรายการตามค่าจากรายการอื่นหรือไม่


369

ฉันมีรายการสตริงเช่นนี้

X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,   0,   1,   2,   2,   0,   1 ]

วิธีที่สั้นที่สุดในการเรียงลำดับ X โดยใช้ค่าจาก Y เพื่อรับเอาต์พุตต่อไปนี้คืออะไร

["a", "d", "h", "b", "c", "e", "i", "f", "g"]

ลำดับขององค์ประกอบที่มี "คีย์" เหมือนกันไม่สำคัญ ฉันสามารถใช้forงานโครงสร้าง แต่ฉันอยากรู้ว่ามีวิธีที่สั้นกว่านี้หรือไม่ ข้อเสนอแนะใด ๆ


คำตอบของ riza อาจเป็นประโยชน์เมื่อทำการพล็อตข้อมูลเนื่องจาก zip (* sort (zip (X, Y), key = lambda pair: pair [0])) ส่งคืนทั้ง X ที่เรียงลำดับและ Y ที่เรียงลำดับด้วยค่า X.
jojo

คำตอบ:


479

รหัสที่สั้นที่สุด

[x for _,x in sorted(zip(Y,X))]

ตัวอย่าง:

X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,    0,   1,   2,   2,   0,   1]

Z = [x for _,x in sorted(zip(Y,X))]
print(Z)  # ["a", "d", "h", "b", "c", "e", "i", "f", "g"]

พูด, พูดแบบทั่วไป, พูดทั่วๆไป

[x for _, x in sorted(zip(Y,X), key=lambda pair: pair[0])]

อธิบาย:

  1. zip ทั้งสอง list s
  2. สร้างใหม่เรียงlistตามการzipใช้sorted()การใช้
  3. โดยใช้ความเข้าใจรายการแยกlistองค์ประกอบแรกของแต่ละคู่จากเรียงซิป

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีการตั้งค่า \ ใช้keyพารามิเตอร์เช่นเดียวกับsortedฟังก์ชั่นโดยทั่วไปจะดูที่นี้



117
สิ่งนี้ถูกต้อง แต่ฉันจะเพิ่มหมายเหตุว่าหากคุณพยายามเรียงลำดับหลายอาร์เรย์ด้วยอาร์เรย์เดียวกันสิ่งนี้จะไม่ทำงานตามที่คาดไว้เนื่องจากคีย์ที่ใช้ในการเรียงลำดับคือ (y, x) ไม่ใช่แค่ y คุณควรใช้ [x สำหรับ (y, x) ในการเรียงลำดับ (zip (Y, X), key = lambda pair: pair [0])]
gms7777

1
ทางออกที่ดี! แต่มันควรจะเป็น: รายการถูกจัดเรียงเกี่ยวกับองค์ประกอบแรกของคู่และความเข้าใจแยกองค์ประกอบ 'สอง' ของคู่
MasterControlProgram

วิธีการแก้ปัญหานี้ไม่ดีเมื่อมันมาถึงการจัดเก็บ การเรียงลำดับในสถานที่เป็นที่ต้องการเมื่อทำได้
Hatefiend

107

ซิปรายการทั้งสองเข้าด้วยกันเรียงลำดับจากนั้นนำชิ้นส่วนที่คุณต้องการ:

>>> yx = zip(Y, X)
>>> yx
[(0, 'a'), (1, 'b'), (1, 'c'), (0, 'd'), (1, 'e'), (2, 'f'), (2, 'g'), (0, 'h'), (1, 'i')]
>>> yx.sort()
>>> yx
[(0, 'a'), (0, 'd'), (0, 'h'), (1, 'b'), (1, 'c'), (1, 'e'), (1, 'i'), (2, 'f'), (2, 'g')]
>>> x_sorted = [x for y, x in yx]
>>> x_sorted
['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']

รวมสิ่งเหล่านี้เข้าด้วยกันเพื่อรับ:

[x for y, x in sorted(zip(Y, X))]

1
นี่เป็นเรื่องปกติหากXเป็นรายการstrแต่ควรระวังหากมีความเป็นไปได้ที่<ไม่ได้กำหนดไว้สำหรับบางรายการXเช่นถ้าบางรายการเป็นNone
John La Rooy

1
เมื่อเราพยายามที่จะใช้การเรียงลำดับเหนือวัตถุซิปAttributeError: 'zip' object has no attribute 'sort'เป็นสิ่งที่ฉันได้รับในขณะนี้
Ash Upadhyay

2
คุณกำลังใช้ Python 3 ใน Python 2 zip สร้างรายการ ตอนนี้มันสร้างวัตถุที่ซ้ำได้ sorted(zip(...))ควรทำงานหรือ: them = list(zip(...)); them.sort()
เน็ดแบทเชลเดอร์

77

นอกจากนี้ถ้าคุณไม่สนใจการใช้อาร์เรย์ numpy (หรืออันที่จริงแล้วกำลังจัดการกับ numpy arrays ... ) นี่เป็นอีกวิธีที่ดี:

people = ['Jim', 'Pam', 'Micheal', 'Dwight']
ages = [27, 25, 4, 9]

import numpy
people = numpy.array(people)
ages = numpy.array(ages)
inds = ages.argsort()
sortedPeople = people[inds]

ฉันพบมันที่นี่: http://scienceoss.com/sort-one-list-by-another-list/


1
สำหรับอาร์เรย์ / เวกเตอร์ที่ใหญ่กว่าการแก้ปัญหาด้วย numpy นี้จะเป็นประโยชน์!
MasterControlProgram

1
หากพวกเขาเป็นอาร์เรย์ numpy sortedArray1= array1[array2.argsort()]อยู่แล้วมันก็ และสิ่งนี้ยังทำให้ง่ายต่อการเรียงลำดับรายการหลายรายการโดยคอลัมน์เฉพาะของอาร์เรย์ 2D: เช่นsortedArray1= array1[array2[:,2].argsort()]เรียงลำดับ array1 (ซึ่งอาจมีหลายคอลัมน์) ด้วยค่าในคอลัมน์ที่สามของอาร์เรย์ 2
Aaron Bramson

40

ทางออกที่ชัดเจนที่สุดสำหรับฉันคือการใช้keyคำหลักหาเรื่อง

>>> X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
>>> Y = [ 0,   1,   1,    0,   1,   2,   2,   0,   1]
>>> keydict = dict(zip(X, Y))
>>> X.sort(key=keydict.get)
>>> X
['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']

โปรดทราบว่าคุณสามารถย่อให้เหลือหนึ่งบรรทัดหากคุณต้องการ:

>>> X.sort(key=dict(zip(X, Y)).get)

2
สิ่งนี้ต้องการให้ค่าใน X เป็นจริงหรือไม่?
Jack Peng

15

ที่จริงฉันมาที่นี่เพื่อค้นหารายการตามรายการที่ตรงกับค่า

list_a = ['foo', 'bar', 'baz']
list_b = ['baz', 'bar', 'foo']
sorted(list_b, key=lambda x: list_a.index(x))
# ['foo', 'bar', 'baz']

1
นักแสดงคนนี้หรือไม่
AFP_555

ไม่มีเงื่อนงำ รายงานสิ่งที่คุณค้นหากลับมา
nackjicholson

1
นี่เป็นความคิดที่ไม่ดี indexจะทำการค้นหาO (N)ในlist_aผลลัพธ์ในการO(N² log N)เรียงลำดับ
Richard

ขอบคุณอย่าทำสิ่งนี้เมื่อเรื่องสำคัญ!
nackjicholson

15

more_itertools มีเครื่องมือสำหรับการเรียงลำดับ iterables แบบขนาน:

ป.ร. ให้ไว้

from more_itertools import sort_together


X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,    0,   1,   2,   2,   0,   1]

การสาธิต

sort_together([Y, X])[1]
# ('a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g')

13

ฉันชอบรายการดัชนีที่เรียงลำดับแล้ว ด้วยวิธีนี้ฉันสามารถเรียงลำดับรายการใด ๆ ในลำดับเดียวกันกับรายการแหล่งที่มา เมื่อคุณมีรายการดัชนีที่เรียงลำดับแล้วความเข้าใจในรายการแบบง่าย ๆ จะทำการหลอกลวง

X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,    0,   1,   2,   2,   0,   1]

sorted_y_idx_list = sorted(range(len(Y)),key=lambda x:Y[x])
Xs = [X[i] for i in sorted_y_idx_list ]

print( "Xs:", Xs )
# prints: Xs: ["a", "d", "h", "b", "c", "e", "i", "f", "g"]

โปรดทราบว่าสามารถใช้รายการดัชนีที่เรียงลำดับnumpy.argsort()ได้


12

อีกทางเลือกหนึ่งรวมหลายคำตอบ

zip(*sorted(zip(Y,X)))[1]

ในการทำงานกับ python3:

list(zip(*sorted(zip(B,A))))[1]

7

zip, เรียงลำดับตามคอลัมน์ที่สองกลับคอลัมน์แรก

zip(*sorted(zip(X,Y), key=operator.itemgetter(1)))[0]

หมายเหตุ: key = operator.itemgetter (1) แก้ปัญหาที่ซ้ำกัน
Keith

zip ไม่สามารถถอดรหัสได้ ... คุณต้องใช้จริงlist(zip(*sorted(zip(X,Y), key=operator.itemgetter(1))))[0]
ฟาเอล

@Keith ปัญหาที่ซ้ำกันคืออะไร?
Josh

หากมีมากกว่าหนึ่งการจับคู่มันจะได้รับเป็นครั้งแรก
Keith

3

ซับหนึ่งที่รวดเร็ว

list_a = [5,4,3,2,1]
list_b = [1,1.5,1.75,2,3,3.5,3.75,4,5]

สมมติว่าคุณต้องการรายการ a เพื่อให้ตรงกับรายการ b.

orderedList =  sorted(list_a, key=lambda x: list_b.index(x))

สิ่งนี้มีประโยชน์เมื่อต้องการสั่งให้รายการเล็ก ๆ มีค่ามากขึ้น สมมติว่ารายการขนาดใหญ่มีค่าทั้งหมดในรายการขนาดเล็กก็สามารถทำได้


นี่ไม่ได้แก้คำถามของ OP คุณลองกับตัวอย่างรายการXและY?
Aryeh Leib Taurog

นี่เป็นความคิดที่ไม่ดี indexจะทำการค้นหาO (N)ในlist_bผลลัพธ์ในการO(N² log N)เรียงลำดับ
Richard

1

คุณสามารถสร้าง a pandas Seriesโดยใช้รายการหลักเป็นdataและรายการอื่นเป็นindexแล้วก็เรียงลำดับตามดัชนี:

import pandas as pd
pd.Series(data=X,index=Y).sort_index().tolist()

เอาท์พุท:

['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']

1

นี่คือคำตอบอะไรถ้าคุณต้องการรับทั้งสองรายการเรียง (python3)

X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,    0,   1,   2,   2,   0,   1]

Zx, Zy = zip(*[(x, y) for x, y in sorted(zip(Y, X))])

print(list(Zx))  # [0, 0, 0, 1, 1, 1, 1, 2, 2]
print(list(Zy))  # ['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']

เพิ่งจำได้ว่า Zx และ Zy เป็นสิ่งอันดับ ฉันกำลังหลงทางถ้ามีวิธีที่ดีกว่าในการทำเช่นนั้น

คำเตือน:หากคุณรันรายการที่ว่างเปล่ามันจะขัดข้อง


1

ฉันได้สร้างฟังก์ชั่นทั่วไปมากขึ้นซึ่งเรียงลำดับรายการมากกว่าสองรายการจากอีกรายการหนึ่งซึ่งได้แรงบันดาลใจจากคำตอบของ @ Whatang

def parallel_sort(*lists):
    """
    Sorts the given lists, based on the first one.
    :param lists: lists to be sorted

    :return: a tuple containing the sorted lists
    """

    # Create the initially empty lists to later store the sorted items
    sorted_lists = tuple([] for _ in range(len(lists)))

    # Unpack the lists, sort them, zip them and iterate over them
    for t in sorted(zip(*lists)):
        # list items are now sorted based on the first list
        for i, item in enumerate(t):    # for each item...
            sorted_lists[i].append(item)  # ...store it in the appropriate list

    return sorted_lists

0
list1 = ['a','b','c','d','e','f','g','h','i']
list2 = [0,1,1,0,1,2,2,0,1]

output=[]
cur_loclist = []

เพื่อรับค่าที่ไม่ซ้ำกันอยู่ใน list2

list_set = set(list2)

เพื่อหาตำแหน่งของดัชนีใน list2

list_str = ''.join(str(s) for s in list2)

ตำแหน่งของดัชนีใน list2มีการติดตามcur_loclist

[0, 3, 7, 1, 2, 4, 8, 5, 6]

for i in list_set:
cur_loc = list_str.find(str(i))

while cur_loc >= 0:
    cur_loclist.append(cur_loc)
    cur_loc = list_str.find(str(i),cur_loc+1)

print(cur_loclist)

for i in range(0,len(cur_loclist)):
output.append(list1[cur_loclist[i]])
print(output)

0

นี่เป็นคำถามเก่า แต่คำตอบบางอย่างที่ฉันเห็นโพสต์ไม่ได้ผลจริงเพราะzipไม่สามารถเขียนสคริปต์ได้ คำตอบอื่น ๆ ไม่ได้ใส่ใจimport operatorและให้ข้อมูลเพิ่มเติมเกี่ยวกับโมดูลนี้และประโยชน์ที่ได้รับที่นี่

มีสำนวนที่ดีอย่างน้อยสองประการสำหรับปัญหานี้ เริ่มต้นด้วยอินพุตตัวอย่างที่คุณให้ไว้:

X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,   0,   1,   2,   2,   0,   1 ]

ใช้สำนวน" Decorate-Sort-Undecorate "

สิ่งนี้เป็นที่รู้จักกันในชื่อSchwartzian_transformหลังจากR. Schwartzซึ่งเป็นที่นิยมในรูปแบบนี้ใน Perl ใน 90s:

# Zip (decorate), sort and unzip (undecorate).
# Converting to list to script the output and extract X
list(zip(*(sorted(zip(Y,X)))))[1]                                                                                                                       
# Results in: ('a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g')

โปรดทราบว่าในกรณีนี้YและXมีการจัดเรียงและเปรียบเทียบพจนานุกรม นั่นคือรายการแรก (จากY) มีการเปรียบเทียบ; และหากเป็นเหมือนกันรายการที่สอง (จากX) จะถูกเปรียบเทียบและอื่น ๆ สิ่งนี้สามารถสร้างความไม่แน่นอนเอาท์พุทที่เว้นแต่ว่าคุณได้รวมดัชนีรายการดั้งเดิมสำหรับการเรียงลำดับพจนานุกรมเพื่อให้ซ้ำกันในลำดับเดิม

การใช้งานoperatorโมดูล

สิ่งนี้ช่วยให้คุณควบคุมวิธีเรียงลำดับอินพุตได้โดยตรงมากขึ้นเพื่อให้คุณสามารถรับความเสถียรในการเรียงลำดับโดยเพียงระบุคีย์เฉพาะเพื่อเรียงลำดับ ดูตัวอย่างเพิ่มเติมที่นี่

import operator    

# Sort by Y (1) and extract X [0]
list(zip(*sorted(zip(X,Y), key=operator.itemgetter(1))))[0]                                                                                                 
# Results in: ('a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g')
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.