เลือกรายการจากรายการหรือทูเพิลอย่างชัดเจน


121

ฉันมีรายการ Python ต่อไปนี้ (อาจเป็นทูเพิลก็ได้):

myList = ['foo', 'bar', 'baz', 'quux']

ฉันสามารถพูด

>>> myList[0:3]
['foo', 'bar', 'baz']
>>> myList[::2]
['foo', 'baz']
>>> myList[1::2]
['bar', 'quux']

ฉันจะเลือกรายการที่ดัชนีไม่มีรูปแบบเฉพาะเจาะจงได้อย่างไร [0,2,3]ตัวอย่างเช่นผมต้องการที่จะเลือก หรือจากรายการใหญ่มากของ 1000 [87, 342, 217, 998, 500]รายการฉันต้องการที่จะเลือก มีไวยากรณ์ Python บางตัวที่ทำเช่นนั้นหรือไม่? สิ่งที่ดูเหมือน:

>>> myBigList[87, 342, 217, 998, 500]

1
สิ่งนี้ดูเหมือนจะซ้ำกัน คำถามอื่นมีคะแนนโหวตมากกว่า แต่ดูเหมือนว่าจะมีคำตอบที่ดีกว่าพร้อมเวลา
AnnanFay

คำตอบ:


151
list( myBigList[i] for i in [87, 342, 217, 998, 500] )

ฉันเปรียบเทียบคำตอบกับ python 2.5.2:

  • 19.7 usec: [ myBigList[i] for i in [87, 342, 217, 998, 500] ]

  • 20.6 usec: map(myBigList.__getitem__, (87, 342, 217, 998, 500))

  • 22.7 usec: itemgetter(87, 342, 217, 998, 500)(myBigList)

  • 24.6 usec: list( myBigList[i] for i in [87, 342, 217, 998, 500] )

โปรดทราบว่าใน Python 3 ตัวที่ 1 ถูกเปลี่ยนเป็นตัวที่ 4


อีกทางเลือกหนึ่งคือการเริ่มต้นด้วยnumpy.arrayซึ่งอนุญาตให้สร้างดัชนีผ่านรายการหรือnumpy.array:

>>> import numpy
>>> myBigList = numpy.array(range(1000))
>>> myBigList[(87, 342, 217, 998, 500)]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: invalid index
>>> myBigList[[87, 342, 217, 998, 500]]
array([ 87, 342, 217, 998, 500])
>>> myBigList[numpy.array([87, 342, 217, 998, 500])]
array([ 87, 342, 217, 998, 500])

tupleไม่ทำงานวิธีการเช่นเดียวกับผู้ที่มีชิ้น


2
ดีกว่าเป็นลิสต์คอมพ์[myBigList[i] for i in [87, 342, 217, 998, 500]]แต่ฉันชอบแนวทางนี้ที่สุด
zeekay

@MedhatHelmy นั่นอยู่ในคำตอบแล้ว ตัวเลือกที่สามที่ใช้from operator import itemgetterในส่วนการเริ่มต้นของpython -mtimeit.
Dan D.

ฉันสงสัยว่าจากมุมมองของการออกแบบภาษาทำไมmyBigList[(87, 342, 217, 998, 500)]ไม่ทำงานเมื่อmyBigListpython ปกติlist? TypeError: list indices must be integers or slices, not tupleเมื่อฉันพยายามที่ฉันได้รับ นั่นจะง่ายกว่าการพิมพ์ความเข้าใจ - มีปัญหาการออกแบบ / การใช้งานภาษาที่เกี่ยวข้องหรือไม่?
sparc_spread

@sparc_spread เนื่องจากlistsใน Python ยอมรับเฉพาะจำนวนเต็มหรือชิ้นส่วนเท่านั้น การส่งจำนวนเต็มทำให้แน่ใจว่ามีการดึงข้อมูลเพียงรายการเดียวจากรายการที่มีอยู่ การส่งผ่านชิ้นส่วนทำให้แน่ใจว่ามีการดึงข้อมูลบางส่วน แต่การส่งทูเพิลก็เหมือนกับการส่ง data-type ( tuple) เป็นอาร์กิวเมนต์ไปยัง data-type ( list) อื่นซึ่งไม่ถูกต้องทางไวยากรณ์
amanb

48

แล้วสิ่งนี้:

from operator import itemgetter
itemgetter(0,2,3)(myList)
('foo', 'baz', 'quux')

2
เซ็กซี่ที่สุดเท่าที่ผ่านมา รักoperatorโมดูลนั้น!
jathanism

10

มันไม่ได้อยู่ในตัว แต่คุณสามารถสร้างคลาสย่อยของรายการที่ใช้ tuples เป็น "ดัชนี" ได้หากคุณต้องการ:

class MyList(list):

    def __getitem__(self, index):
        if isinstance(index, tuple):
            return [self[i] for i in index]
        return super(MyList, self).__getitem__(index)


seq = MyList("foo bar baaz quux mumble".split())
print seq[0]
print seq[2,4]
print seq[1::2]

การพิมพ์

foo
['baaz', 'mumble']
['bar', 'quux']

2
(+1) วิธีแก้ปัญหาเรียบร้อย! ด้วยส่วนขยายนี้การจัดการอาร์เรย์ใน Python จะเริ่มมีลักษณะ R หรือ Matlab มาก
Assad Ebrahim

7

ความเข้าใจในรายการอาจเป็นไปตามลำดับ:

L = ['a', 'b', 'c', 'd', 'e', 'f']
print [ L[index] for index in [1,3,5] ]

ผลิต:

['b', 'd', 'f']

นั่นคือสิ่งที่คุณกำลังมองหา?


6
>>> map(myList.__getitem__, (2,2,1,3))
('baz', 'baz', 'bar', 'quux')

นอกจากนี้คุณยังสามารถสร้างของคุณเองListชั้นที่สนับสนุน tuples เป็นข้อโต้แย้งที่จะถ้าคุณต้องการที่จะสามารถที่จะทำ__getitem__myList[(2,2,1,3)]


แม้ว่าวิธีนี้จะได้ผล แต่ก็ไม่ควรเรียกใช้ตัวแปรเวทย์มนตร์โดยตรง operatorคุณดีกว่าการใช้ความเข้าใจรายการหรือโมดูลผู้ช่วยเช่น
jathanism

@jathanism: ฉันไม่เห็นด้วยด้วยความเคารพ แม้ว่าคุณจะกังวลเกี่ยวกับความเข้ากันได้ของการส่งต่อ (ในทางตรงกันข้ามกับสาธารณะ / ส่วนตัว) ฉันสามารถเห็นได้อย่างแน่นอนว่าคุณมาจากไหน
ninjagecko

นั่นคือที่มาของฉัน :) หลังจากนั้นก็ด้วยเหตุผลเดียวกันว่าทำไมมันจะดีกว่าที่จะใช้มากกว่าlen(myList) myList.__len__()
jathanism

วิธีแก้ปัญหาที่สร้างสรรค์ฉันไม่คิดว่าการเรียกใช้ตัวแปรเวทย์มนตร์เป็นความคิดที่ดี โปรแกรมเมอร์เลือกวิธีที่ต้องการตามสถานการณ์การเขียนโปรแกรม
Jacob CUI

2

ฉันแค่อยากจะชี้ให้เห็นว่าแม้แต่ไวยากรณ์ของ itemgetter ก็ดูเรียบร้อย แต่มันค่อนข้างช้าเมื่อแสดงในรายการขนาดใหญ่

import timeit
from operator import itemgetter
start=timeit.default_timer()
for i in range(1000000):
    itemgetter(0,2,3)(myList)
print ("Itemgetter took ", (timeit.default_timer()-start))

Itemgetter เอา 1.065209062149279

start=timeit.default_timer()
for i in range(1000000):
    myList[0],myList[2],myList[3]
print ("Multiple slice took ", (timeit.default_timer()-start))

หลายชิ้นใช้เวลา 0.6225321444745759


ตัวอย่างแรกโปรดเพิ่มmyList = np.array(range(1000000))มิฉะนั้นคุณจะได้รับข้อผิดพลาด
Cloud Cho

1

อีกวิธีที่เป็นไปได้:

sek=[]
L=[1,2,3,4,5,6,7,8,9,0]
for i in [2, 4, 7, 0, 3]:
   a=[L[i]]
   sek=sek+a
print (sek)

0

เช่นเดียวกับเมื่อคุณมีอาร์เรย์ตัวเลขบูลีนเช่น mask

[mylist[i] for i in np.arange(len(mask), dtype=int)[mask]]

แลมบ์ดาที่ใช้ได้กับลำดับใด ๆ หรือ np.array:

subseq = lambda myseq, mask : [myseq[i] for i in np.arange(len(mask), dtype=int)[mask]]

newseq = subseq(myseq, mask)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.