ค้นหาจุดตัดของสองรายการซ้อนกันหรือไม่


468

ฉันรู้วิธีรับสี่แยกรายการแบน:

b1 = [1,2,3,4,5,9,11,15]
b2 = [4,5,6,7,8]
b3 = [val for val in b1 if val in b2]

หรือ

def intersect(a, b):
    return list(set(a) & set(b))

print intersect(b1, b2)

แต่เมื่อฉันต้องค้นหาทางแยกสำหรับรายการซ้อนกันปัญหาของฉันเริ่มต้น:

c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

ในที่สุดฉันต้องการได้รับ:

c3 = [[13,32],[7,13,28],[1,6]]

พวกคุณเอามือนี้ให้ฉันได้ไหม

ที่เกี่ยวข้อง


จุดตัดของคุณจะเป็นอะไรสำหรับ c1 intersect c2 คุณต้องการที่จะพบว่า c1 อยู่ใน c2 หรือไม่? หรือคุณต้องการค้นหาองค์ประกอบทั้งหมดใน c1 ที่ปรากฏที่ใดก็ได้ใน c2?
Brian R. Bondy

อ่านนี้และเล่นในล่าม
Pithikos

คำตอบ:


177

ถ้าคุณต้องการ:

c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
c3 = [[13, 32], [7, 13, 28], [1,6]]

ต่อไปนี้เป็นวิธีแก้ปัญหาสำหรับ Python 2:

c3 = [filter(lambda x: x in c1, sublist) for sublist in c2]

ใน Python 3 filterคืนค่า iterable แทนlistดังนั้นคุณต้องล้อมfilterสายด้วยlist():

c3 = [list(filter(lambda x: x in c1, sublist)) for sublist in c2]

คำอธิบาย:

ส่วนตัวกรองจะนำรายการของแต่ละรายการย่อยและตรวจสอบเพื่อดูว่าอยู่ในรายการแหล่งที่มา c1 หรือไม่ รายการความเข้าใจถูกดำเนินการสำหรับแต่ละรายการย่อยใน c2


35
คุณสามารถใช้filter(set(c1).__contains__, sublist)เพื่อประสิทธิภาพ btw ข้อดีของการแก้ปัญหานี้คือการfilter()รักษาประเภทของสตริงและทูเปิล
jfs

3
ฉันชอบวิธีนี้ แต่ฉันว่างเปล่า '' ในรายการผลลัพธ์ของฉัน
Jonathan Ong

ฉันได้เพิ่ม Python 3 compat ไว้ที่นี่เนื่องจากฉันใช้สิ่งนี้เป็นเป้าหมายของ dupe สำหรับคำถามของ Python 3
Antti Haapala

9
สิ่งนี้จะเป็นการอ่าน IMO ที่ดีขึ้นด้วยความเข้าใจที่ซ้อนกัน:c3 = [[x for x in sublist if x in c1] for sublist in c2]
เอริค

894

คุณไม่จำเป็นต้องกำหนดจุดตัด มันเป็นส่วนหนึ่งของชุดแล้ว

>>> b1 = [1,2,3,4,5,9,11,15]
>>> b2 = [4,5,6,7,8]
>>> set(b1).intersection(b2)
set([4, 5])

3
สิ่งนี้จะช้ากว่าแลมบ์ดาเนื่องจากมีการแปลงเป็นชุดหรือไม่
Ciro Santilli 郝海东冠状病六四事件法轮功

32
@ S.Lott มีอะไรผิดปกติกับset(b1) & set(b2)? IMO มันทำความสะอาดเพื่อใช้ผู้ประกอบการ
gwg

4
นอกจากนี้การใช้setจะนำไปสู่รหัสที่มีขนาดของคำสั่งเร็วขึ้น นี่คือตัวอย่างเกณฑ์มาตรฐาน: gist.github.com/andersonvom/4d7e551b4c0418de3160
andersonvom

5
ใช้งานได้เฉพาะในกรณีที่ไม่จำเป็นต้องสั่งซื้อผลลัพธ์
Borbag

7
ดังนั้น ... คำตอบนี้ไม่ตอบคำถามใช่มั้ย เพราะตอนนี้ทำงานกับรายการที่ซ้อนกัน
Mayou36

60

สำหรับผู้ที่ต้องการหาจุดตัดของสองรายการ Asker ได้จัดเตรียมสองวิธี

b1 = [1,2,3,4,5,9,11,15]
b2 = [4,5,6,7,8]
b3 = [val for val in b1 if val in b2]

และ

def intersect(a, b):
     return list(set(a) & set(b))

print intersect(b1, b2)

แต่มีวิธีไฮบริดที่มีประสิทธิภาพมากกว่าเนื่องจากคุณต้องทำการแปลงเพียงครั้งเดียวระหว่างรายการ / ชุดเมื่อเทียบกับวิธีที่สาม:

b1 = [1,2,3,4,5]
b2 = [3,4,5,6]
s2 = set(b2)
b3 = [val for val in b1 if val in s2]

สิ่งนี้จะทำงานใน O (n) ในขณะที่วิธีดั้งเดิมของเขาที่เกี่ยวข้องกับ list comprehension จะทำงานใน O (n ^ 2)


ในฐานะที่เป็น "if val in s2" ทำงานใน O (N) ความซับซ้อนของข้อมูลโค้ดที่เสนอก็คือ O (n ^ 2)
Romeno

8
กรณีเฉลี่ยของ "val in s2" คือ O (1) ตามwiki.python.org/moin/TimeComplexity#set - ดังนั้นการดำเนินการ n ครั้งเวลาที่คาดหวังคือ O (n) (ไม่ว่าจะเป็นเวลาที่เลวร้ายที่สุดคือ O () n) หรือ O (n ^ 2) ขึ้นอยู่กับว่ากรณีนี้หมายถึงเวลาที่ถูกตัดจำหน่ายหรือไม่ แต่ในทางปฏิบัติมันไม่สำคัญมาก)
D Coetzee

2
รันไทม์คือ O (N) ไม่ใช่เพราะถูกตัดจำหน่าย แต่เนื่องจากความเป็นสมาชิกของชุดอยู่ในค่าเฉลี่ย O (1) (ตัวอย่างเช่นเมื่อใช้ตารางแฮช) มันแตกต่างกันมากตัวอย่างเช่นเนื่องจากรับประกันเวลาที่ตัดจำหน่าย
miroB

28

วิธีการทำงาน:

input_list = [[1, 2, 3, 4, 5], [2, 3, 4, 5, 6], [3, 4, 5, 6, 7]]

result = reduce(set.intersection, map(set, input_list))

และสามารถใช้กับกรณีทั่วไปที่มีมากกว่า 1 รายการ


เพื่ออนุญาตรายการอินพุตว่าง: set(*input_list[:1]).intersection(*input_list[1:]). รุ่นตัววนซ้ำ( it = iter(input_list)) :. reduce(set.intersection, it, set(next(it, [])))ทั้งสองเวอร์ชันไม่จำเป็นต้องแปลงรายการอินพุตทั้งหมดเพื่อตั้งค่า หลังมีหน่วยความจำที่มีประสิทธิภาพมากขึ้น
jfs

ใช้from functools import reduceเพื่อใช้ใน Python 3 หรือดีกว่าใช้การforวนซ้ำอย่างชัดเจน
TrigonaMinima

27

เวอร์ชันความเข้าใจรายการที่แท้จริง

>>> c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
>>> c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
>>> c1set = frozenset(c1)

ตัวแปรเรียบ:

>>> [n for lst in c2 for n in lst if n in c1set]
[13, 32, 7, 13, 28, 1, 6]

ตัวแปรที่ซ้อนกัน:

>>> [[n for n in lst if n in c1set] for lst in c2]
[[13, 32], [7, 13, 28], [1, 6]]

20

ผู้ประกอบการ & ใช้จุดตัดของสองชุด

{1, 2, 3} & {2, 3, 4}
Out[1]: {2, 3}

ไม่เป็นไร แต่หัวข้อนี้มีไว้สำหรับรายการ!
Rafa0809

3
ผลลัพธ์ของการตัดกันของสองรายการคือชุดหนึ่งดังนั้นคำตอบนี้จึงสมบูรณ์
shrewmouse

รายการสามารถมีค่าซ้ำกัน แต่ชุดไม่ได้
diewland

13

วิธี pythonic ของการตัดกันของ 2 รายการคือ:

[x for x in list1 if x in list2]

2
คำถามนี้เกี่ยวกับรายการซ้อน คำตอบของคุณไม่ตอบคำถาม
โทมัส

8

คุณควรใช้รหัสนี้ให้เรียบ (นำมาจากhttp://kogs-www.informatik.uni-hamburg.de/~meine/python_tricks ) รหัสยังไม่ได้ทดสอบ แต่ฉันค่อนข้างแน่ใจว่ามันใช้งานได้:


def flatten(x):
    """flatten(sequence) -> list

    Returns a single, flat list which contains all elements retrieved
    from the sequence and all recursively contained sub-sequences
    (iterables).

    Examples:
    >>> [1, 2, [3,4], (5,6)]
    [1, 2, [3, 4], (5, 6)]
    >>> flatten([[[1,2,3], (42,None)], [4,5], [6], 7, MyVector(8,9,10)])
    [1, 2, 3, 42, None, 4, 5, 6, 7, 8, 9, 10]"""

    result = []
    for el in x:
        #if isinstance(el, (list, tuple)):
        if hasattr(el, "__iter__") and not isinstance(el, basestring):
            result.extend(flatten(el))
        else:
            result.append(el)
    return result

หลังจากที่คุณทำรายการให้แบนแล้วคุณดำเนินการแยกตามวิธีปกติ:


c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

def intersect(a, b):
     return list(set(a) & set(b))

print intersect(flatten(c1), flatten(c2))

2
เป็นรหัส Geo ที่ค่อนข้างแบน แต่ไม่ตอบคำถาม ผู้ถามคาดหวังผลลัพธ์ในรูปแบบ [[13,32], [7,13,28], [1,6]]
Rob Young

8

ตั้งแต่intersectถูกกำหนดความเข้าใจพื้นฐานของรายการก็เพียงพอแล้ว:

>>> c3 = [intersect(c1, i) for i in c2]
>>> c3
[[32, 13], [28, 13, 7], [1, 6]]

การปรับปรุงต้องขอบคุณคำพูดของ S. Lott และคำกล่าวที่เกี่ยวข้องของ TM. :

>>> c3 = [list(set(c1).intersection(i)) for i in c2]
>>> c3
[[32, 13], [28, 13, 7], [1, 6]]

5

ได้รับ:

> c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]

> c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

ฉันพบว่ารหัสต่อไปนี้ทำงานได้ดีและอาจรัดกุมมากขึ้นหากใช้การตั้งค่า:

> c3 = [list(set(f)&set(c1)) for f in c2] 

มันได้รับ:

> [[32, 13], [28, 13, 7], [1, 6]]

ถ้าต้องการสั่งซื้อ:

> c3 = [sorted(list(set(f)&set(c1))) for f in c2] 

เราได้รับ:

> [[13, 32], [7, 13, 28], [1, 6]]

อย่างไรก็ตามสำหรับสไตล์หลามที่มากขึ้นอันนี้ก็ใช้ได้เช่นกัน:

> c3 = [ [i for i in set(f) if i in c1] for f in c2]

3

ฉันไม่รู้ว่าฉันตอบคำถามของคุณช้ากว่ากำหนดไหม หลังจากอ่านคำถามของคุณฉันพบกับฟังก์ชัน intersect () ที่สามารถทำงานได้ทั้งรายการและรายการซ้อน ฉันใช้การเรียกซ้ำเพื่อกำหนดฟังก์ชั่นนี้มันใช้งานง่ายมาก หวังว่ามันคือสิ่งที่คุณกำลังมองหา:

def intersect(a, b):
    result=[]
    for i in b:
        if isinstance(i,list):
            result.append(intersect(a,i))
        else:
            if i in a:
                 result.append(i)
    return result

ตัวอย่าง:

>>> c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
>>> c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
>>> print intersect(c1,c2)
[[13, 32], [7, 13, 28], [1, 6]]

>>> b1 = [1,2,3,4,5,9,11,15]
>>> b2 = [4,5,6,7,8]
>>> print intersect(b1,b2)
[4, 5]

2

คุณคิดว่า[1,2]จะตัดกันด้วย[1, [2]]หรือไม่? นั่นคือมันเป็นเพียงตัวเลขที่คุณสนใจหรือโครงสร้างรายการเช่นกัน?

หากมีเพียงตัวเลขให้ตรวจสอบวิธี "แบน" รายการจากนั้นใช้set()วิธีการ


ฉันต้องการออกจากโครงสร้างของรายการที่ไม่เปลี่ยนแปลง
elfuego1

1

ฉันกำลังมองหาวิธีที่จะทำและในที่สุดมันก็สิ้นสุดลงเช่นนี้:

def compareLists(a,b):
    removed = [x for x in a if x not in b]
    added = [x for x in b if x not in a]
    overlap = [x for x in a if x in b]
    return [removed,added,overlap]

ถ้าไม่ได้ใช้ set.interection แล้ว liners แบบง่าย ๆ ตัวนี้คือสิ่งที่ฉันจะทำ
ฆ่า

0
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]

c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

c3 = [list(set(c2[i]).intersection(set(c1))) for i in xrange(len(c2))]

c3
->[[32, 13], [28, 13, 7], [1, 6]]

0

เราสามารถใช้วิธีการตั้งค่าสำหรับสิ่งนี้:

c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

   result = [] 
   for li in c2:
       res = set(li) & set(c1)
       result.append(list(res))

   print result

0

ในการกำหนดจุดตัดที่คำนึงถึงความสำคัญขององค์ประกอบใช้อย่างถูกต้องCounter:

from collections import Counter

>>> c1 = [1, 2, 2, 3, 4, 4, 4]
>>> c2 = [1, 2, 4, 4, 4, 4, 5]
>>> list((Counter(c1) & Counter(c2)).elements())
[1, 2, 4, 4, 4]

0
# Problem:  Given c1 and c2:
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
# how do you get c3 to be [[13, 32], [7, 13, 28], [1, 6]] ?

นี่เป็นวิธีหนึ่งในการตั้งค่าc3ที่ไม่เกี่ยวข้องกับชุด:

c3 = []
for sublist in c2:
    c3.append([val for val in c1 if val in sublist])

แต่ถ้าคุณต้องการใช้เพียงหนึ่งบรรทัดคุณสามารถทำได้:

c3 = [[val for val in c1 if val in sublist]  for sublist in c2]

มันเป็นรายการความเข้าใจในรายการความเข้าใจซึ่งผิดปกติเล็กน้อย แต่ฉันคิดว่าคุณไม่ควรมีปัญหามากเกินไปที่จะติดตามมัน


0
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
c3 = [list(set(i) & set(c1)) for i in c2]
c3
[[32, 13], [28, 13, 7], [1, 6]]

สำหรับฉันนี่เป็นวิธีที่ยอดเยี่ยมและรวดเร็วมาก :)


0

รายการแบนสามารถทำผ่านreduceได้อย่างง่ายดาย

ทั้งหมดที่คุณต้องใช้initializer - อาร์กิวเมนต์ที่สามในreduceฟังก์ชั่น

reduce(
   lambda result, _list: result.append(
       list(set(_list)&set(c1)) 
     ) or result, 
   c2, 
   [])

รหัสข้างต้นทำงานสำหรับทั้ง python2 และ python3 from functools import reduceแต่คุณจำเป็นต้องนำเข้าลดโมดูลเป็น ดูลิงค์ด้านล่างเพื่อดูรายละเอียด


-1

วิธีง่ายๆในการค้นหาความแตกต่างและจุดตัดระหว่าง iterables

ใช้วิธีการนี้หากการทำซ้ำมีความสำคัญ

from collections import Counter

def intersection(a, b):
    """
    Find the intersection of two iterables

    >>> intersection((1,2,3), (2,3,4))
    (2, 3)

    >>> intersection((1,2,3,3), (2,3,3,4))
    (2, 3, 3)

    >>> intersection((1,2,3,3), (2,3,4,4))
    (2, 3)

    >>> intersection((1,2,3,3), (2,3,4,4))
    (2, 3)
    """
    return tuple(n for n, count in (Counter(a) & Counter(b)).items() for _ in range(count))

def difference(a, b):
    """
    Find the symmetric difference of two iterables

    >>> difference((1,2,3), (2,3,4))
    (1, 4)

    >>> difference((1,2,3,3), (2,3,4))
    (1, 3, 4)

    >>> difference((1,2,3,3), (2,3,4,4))
    (1, 3, 4, 4)
    """
    diff = lambda x, y: tuple(n for n, count in (Counter(x) - Counter(y)).items() for _ in range(count))
    return diff(a, b) + diff(b, a)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.