รับผลิตภัณฑ์คาร์ทีเซียนของชุดรายการหรือไม่


317

ฉันจะรับผลิตภัณฑ์คาร์ทีเซียน (ทุกค่าที่เป็นไปได้รวมกัน) จากกลุ่มของรายการได้อย่างไร

การป้อนข้อมูล:

somelists = [
   [1, 2, 3],
   ['a', 'b'],
   [4, 5]
]

ผลลัพธ์ที่ต้องการ:

[(1, 'a', 4), (1, 'a', 5), (1, 'b', 4), (1, 'b', 5), (2, 'a', 4), (2, 'a', 5) ...]

24
โปรดทราบว่า 'ชุดค่าผสมที่เป็นไปได้ทั้งหมด' นั้นไม่เหมือนกันกับ 'ผลิตภัณฑ์คาร์ทีเซียน' เนื่องจากในผลิตภัณฑ์คาร์ทีเซียนอนุญาตให้มีการทำซ้ำได้
Triptych

7
มีผลิตภัณฑ์คาร์ทีเซียนรุ่นที่ไม่ซ้ำกันหรือไม่
KJW

16
@KJW ใช่set(cartesian product)
NoBugs

5
ไม่ควรมีรายการที่ซ้ำกันในผลิตภัณฑ์คาร์ทีเซียนเว้นแต่รายการอินพุตมีรายการที่ซ้ำกัน หากคุณไม่ต้องการสินค้าที่ซ้ำซ้อนในผลิตภัณฑ์คาร์ทีเซียนให้ใช้set(inputlist)กับรายการอินพุตทั้งหมดของคุณ ไม่ได้ผล
CamilB

@Triptych อะไร คำจำกัดความมาตรฐานของผลิตภัณฑ์คาร์ทีเซียนคือชุด ทำไมผู้คนมากมายถึงโหวตขึ้น?
PascalIv

คำตอบ:


378

itertools.product

พร้อมใช้งานจาก Python 2.6

import itertools

somelists = [
   [1, 2, 3],
   ['a', 'b'],
   [4, 5]
]
for element in itertools.product(*somelists):
    print(element)

ซึ่งเหมือนกับ

for element in itertools.product([1, 2, 3], ['a', 'b'], [4, 5]):
    print(element)

22
แค่ต้องการเพิ่มอักขระ '*' เป็นสิ่งจำเป็นหากคุณใช้ตัวแปร somelists ตามที่ OP ให้ไว้
brian buck

1
@jaska: product()สร้างnitems_in_a_list ** nlistsองค์ประกอบในผลลัพธ์ ( reduce(mul, map(len, somelists))) มีเหตุผลที่จะเชื่อว่าผลผลิตองค์ประกอบหนึ่งไม่ได้ไม่เป็นO(nlists)(ตัดจำหน่าย) คือความซับซ้อนเวลาเป็นเช่นเดียวกับการที่เรียบง่ายที่ซ้อนกันfor-loopsเช่นสำหรับการป้อนข้อมูลในคำถาม: nlists=3จำนวนรวมขององค์ประกอบในผล: 3*2*2และ แต่ละองค์ประกอบมีnlistsรายการ ( 3ในกรณีนี้)
jfs

2
การใช้*โซมาลิสต์ก่อนคืออะไร? มันทำอะไร?
Vineet Kumar Doshi

6
@VineetKumarDoshi: ที่นี่จะใช้ในการแยกรายการออกเป็นหลายอาร์กิวเมนต์เพื่อเรียกใช้ฟังก์ชัน อ่านเพิ่มเติมได้ที่นี่: stackoverflow.com/questions/36901/…
Moberg

4
หมายเหตุ: ใช้งานได้เฉพาะเมื่อแต่ละรายการมีอย่างน้อยหนึ่งรายการ
igo

84
import itertools
>>> for i in itertools.product([1,2,3],['a','b'],[4,5]):
...         print i
...
(1, 'a', 4)
(1, 'a', 5)
(1, 'b', 4)
(1, 'b', 5)
(2, 'a', 4)
(2, 'a', 5)
(2, 'b', 4)
(2, 'b', 5)
(3, 'a', 4)
(3, 'a', 5)
(3, 'b', 4)
(3, 'b', 5)
>>>

38

สำหรับ Python 2.5 ขึ้นไป:

>>> [(a, b, c) for a in [1,2,3] for b in ['a','b'] for c in [4,5]]
[(1, 'a', 4), (1, 'a', 5), (1, 'b', 4), (1, 'b', 5), (2, 'a', 4), 
 (2, 'a', 5), (2, 'b', 4), (2, 'b', 5), (3, 'a', 4), (3, 'a', 5), 
 (3, 'b', 4), (3, 'b', 5)]

นี่เป็นเวอร์ชั่นแบบเรียกซ้ำproduct()(เพียงภาพประกอบ):

def product(*args):
    if not args:
        return iter(((),)) # yield tuple()
    return (items + (item,) 
            for items in product(*args[:-1]) for item in args[-1])

ตัวอย่าง:

>>> list(product([1,2,3], ['a','b'], [4,5])) 
[(1, 'a', 4), (1, 'a', 5), (1, 'b', 4), (1, 'b', 5), (2, 'a', 4), 
 (2, 'a', 5), (2, 'b', 4), (2, 'b', 5), (3, 'a', 4), (3, 'a', 5), 
 (3, 'b', 4), (3, 'b', 5)]
>>> list(product([1,2,3]))
[(1,), (2,), (3,)]
>>> list(product([]))
[]
>>> list(product())
[()]

เวอร์ชันเรียกซ้ำไม่ทำงานหากargsมีตัววนซ้ำบางตัว
jfs

20

ด้วยitertool. ผลิตภัณฑ์ :

import itertools
result = list(itertools.product(*somelists))

6
การใช้*โซมาลิสต์ก่อนคืออะไร?
Vineet Kumar Doshi

@VineetKumarDoshi "product (somelists)"เป็นผลิตภัณฑ์คาร์ทีเซียนระหว่างรายการย่อยในแบบที่ Python ได้รับเป็นครั้งแรก"[1, 2, 3]"เป็นองค์ประกอบจากนั้นรับองค์ประกอบอื่น ๆ หลังจาก Comman ถัดไปและนั่นคือ Linebreak ดังนั้นผลิตภัณฑ์แรก คำคือ ([1, 2, 3],), similary สำหรับวินาที ([4, 5],) และอื่น ๆ"[([1, 2, 3],), ([4, 5],), ( [6, 7])]" หากคุณต้องการได้รับผลิตภัณฑ์คาร์ทีเซียนระหว่างองค์ประกอบภายในสิ่งอันดับคุณต้องบอก Python กับ Asterisk เกี่ยวกับโครงสร้าง tuple สำหรับพจนานุกรมคุณใช้ ** เพิ่มเติมที่นี่
hhh

19

ฉันจะใช้ list comprehension:

somelists = [
   [1, 2, 3],
   ['a', 'b'],
   [4, 5]
]

cart_prod = [(a,b,c) for a in somelists[0] for b in somelists[1] for c in somelists[2]]

1
ฉันชอบวิธีการแก้ปัญหานี้โดยใช้รายการความเข้าใจ ฉันไม่รู้ว่าทำไมไม่อัพโพลมากขึ้นมันง่ายมาก
llekn

20
@llekn เนื่องจากดูเหมือนว่ารหัสจะถูกกำหนดเป็นจำนวนรายการ
Bằng Rikimaru

11

นี่คือตัวสร้างแบบเรียกซ้ำซึ่งไม่ได้จัดเก็บรายการชั่วคราวใด ๆ

def product(ar_list):
    if not ar_list:
        yield ()
    else:
        for a in ar_list[0]:
            for prod in product(ar_list[1:]):
                yield (a,)+prod

print list(product([[1,2],[3,4],[5,6]]))

เอาท์พุท:

[(1, 3, 5), (1, 3, 6), (1, 4, 5), (1, 4, 6), (2, 3, 5), (2, 3, 6), (2, 4, 5), (2, 4, 6)]

1
แม้ว่าจะถูกเก็บไว้ในสแต็ก
Quentin Pradet

@QuentinPradet คุณหมายถึงตัวสร้างเช่นdef f(): while True: yield 1จะเพิ่มขนาดสแต็คในขณะที่เราดำเนินการต่อหรือไม่
Anurag Uniyal

@QuentinPradet ใช่ แต่แม้ในกรณีนี้เฉพาะสแต็กที่จำเป็นสำหรับความลึกสูงสุดไม่ใช่รายการทั้งหมดดังนั้นในกรณีนี้สแต็กของ 3
Anurag Uniyal

มันเป็นเรื่องจริงขอโทษ มาตรฐานอาจน่าสนใจ :)
Quentin Pradet

11

ใน Python 2.6 ขึ้นไปคุณสามารถใช้ 'itertools.product` ใน Python เวอร์ชั่นเก่าคุณสามารถใช้รหัสเทียบเท่า (ต่อไปนี้ - ดูเอกสารประกอบ) จากเอกสารอย่างน้อยเป็นจุดเริ่มต้น:

def product(*args, **kwds):
    # product('ABCD', 'xy') --> Ax Ay Bx By Cx Cy Dx Dy
    # product(range(2), repeat=3) --> 000 001 010 011 100 101 110 111
    pools = map(tuple, args) * kwds.get('repeat', 1)
    result = [[]]
    for pool in pools:
        result = [x+[y] for x in result for y in pool]
    for prod in result:
        yield tuple(prod)

ผลของทั้งสองเป็น iterator ดังนั้นหากคุณต้องการรายชื่อสำหรับการประมวลผล furthert list(result)ใช้จริงๆ


ตามเอกสารการใช้งาน itertools.product ที่เกิดขึ้นจริงไม่ได้สร้างผลลัพธ์ระดับกลางซึ่งอาจมีราคาแพง การใช้เทคนิคนี้อาจหลุดพ้นจากมือไปอย่างรวดเร็วสำหรับรายการที่มีขนาดปานกลาง
Triptych

4
ฉันสามารถชี้ OP ไปที่เอกสารเท่านั้นไม่ใช่อ่านให้เขา

1
รหัสจากเอกสารมีไว้เพื่อแสดงให้เห็นถึงสิ่งที่ฟังก์ชั่นผลิตภัณฑ์ทำไม่ได้เป็นวิธีแก้ปัญหาสำหรับ Python รุ่นก่อนหน้า
Triptych

9

แม้ว่าจะมีคำตอบมากมายอยู่แล้ว แต่ฉันต้องการแบ่งปันความคิดของฉัน:

แนวทางการทำซ้ำ

def cartesian_iterative(pools):
  result = [[]]
  for pool in pools:
    result = [x+[y] for x in result for y in pool]
  return result

วิธีการแบบเรียกซ้ำ

def cartesian_recursive(pools):
  if len(pools) > 2:
    pools[0] = product(pools[0], pools[1])
    del pools[1]
    return cartesian_recursive(pools)
  else:
    pools[0] = product(pools[0], pools[1])
    del pools[1]
    return pools
def product(x, y):
  return [xx + [yy] if isinstance(xx, list) else [xx] + [yy] for xx in x for yy in y]

วิธีการของแลมบ์ดา

def cartesian_reduct(pools):
  return reduce(lambda x,y: product(x,y) , pools)

ใน "วิธีการวนซ้ำ" ทำไมจึงมีการประกาศผลลัพธ์เป็นผลลัพธ์ = [[]] ฉันรู้ว่ามันคือ list_of_list แต่โดยทั่วไปแม้ว่าเราจะประกาศ list_of_list เราใช้ [] ไม่ใช่ [[]]
Sachin S

ฉันค่อนข้างใหม่ในแง่ของโซลูชั่น Pythonic คุณหรือคนเดินผ่านไปโปรดเขียนรายการความเข้าใจใน "วิธีการวนซ้ำ" ในวงแยกต่างหากหรือไม่?
Johnny Boy

4

วิธีการเรียกซ้ำ:

def rec_cart(start, array, partial, results):
  if len(partial) == len(array):
    results.append(partial)
    return 

  for element in array[start]:
    rec_cart(start+1, array, partial+[element], results)

rec_res = []
some_lists = [[1, 2, 3], ['a', 'b'], [4, 5]]  
rec_cart(0, some_lists, [], rec_res)
print(rec_res)

แนวทางการทำซ้ำ:

def itr_cart(array):
  results = [[]]
  for i in range(len(array)):
    temp = []
    for res in results:
      for element in array[i]:
        temp.append(res+[element])
    results = temp

  return results

some_lists = [[1, 2, 3], ['a', 'b'], [4, 5]]  
itr_res = itr_cart(some_lists)
print(itr_res)

3

การดัดแปลงเล็กน้อยสำหรับโซลูชันตัวสร้างแบบเรียกซ้ำข้างต้นในรสชาติที่หลากหลาย:

def product_args(*args):
    if args:
        for a in args[0]:
            for prod in product_args(*args[1:]) if args[1:] else ((),):
                yield (a,) + prod

และแน่นอนกระดาษห่อหุ้มซึ่งทำให้มันทำงานเหมือนกับโซลูชันนั้น:

def product2(ar_list):
    """
    >>> list(product(()))
    [()]
    >>> list(product2(()))
    []
    """
    return product_args(*ar_list)

ด้วยการแลกเปลี่ยนครั้งเดียว : ตรวจสอบว่าการเรียกซ้ำควรทำลายแต่ละวงรอบนอกหรือไม่และได้รับหนึ่ง : ไม่มีผลตอบแทนเมื่อมีการโทรว่างเปล่าเช่นproduct(())ที่ฉันคิดว่าน่าจะถูกต้องมากกว่าความหมาย (ดูหลักคำสอน)

เกี่ยวกับความเข้าใจในรายการ: คำจำกัดความทางคณิตศาสตร์ใช้กับจำนวนอาร์กิวเมนต์โดยพลการในขณะที่รายการความเข้าใจสามารถจัดการกับจำนวนที่ทราบเท่านั้น


2

เพียงเพิ่มเล็กน้อยในสิ่งที่กล่าวไปแล้ว: หากคุณใช้ sympy คุณสามารถใช้สัญลักษณ์แทนสตริงที่ทำให้มีประโยชน์ทางคณิตศาสตร์

import itertools
import sympy

x, y = sympy.symbols('x y')

somelist = [[x,y], [1,2,3], [4,5]]
somelist2 = [[1,2], [1,2,3], [4,5]]

for element in itertools.product(*somelist):
  print element

เกี่ยวกับSymPy



0

วิธีการโตนเฮนจ์:

def giveAllLists(a, t):
    if (t + 1 == len(a)):
        x = []
        for i in a[t]:
            p = [i]
            x.append(p)
        return x
    x = []

    out = giveAllLists(a, t + 1)
    for i in a[t]:

        for j in range(len(out)):
            p = [i]
            for oz in out[j]:
                p.append(oz)
            x.append(p)
    return x

xx= [[1,2,3],[22,34,'se'],['k']]
print(giveAllLists(xx, 0))

เอาท์พุท:

[[1, 22, 'k'], [1, 34, 'k'], [1, 'se', 'k'], [2, 22, 'k'], [2, 34, 'k'], [2, 'se', 'k'], [3, 22, 'k'], [3, 34, 'k'], [3, 'se', 'k']]
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.