คุณแยกคอลัมน์ออกจากอาร์เรย์หลายมิติได้อย่างไร


คำตอบ:


227
>>> import numpy as np
>>> A = np.array([[1,2,3,4],[5,6,7,8]])

>>> A
array([[1, 2, 3, 4],
    [5, 6, 7, 8]])

>>> A[:,2] # returns the third columm
array([3, 7])

ดูเพิ่มเติมที่: "numpy.arange" และ "reshape" เพื่อจัดสรรหน่วยความจำ

ตัวอย่าง: (การจัดสรรอาร์เรย์ด้วยการสร้างเมทริกซ์ (3x4))

nrows = 3
ncols = 4
my_array = numpy.arange(nrows*ncols, dtype='double')
my_array = my_array.reshape(nrows, ncols)

8
เอาฉันไป 2 ชั่วโมงเพื่อค้นพบ [:, 2] เดาว่าคุณสมบัตินี้ไม่ได้อยู่ในวรรณคดีอย่างเป็นทางการในการแบ่งส่วน?
niken

เครื่องหมายจุลภาคหมายถึงอะไร
ฟิล

3
[row, col]@Phil เครื่องหมายจุลภาคคั่น
AsheKetchum

11
คำตอบนี้มี upvotes มากมายได้อย่างไร? OP ไม่เคยพูดว่ามันเป็นอาร์เรย์ที่มีค่ามาก
sziraqui

3
สำหรับแยก 2 คอลัมน์: A [:, [1,3]] ตัวอย่างเช่นแยกคอลัมน์ที่สองและสี่
sadalsuud

177

มันอาจจะเป็นได้ว่าคุณกำลังใช้อาร์เรย์ NumPy ? Python มีโมดูลอาเรย์ แต่ไม่รองรับอาเรย์หลายมิติ รายการ Python ปกติเป็นมิติเดียวเช่นกัน

อย่างไรก็ตามหากคุณมีรายการสองมิติอย่างง่ายเช่นนี้:

A = [[1,2,3,4],
     [5,6,7,8]]

จากนั้นคุณสามารถแยกคอลัมน์ดังนี้:

def column(matrix, i):
    return [row[i] for row in matrix]

แยกคอลัมน์ที่สอง (ดัชนี 1):

>>> column(A, 1)
[2, 6]

หรืออีกวิธีหนึ่งคือ

>>> [row[1] for row in A]
[2, 6]

80

หากคุณมีอาร์เรย์เหมือน

a = [[1, 2], [2, 3], [3, 4]]

จากนั้นคุณแยกคอลัมน์แรกเช่นนั้น:

[row[0] for row in a]

ดังนั้นผลลัพธ์จะเป็นดังนี้:

[1, 2, 3]

38

ลองดูสิ!

a = [[1, 2], [2, 3], [3, 4]]
a2 = zip(*a)
a2[0]

มันเป็นสิ่งเดียวกันข้างต้นยกเว้นอย่างใดมันเป็น neater ซิปทำงาน แต่ต้องใช้อาร์เรย์เดียวเป็นข้อโต้แย้ง, * ไวยากรณ์ unpacks อาร์เรย์หลายมิติเป็นอาร์กิวเมนต์อาร์เรย์เดียว


7
ข้างต้นคืออะไร? จำไว้ว่าคำตอบนั้นไม่ได้เรียงกันเสมอไป
Muhd

2
สิ่งนี้สะอาด แต่อาจไม่มีประสิทธิภาพมากที่สุดหากประสิทธิภาพเป็นสิ่งที่น่ากังวลเนื่องจากเป็นการเปลี่ยนเมทริกซ์ทั้งหมด
IceArdor

6
FYI ใช้งานได้ใน python 2 แต่ใน python 3 คุณจะได้รับออบเจกต์ของเครื่องกำเนิดไฟฟ้าซึ่งแน่นอนว่าไม่สามารถถอดรหัสได้
Rishabh Agrahari

@RishabhAgrahari ยังไงที่จะทำ zip นี้ใน Py3?
CtrlAltF2

2
@WarpDriveEnterprises yup คุณจะต้องแปลงอ็อบเจกต์ generator เป็นลิสต์แล้วทำการห้อย ตัวอย่าง:a2 = zip(*a); a2 = list(a2); a2[0]
Rishabh Agrahari

14
def get_col(arr, col):
    return map(lambda x : x[col], arr)

a = [[1,2,3,4], [5,6,7,8], [9,10,11,12],[13,14,15,16]]

print get_col(a, 3)

ฟังก์ชั่นแผนที่ใน Python เป็นอีกวิธีที่จะไป


11
>>> x = arange(20).reshape(4,5)
>>> x array([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14],
        [15, 16, 17, 18, 19]])

หากคุณต้องการคอลัมน์ที่สองคุณสามารถใช้

>>> x[:, 1]
array([ 1,  6, 11, 16])

1
นี่ใช้ numpy ไหม?
Foreever

1
ฉันไม่สามารถหาเอกสารใด ๆ สำหรับarange()ใน Python3 นอกของ numpy ใคร?
Kevin W Matthews


9

ตัวดำเนินการ itemgetter สามารถช่วยได้เช่นกันถ้าคุณชอบ python สไตล์ลดแผนที่แทนความเข้าใจในรายการเพื่อความหลากหลายเล็กน้อย!

# tested in 2.4
from operator import itemgetter
def column(matrix,i):
    f = itemgetter(i)
    return map(f,matrix)

M = [range(x,x+5) for x in range(10)]
assert column(M,1) == range(1,11)

1
ใช้ itertools.imap สำหรับข้อมูลขนาดใหญ่
Paweł Polewicz

วิธี itemgetter วิ่งเร็วกว่าวิธีการเข้าใจรายการประมาณ 50 เท่าสำหรับกรณีการใช้งานของฉัน Python 2.7.2 กรณีการใช้งานเป็นจำนวนมากซ้ำในเมทริกซ์ที่มีไม่กี่ร้อยแถวและคอลัมน์
joelpt

7

คุณสามารถใช้สิ่งนี้เช่นกัน:

values = np.array([[1,2,3],[4,5,6]])
values[...,0] # first column
#[1,4]

หมายเหตุ: สิ่งนี้ไม่ทำงานสำหรับอาร์เรย์ในตัวและไม่จัดแนว (เช่น np.array ([[1,2,3], [4,5,6,7]]))


6

ฉันคิดว่าคุณต้องการแยกคอลัมน์จากอาร์เรย์เช่นอาร์เรย์ด้านล่าง

import numpy as np
A = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])

ตอนนี้ถ้าคุณต้องการรับคอลัมน์ที่สามในรูปแบบ

D=array[[3],
[7],
[11]]

จากนั้นคุณต้องทำให้อาร์เรย์เป็นเมทริกซ์ก่อน

B=np.asmatrix(A)
C=B[:,2]
D=asarray(C)

และตอนนี้คุณสามารถคำนวณองค์ประกอบอย่างชาญฉลาดได้เหมือนที่คุณทำใน excel


1
ขณะที่สิ่งนี้ช่วยฉันได้มากฉันคิดว่าคำตอบจะสั้นลงมาก: 1. A = np.array ([[1,2,3,4], [5,6,7,8], [9,10, 11,12]]) 2. A [:, 1] >> array ([2, 6, 10])
Ufos

6

สมมุติว่าเรามีn X mเมทริกซ์ ( nแถวและmคอลัมน์) บอก 5 แถวและ 4 คอลัมน์

matrix = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16],[17,18,19,20]]

ในการแยกคอลัมน์ในไพ ธ อนเราสามารถใช้ list comprehension ดังนี้

[ [row[i] for row in matrix] for in range(4) ]

คุณสามารถแทนที่ 4 ด้วยจำนวนคอลัมน์ที่เมทริกซ์ของคุณมี ผลที่ได้คือ

[ [1,5,9,13,17],[2,10,14,18],[3,7,11,15,19],[4,8,12,16,20] ]


สิ่งนี้สร้างรายการใหม่ทั้งหมดหรือไม่
Kevin W Matthews

5
array = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]]

col1 = [val[1] for val in array]
col2 = [val[2] for val in array]
col3 = [val[3] for val in array]
col4 = [val[4] for val in array]
print(col1)
print(col2)
print(col3)
print(col4)

Output:
[1, 5, 9, 13]
[2, 6, 10, 14]
[3, 7, 11, 15]
[4, 8, 12, 16]

4

อีกวิธีหนึ่งโดยใช้เมทริกซ์

>>> from numpy import matrix
>>> a = [ [1,2,3],[4,5,6],[7,8,9] ]
>>> matrix(a).transpose()[1].getA()[0]
array([2, 5, 8])
>>> matrix(a).transpose()[0].getA()[0]
array([1, 4, 7])

3

หากคุณมีอาเรย์สองมิติใน Python (ไม่ใช่แบบ Numpy) คุณสามารถแยกคอลัมน์ทั้งหมดได้

data = [
['a', 1, 2], 
['b', 3, 4], 
['c', 5, 6]
]

columns = list(zip(*data))

print("column[0] = {}".format(columns[0]))
print("column[1] = {}".format(columns[1]))
print("column[2] = {}".format(columns[2]))

การใช้รหัสนี้จะให้ผล

>>> print("column[0] = {}".format(columns[0]))
column[0] = ('a', 'b', 'c')

>>> print("column[1] = {}".format(columns[1]))
column[1] = (1, 3, 5)

>>> print("column[2] = {}".format(columns[2]))
column[2] = (2, 4, 6)

แน่นอนคุณสามารถแยกคอลัมน์เดียวโดยดัชนี (เช่นcolumns[0])


2

แม้จะใช้zip(*iterable)เพื่อย้ายรายการแบบซ้อนคุณยังสามารถใช้รายการต่อไปนี้หากรายการแบบซ้อนมีความยาวต่างกัน:

map(None, *[(1,2,3,), (4,5,), (6,)])

ผลลัพธ์ใน:

[(1, 4, 6), (2, 5, None), (3, None, None)]

คอลัมน์แรกจึง:

map(None, *[(1,2,3,), (4,5,), (6,)])[0]
#>(1, 4, 6)

2

ช้าหน่อย ...

ในกรณีที่ประสิทธิภาพการทำงานและข้อมูลของคุณเป็นรูปสี่เหลี่ยมผืนผ้าคุณอาจเก็บไว้ในมิติเดียวและเข้าถึงคอลัมน์โดยการแบ่งปกติเช่น ...

A = [[1,2,3,4],[5,6,7,8]]     #< assume this 4x2-matrix
B = reduce( operator.add, A ) #< get it one-dimensional

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx::dimX]

def row1d( matrix, dimX, rowIdx ):
  return matrix[rowIdx:rowIdx+dimX] 

>>> column1d( B, 4, 1 )
[2, 6]
>>> row1d( B, 4, 1 )
[2, 3, 4, 5]

สิ่งที่เรียบร้อยคือมันเร็วจริงๆ อย่างไรก็ตามดัชนีเชิงลบไม่ทำงานที่นี่! ดังนั้นคุณไม่สามารถเข้าถึงคอลัมน์หรือแถวสุดท้ายด้วยดัชนี -1

หากคุณต้องการจัดทำดัชนีเชิงลบคุณสามารถปรับแต่งฟังก์ชั่นการเข้าถึงได้เล็กน้อยเช่น

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx % dimX::dimX]

def row1d( matrix, dimX, dimY, rowIdx ):
  rowIdx = (rowIdx % dimY) * dimX
  return matrix[rowIdx:rowIdx+dimX]

ฉันตรวจสอบวิธีการนี้และค่าใช้จ่ายในการดึงข้อมูลคอลัมน์เป็นวิธีที่ถูกกว่าซ้อนสำหรับลูป อย่างไรก็ตามการลดเมทริกซ์ 2d เป็น 1d มีราคาแพงหากเมทริกซ์มีขนาดใหญ่พูด 1,000 * 1,000
จุนจุน 'มาร์ค' จิน

2

หากคุณต้องการคว้ามากกว่าหนึ่งคอลัมน์ให้ใช้ส่วนแบ่ง:

 a = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
    print(a[:, [1, 2]])
[[2 3]
[5 6]
[8 9]]

2

ฉันชอบคำใบ้ต่อไป: มีเมทริกซ์ชื่อmatrix_aและใช้column_numberตัวอย่างเช่น:

import numpy as np
matrix_a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
column_number=2

# you can get the row from transposed matrix - it will be a column:
col=matrix_a.transpose()[column_number]

1

เพียงใช้ transpose () จากนั้นคุณสามารถรับ colummns ได้ง่าย ๆ เมื่อคุณได้แถว

matrix=np.array(originalMatrix).transpose()
print matrix[NumberOfColum]

0

คอลัมน์ทั้งหมดจากเมทริกซ์ไปยังรายการใหม่:

N = len(matrix) 
column_list = [ [matrix[row][column] for row in range(N)] for column in range(N) ]
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.