วิธีเพิ่มแถวใหม่ไปยังอาร์เรย์ที่ว่างเปล่า


158

การใช้อาร์เรย์ Python มาตรฐานฉันสามารถทำสิ่งต่อไปนี้:

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
# arr is now [[1,2,3],[4,5,6]]

อย่างไรก็ตามฉันไม่สามารถทำสิ่งเดียวกันได้ในลักษณะเป็นก้อน ตัวอย่างเช่น:

arr = np.array([])
arr = np.append(arr, np.array([1,2,3]))
arr = np.append(arr, np.array([4,5,6]))
# arr is now [1,2,3,4,5,6]

ฉันดูvstackด้วยเช่นกัน แต่เมื่อฉันใช้vstackอาเรย์ที่ว่างเปล่าฉันจะได้รับ:

ValueError: all the input array dimensions except for the concatenation axis must match exactly

ดังนั้นฉันจะต่อท้ายแถวใหม่ไปยังอาร์เรย์ที่ว่างเปล่าได้อย่างไร?


1
ถ้ามันว่างเปล่าทำไมต้องกังวล? เพิ่งเริ่มจากอาร์เรย์ที่ถือเฉพาะแถวแรก
jonrsharpe

10
ฉันแค่อยากรู้ว่ามันเป็นไปได้ที่จะผนวกเข้ากับอาร์เรย์ที่ว่างเปล่าหรือไม่ บางครั้งการเขียนโค้ดแบบนี้จะสะอาดกว่าเนื่องจากการดำเนินการผนวกอยู่ในลูป
Tony Stark

5
เมื่อพิจารณาถึงวิธีการทำงานของอาร์เรย์ numpy คุณจะสร้างอาร์เรย์ว่างได้ดีกว่าแล้วใส่ข้อมูลลงไปเช่นดูstackoverflow.com/questions/568962/…
jonrsharpe

คำตอบ:


227

วิธีการ "เริ่มต้น" อาร์เรย์ที่คุณต้องการคือ:

arr = np.empty((0,3), int)

ซึ่งเป็นอาร์เรย์ที่ว่างเปล่า แต่มีมิติข้อมูลที่เหมาะสม

>>> arr
array([], shape=(0, 3), dtype=int64)

จากนั้นให้แน่ใจว่าได้ผนวกเข้ากับแกน 0:

arr = np.append(arr, np.array([[1,2,3]]), axis=0)
arr = np.append(arr, np.array([[4,5,6]]), axis=0)

แต่ @jonrsharpe นั้นถูกต้อง ในความเป็นจริงถ้าคุณกำลังจะต่อท้ายในวงมันจะเร็วกว่าที่จะผนวกเข้ากับรายการเช่นในตัวอย่างแรกของคุณแล้วแปลงเป็นอาร์เรย์ numpy ในตอนท้ายเนื่องจากคุณไม่ได้ใช้ numpy เป็น ตั้งใจระหว่างห่วง:

In [210]: %%timeit
   .....: l = []
   .....: for i in xrange(1000):
   .....:     l.append([3*i+1,3*i+2,3*i+3])
   .....: l = np.asarray(l)
   .....: 
1000 loops, best of 3: 1.18 ms per loop

In [211]: %%timeit
   .....: a = np.empty((0,3), int)
   .....: for i in xrange(1000):
   .....:     a = np.append(a, 3*i+np.array([[1,2,3]]), 0)
   .....: 
100 loops, best of 3: 18.5 ms per loop

In [214]: np.allclose(a, l)
Out[214]: True

วิธีที่ใช้ในการทำ numpythonic ขึ้นอยู่กับแอปพลิเคชันของคุณ แต่มันจะเป็นอย่างไรมากกว่า:

In [220]: timeit n = np.arange(1,3001).reshape(1000,3)
100000 loops, best of 3: 5.93 µs per loop

In [221]: np.allclose(a, n)
Out[221]: True

ถ้าฉันต้องทำสิ่งนี้ 10 ^ 5 หรือ 10 ^ 6 ครั้ง ดูเหมือนว่าวิธีการเหล่านี้จะไม่ถือ ข้อเสนอแนะใด ๆ
Rho Phi

@ Roberto มักจะมีวิธีการกำหนดขนาดหรือรูปร่าง (อย่างน้อยที่สุดค่าจะดีกว่า) ของอาร์เรย์ล่วงหน้า คุณคิดว่าคุณสามารถทำได้หรือไม่? การต่อท้ายควรเป็นการดำเนินการหนึ่งหรือสองครั้ง
askewchan

บางครั้งคุณไม่สามารถคาดเดามิติมันคือชีวิต อย่างไรก็ตามคุณสามารถจัดสรรอาเรย์ที่ใหญ่พอและกำหนดค่าให้กับมุมมองของมัน ฉันไม่ชอบมันเพราะมีค่าที่ไม่พึงประสงค์ที่ต้องไปหา "หน้ากาก" ความคิดในการปิดบังนี้ไม่เหมาะกับรสนิยมของฉัน
Rho Phi

ไม่จำเป็นต้องปกปิดเพียงชิ้น! a = a[:N] แม้ว่าฉันเชื่อมั่นอย่างยิ่งว่าคุณควรหาวิธีที่จะทำให้เป็นเวกเตอร์ (โพสต์คำถามใหม่ด้วยคำถามเฉพาะของคุณหากคุณต้องการความช่วยเหลือ) หรือใช้รายการจนกว่าวงจะจบ
askewchan

29

นี่คือทางออกของฉัน:

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
np_arr = np.array(arr)

อาร์เรย์ที่เป็นผลลัพธ์มีวัตถุประเภทหนึ่งซึ่งไม่สามารถยอมรับได้ในบางกรณี
zer0fool

26

ในกรณีนี้คุณอาจต้องการใช้ฟังก์ชัน np.hstack และ np.vstack

arr = np.array([])
arr = np.hstack((arr, np.array([1,2,3])))
# arr is now [1,2,3]

arr = np.vstack((arr, np.array([4,5,6])))
# arr is now [[1,2,3],[4,5,6]]

คุณยังสามารถใช้ฟังก์ชัน np.concatenate

ไชโย


7
จะไม่ทำงานหากอาร์เรย์ที่สองมีมิติ> = 2 เช่นเดียวกับ ((2, 2)) ดูเหมือนว่าฉันไม่มีทางหลีกเลี่ยงคดีเขตแดนหากคุณกำลังสร้างอาร์เรย์จากการเรียงต่อกันว่างเปล่า
Taozi

ไม่ใช่ทางออกที่ดีเพราะต้องตรวจสอบมิติทุกครั้ง
SKR

1

ใช้นิยาม dtype ที่กำหนดเองสิ่งที่ได้ผลสำหรับฉันคือ:

import numpy

# define custom dtype
type1 = numpy.dtype([('freq', numpy.float64, 1), ('amplitude', numpy.float64, 1)])
# declare empty array, zero rows but one column
arr = numpy.empty([0,1],dtype=type1)
# store row data, maybe inside a loop
row = numpy.array([(0.0001, 0.002)], dtype=type1)
# append row to the main array
arr = numpy.row_stack((arr, row))
# print values stored in the row 0
print float(arr[0]['freq'])
print float(arr[0]['amplitude'])

1

ในกรณีของการเพิ่มแถวใหม่สำหรับอาร์เรย์ในวงกำหนดอาร์เรย์โดยตรงเป็นครั้งแรกในวงแทนการเริ่มต้นอาร์เรย์ที่ว่างเปล่า

for i in range(0,len(0,100)):
    SOMECALCULATEDARRAY = .......
    if(i==0):
        finalArrayCollection = SOMECALCULATEDARRAY
    else:
        finalArrayCollection = np.vstack(finalArrayCollection,SOMECALCULATEDARRAY)

สิ่งนี้มีประโยชน์เป็นหลักเมื่อไม่ทราบรูปร่างของอาร์เรย์


0

ฉันต้องการจะทำ for loop แต่ด้วยวิธีของ askewchan มันใช้งานไม่ได้ดังนั้นฉันจึงแก้ไขมัน

x=np.empty((0,3))
y=np.array([1 2 3])
for i in ...
x = vstack((x,y))
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.