คุณสามารถใช้itertools.tee
และzip
สร้างผลลัพธ์ได้อย่างมีประสิทธิภาพ:
from itertools import tee
# python2 only:
#from itertools import izip as zip
def differences(seq):
iterable, copied = tee(seq)
next(copied)
for x, y in zip(iterable, copied):
yield y - x
หรือใช้itertools.islice
แทน:
from itertools import islice
def differences(seq):
nexts = islice(seq, 1, None)
for x, y in zip(seq, nexts):
yield y - x
คุณยังสามารถหลีกเลี่ยงการใช้itertools
โมดูล:
def differences(seq):
iterable = iter(seq)
prev = next(iterable)
for element in iterable:
yield element - prev
prev = element
โซลูชันทั้งหมดนี้ทำงานในพื้นที่คงที่หากคุณไม่จำเป็นต้องจัดเก็บผลลัพธ์ทั้งหมดและรองรับการวนซ้ำแบบไม่สิ้นสุด
ต่อไปนี้คือเกณฑ์มาตรฐานระดับไมโครของโซลูชัน:
In [12]: L = range(10**6)
In [13]: from collections import deque
In [15]: %timeit deque(differences_tee(L), maxlen=0)
10 loops, best of 3: 122 ms per loop
In [16]: %timeit deque(differences_islice(L), maxlen=0)
10 loops, best of 3: 127 ms per loop
In [17]: %timeit deque(differences_no_it(L), maxlen=0)
10 loops, best of 3: 89.9 ms per loop
และโซลูชันอื่น ๆ ที่เสนอ:
In [18]: %timeit [x[1] - x[0] for x in zip(L[1:], L)]
10 loops, best of 3: 163 ms per loop
In [19]: %timeit [L[i+1]-L[i] for i in range(len(L)-1)]
1 loops, best of 3: 395 ms per loop
In [20]: import numpy as np
In [21]: %timeit np.diff(L)
1 loops, best of 3: 479 ms per loop
In [35]: %%timeit
...: res = []
...: for i in range(len(L) - 1):
...: res.append(L[i+1] - L[i])
...:
1 loops, best of 3: 234 ms per loop
โปรดทราบว่า:
zip(L[1:], L)
เทียบเท่ากับzip(L[1:], L[:-1])
ตั้งแต่zip
สิ้นสุดการป้อนข้อมูลที่สั้นที่สุดแล้วอย่างไรก็ตามจะหลีกเลี่ยงสำเนาทั้งหมดของL
.
- การเข้าถึงองค์ประกอบเดี่ยวโดยดัชนีนั้นช้ามากเนื่องจากการเข้าถึงดัชนีทุกครั้งเป็นการเรียกใช้เมธอดใน python
numpy.diff
คือช้าเพราะมีการแปลงแรกไปlist
ndarray
เห็นได้ชัดว่าถ้าคุณเริ่มด้วยndarray
มันจะเร็วกว่ามาก :
In [22]: arr = np.array(L)
In [23]: %timeit np.diff(arr)
100 loops, best of 3: 3.02 ms per loop
[abs(j-i) for i,j in zip(t, t[1:])]