pandas resample เอกสาร


184

ดังนั้นฉันจึงเข้าใจวิธีการใช้งานresampleอย่างสมบูรณ์แต่เอกสารไม่ทำงานอธิบายตัวเลือกได้ดี

ดังนั้นตัวเลือกส่วนใหญ่ในresampleฟังก์ชั่นจะค่อนข้างตรงไปตรงมายกเว้นสำหรับสองตัวนี้:

  • กฎ: สตริงออฟเซตหรือวัตถุที่เป็นตัวแทนของการแปลงเป้าหมาย
  • อย่างไร: สตริง, วิธีการดาวน์ - หรือการสุ่มตัวอย่างใหม่, เริ่มต้นที่ 'หมายถึง'

ดังนั้นจากการดูตัวอย่างให้มากที่สุดเท่าที่ฉันพบทางออนไลน์ฉันสามารถดูกฎที่คุณสามารถทำได้'D'ในแต่ละวัน'xMin'เป็นนาที'xL'เป็นมิลลิวินาที แต่นั่นคือทั้งหมดที่ฉันสามารถหาได้

สำหรับวิธีการที่ฉันได้เห็นต่อไปนี้: 'first', np.max, 'last', 'mean'และ'n1n2n3n4...nx'ที่ NX เป็นตัวอักษรตัวแรกของดัชนีแต่ละคอลัมน์

ดังนั้นจะมีที่ไหนสักแห่งในเอกสารที่ฉันขาดหายไปซึ่งจะแสดงทุกตัวเลือกสำหรับpandas.resampleกฎและวิธีการป้อนข้อมูล? ถ้าใช่ที่ไหนเพราะฉันไม่สามารถหาได้ หากไม่มีตัวเลือกทั้งหมดสำหรับพวกเขาคืออะไร?


8
สำหรับพเนจรของ Google สำหรับ resampling ใช้how='last'และอย่าลืมที่จะเพิ่มhow='first' ลิงก์closed='left', label='left'
Nasser Al-Wohaibi

@ NasserAl-Wohaibi ฉันค่อนข้างมั่นใจว่าความคิดเห็นของคุณด้านบนเป็นตัวบ่งชี้ว่าตัวเลือกเหล่านี้สามารถช่วยตอบคำถามต่อไปนี้ได้อย่างสมบูรณ์ คุณเคยพบปัญหานี้มาก่อนหรือไม่ stackoverflow.com/questions/26247301/…
Amelio Vazquez-Reina

วิธี = 'สุดท้าย' ถูกคัดค้านในขณะนี้ในความโปรดปรานของresample(...).last()
Shadi

คำตอบ:


314
B         business day frequency
C         custom business day frequency (experimental)
D         calendar day frequency
W         weekly frequency
M         month end frequency
SM        semi-month end frequency (15th and end of month)
BM        business month end frequency
CBM       custom business month end frequency
MS        month start frequency
SMS       semi-month start frequency (1st and 15th)
BMS       business month start frequency
CBMS      custom business month start frequency
Q         quarter end frequency
BQ        business quarter endfrequency
QS        quarter start frequency
BQS       business quarter start frequency
A         year end frequency
BA, BY    business year end frequency
AS, YS    year start frequency
BAS, BYS  business year start frequency
BH        business hour frequency
H         hourly frequency
T, min    minutely frequency
S         secondly frequency
L, ms     milliseconds
U, us     microseconds
N         nanoseconds

ดูเอกสาร timeseries มันมีรายการออฟเซ็ต (และ'ออฟเซ็ต' anchored ' ) และส่วนที่เกี่ยวกับการสุ่มใหม่

โปรดทราบว่าไม่มีรายการของhowตัวเลือกที่แตกต่างกันทั้งหมดเพราะมันอาจเป็นฟังก์ชั่นอาร์เรย์ NumPy ใด ๆ และฟังก์ชั่นใด ๆ ที่มีให้ผ่านการจัดกลุ่มโดยการส่งกลุ่มสามารถส่งผ่านไปยังhowชื่อ


1
"... เพราะมันอาจเป็นฟังก์ชั่นอาเรย์ NumPy และ ... " - ใช่ฉันอ่านมันในเอกสาร แต่มีเอกสารใด ๆ ที่อธิบายว่าสิ่งที่ฟังก์ชั่นนี้ควรทำและสิ่งที่เกี่ยวข้องกับ resampling ... ? ฉันรู้สึกหลงทางที่นี่
jhin

1
ควรเชื่อมโยงกับทุกพื้นที่ของเอกสารที่เกี่ยวข้องเช่น resample นี่คือลิงค์ไปสู่ตัวย่อ: pandas.pydata.org/pandas-docs/stable/ ......
Wordsforthewise

เพิ่มคำขอดึงเพื่อปรับปรุงเอกสารgithub.com/pandas-dev/pandas/pull/30252
Aseem Bansal

65

มีมากกว่านั้น แต่คุณอาจมองหารายการนี้:

B   business day frequency
C   custom business day frequency (experimental)
D   calendar day frequency
W   weekly frequency
M   month end frequency
BM  business month end frequency
MS  month start frequency
BMS business month start frequency
Q   quarter end frequency
BQ  business quarter endfrequency
QS  quarter start frequency
BQS business quarter start frequency
A   year end frequency
BA  business year end frequency
AS  year start frequency
BAS business year start frequency
H   hourly frequency
T   minutely frequency
S   secondly frequency
L   milliseconds
U   microseconds

แหล่งข้อมูล: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases


8
ทำไมไม่มี 'ขั้นต่ำ' (เหมือนกับ '5Min' ที่ใช้ในเอกสารประกอบ)
ziyuang

@zyuang เฉพาะรูปแบบย่อที่แสดงที่นี่: "ms" ก็หายไปจากรายการเช่น
Julien__
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.