คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

7
การตรวจหาช่วงเวลาของอนุกรมเวลาทั่วไป
โพสต์นี้เป็นความต่อเนื่องของโพสต์อื่นที่เกี่ยวข้องกับการเป็นวิธีการทั่วไปสำหรับการตรวจสอบค่าผิดปกติในอนุกรมเวลา โดยทั่วไป ณ จุดนี้ฉันสนใจวิธีที่มีประสิทธิภาพในการค้นพบช่วงเวลา / ฤดูกาลของซีรีย์เวลาทั่วไปที่ได้รับผลกระทบจากเสียงรบกวนมากมาย จากมุมมองของนักพัฒนาฉันต้องการอินเทอร์เฟซที่เรียบง่ายเช่น: unsigned int discover_period(vector<double> v); vอาร์เรย์ที่มีตัวอย่างอยู่ที่ไหนและค่าส่งคืนคือช่วงเวลาของสัญญาณ ประเด็นหลักคืออีกครั้งฉันไม่สามารถทำการสันนิษฐานเกี่ยวกับสัญญาณที่วิเคราะห์ได้ ฉันลองใช้วิธีการโดยอิงตามสัญญาณอัตโนมัติ (การตรวจจับจุดยอดของ correlogram) แล้ว แต่ก็ไม่แข็งแกร่งเท่าที่ฉันต้องการ

3
พวกเรามีปัญหาเรื่อง“ สงสาร upvotes” หรือไม่?
ฉันรู้ว่านี่อาจฟังดูเหมือนว่าเป็นหัวข้อนอก แต่ได้ยินฉัน ที่ Stack Overflow และที่นี่เราได้รับคะแนนโหวตจากโพสต์ทั้งหมดนี้เก็บไว้ในรูปแบบตาราง เช่น: โพสต์ id ผู้มีสิทธิเลือกตั้ง ID ลงคะแนนประเภท datetime ------- -------- --------- -------- 10 1 2 2000-1-1 10:00:01 11 3 3 2000-1-1 10:00:01 10 5 2 2000-1-1 10:00:01 ... และต่อไป โหวตประเภท 2 คือ upvote, โหวตโหวต 3 คือ downvote คุณสามารถสอบถามรุ่นนี้ของข้อมูลนี้แบบไม่เปิดเผยชื่อได้ที่http://data.stackexchange.com มีการรับรู้ว่าหากโพสต์ถึงคะแนน -1 หรือต่ำกว่าก็มีแนวโน้มที่จะ upvoted นี่อาจเป็นเพียงการยืนยันความลำเอียงหรือมันอาจจะหยั่งรากในความเป็นจริง เราจะวิเคราะห์ข้อมูลนี้เพื่อยืนยันหรือปฏิเสธสมมติฐานนี้อย่างไร เราจะวัดผลกระทบของอคตินี้อย่างไร

3
เป็นไปได้ไหมที่จะทำการจัดกลุ่มอนุกรมเวลาตามรูปร่างโค้ง
ฉันมีข้อมูลการขายสำหรับร้านค้าต่างๆและต้องการจัดหมวดหมู่พวกเขาตามรูปร่างของเส้นโค้งเมื่อเวลาผ่านไป ข้อมูลดูเหมือนประมาณนี้ (แต่เห็นได้ชัดว่าไม่ได้สุ่มและมีข้อมูลขาดหายไป): n.quarters <- 100 n.stores <- 20 if (exists("test.data")){ rm(test.data) } for (i in 1:n.stores){ interval <- runif(1, 1, 200) new.df <- data.frame( var0 = interval + c(0, cumsum(runif(49, -5, 5))), date = seq.Date(as.Date("1990-03-30"), by="3 month", length.out=n.quarters), store = rep(paste("Store", i, sep=""), n.quarters)) if (exists("test.data")){ test.data <- rbind(test.data, …

3
วิธีการใช้เพียร์สันสหสัมพันธ์อย่างถูกต้องกับอนุกรมเวลา
ฉันมี 2 ซีรีย์ (ราบรื่นทั้งคู่) ที่ฉันอยากจะครอสสัมพันธ์เพื่อดูว่าพวกมันมีความสัมพันธ์กันอย่างไร ฉันตั้งใจจะใช้สัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน สิ่งนี้เหมาะสมหรือไม่ คำถามที่สองของฉันคือฉันสามารถเลือกตัวอย่าง 2 ซีรี่ส์ได้ตามต้องการ เช่นฉันสามารถเลือกจำนวนข้อมูลที่ฉันต้องการเรา สิ่งนี้จะส่งผลต่อสัมประสิทธิ์สหสัมพันธ์ที่ส่งออกหรือไม่ ฉันจำเป็นต้องพิจารณาเรื่องนี้หรือไม่? เพื่อประกอบการอธิบาย option(i) [1, 4, 7, 10] & [6, 9, 6, 9, 6] option(ii) [1,2,3,4,5,6,7,8,9,10] & [6,7,8,9,8,7,6,7,8,9,8,7,6]

8
ข้อผิดพลาดในการวิเคราะห์อนุกรมเวลา
ฉันเพิ่งเริ่มเรียนรู้ด้วยตนเองในการวิเคราะห์อนุกรมเวลา ฉันสังเกตเห็นว่ามีข้อผิดพลาดที่อาจเกิดขึ้นจำนวนหนึ่งซึ่งไม่สามารถใช้ได้กับสถิติทั่วไป ดังนั้นการสร้างความผิดทางสถิติทั่วไปคืออะไร , ฉันอยากจะถาม: ข้อผิดพลาดทั่วไปหรือความผิดทางสถิติในการวิเคราะห์อนุกรมเวลาคืออะไร สิ่งนี้มีจุดประสงค์เพื่อเป็นชุมชนวิกิหนึ่งแนวคิดต่อหนึ่งคำตอบและโปรดไม่มีการทำซ้ำของข้อผิดพลาดทางสถิติทั่วไปเพิ่มเติมที่ (หรือควรจะ) แสดงรายการที่บาปทางสถิติทั่วไปคืออะไร

8
มีมาตรฐานทองคำสำหรับการสร้างแบบจำลองช่วงเวลาที่เว้นระยะผิดปกติหรือไม่?
ในสาขาเศรษฐศาสตร์ (ฉันคิดว่า) เรามี ARIMA และ GARCH สำหรับอนุกรมเวลาที่มีระยะห่างเป็นประจำและ Poisson, Hawkes สำหรับการสร้างแบบจำลองกระบวนการจุดดังนั้นวิธีการเกี่ยวกับความพยายามสำหรับการสร้างแบบจำลองอนุกรมเวลาเว้นระยะเวลา ? (หากคุณมีความรู้ในหัวข้อนี้คุณสามารถขยายบทความ wiki ที่เกี่ยวข้องได้ด้วย) Edition (เกี่ยวกับค่าที่หายไปและอนุกรมเวลาที่เว้นระยะไม่สม่ำเสมอ): ตอบกลับความคิดเห็น @Lucas Reis หากช่องว่างระหว่างการวัดหรือตัวแปรการรับรู้เป็นระยะห่างเนื่องจาก (ตัวอย่าง) กระบวนการปัวซงไม่มีที่ว่างสำหรับการทำให้เป็นมาตรฐานแบบนี้ แต่มีขั้นตอนง่าย ๆ : t(i)เป็นดัชนีเวลา i-th ของตัวแปร x (เวลา i-th ของ การทำให้เป็นจริง x), จากนั้นกำหนดช่องว่างระหว่างเวลาของการวัดเป็นg(i)=t(i)-t(i-1), จากนั้นเราทำการแยกg(i)โดยใช้ค่าคงที่c, dg(i)=floor(g(i)/cและสร้างอนุกรมเวลาใหม่ที่มีจำนวนค่าว่างระหว่างการสังเกตแบบเก่าจากอนุกรมเวลาดั้งเดิมiและi+1เท่ากับ dg (i) แต่ปัญหาคือ ขั้นตอนสามารถสร้างอนุกรมเวลาได้อย่างง่ายดายด้วยจำนวนข้อมูลที่หายไปที่ใหญ่กว่าจำนวนการสังเกตดังนั้นการประมาณค่าที่สมเหตุสมผลของค่าการสังเกตที่หายไปอาจเป็นไปไม่ได้และใหญ่เกินไปcลบ "โครงสร้างเวลา / การพึ่งพาเวลา ฯลฯ " ของปัญหาการวิเคราะห์ (กรณีที่รุนแรงจะได้รับโดยการc>=max(floor(g(i)/c))ที่เพียงแค่ยุบอนุกรมเวลาเว้นระยะผิดปกติเป็นระยะห่างปกติ Edition2 (เพื่อความสนุกสนาน): …

6
คุณสมบัติสำหรับการจำแนกอนุกรมเวลา
ฉันพิจารณาปัญหาของการจัดประเภทตามอนุกรมเวลาของความยาวผันแปรนั่นคือเพื่อค้นหาฟังก์ชัน ผ่านการแสดงทั่วโลกของชุดเวลาโดยชุดของคุณสมบัติที่เลือกขนาดคงที่เป็นอิสระจาก , จากนั้นใช้วิธีการจำแนกมาตรฐานในชุดคุณสมบัตินี้ ฉันไม่สนใจการคาดการณ์เช่นการทำนายf ( X T ) = y ∈ [ 1 .. K ]TTTv ฉัน D T ϕ ( X T ) = v 1 , … , v D ∈ R , x T + 1f(XT)=y∈[1..K]for XT=(x1,…,xT)with xt∈Rd ,f(XT)=y∈[1..K]for XT=(x1,…,xT)with xt∈Rd ,f(X_T) = y \in [1..K]\\ …

4
วิธีการเปรียบเทียบอนุกรมเวลาสองวิธี
ฉันมีสองชุดเวลาแสดงในโครงเรื่องด้านล่าง: เนื้อเรื่องแสดงรายละเอียดทั้งหมดของอนุกรมเวลาทั้งสอง แต่ฉันสามารถลดมันลงไปในการสังเกตการณ์แบบบังเอิญได้ถ้าต้องการ คำถามของฉันคือ: ฉันสามารถใช้วิธีการทางสถิติเพื่อประเมินความแตกต่างระหว่างอนุกรมเวลาได้อย่างไร ฉันรู้ว่านี่เป็นคำถามที่ค่อนข้างกว้างและคลุมเครือ แต่ฉันไม่สามารถหาข้อมูลเบื้องต้นได้จากทุกที่ อย่างที่ฉันเห็นมันมีสองสิ่งที่แตกต่างในการประเมิน: 1. ค่าเหมือนกันหรือไม่? 2. แนวโน้มเหมือนกันหรือไม่ การทดสอบทางสถิติแบบใดที่คุณแนะนำให้ดูเพื่อประเมินคำถามเหล่านี้ สำหรับคำถามที่ 1 ฉันสามารถประเมินความหมายของชุดข้อมูลที่แตกต่างกันและมองหาความแตกต่างอย่างมีนัยสำคัญในการแจกแจง แต่มีวิธีการทำสิ่งนี้ที่คำนึงถึงลักษณะอนุกรมเวลาของข้อมูลหรือไม่ สำหรับคำถามที่ 2 - มีบางอย่างเหมือนกับการทดสอบ Mann-Kendall ที่มองหาความคล้ายคลึงกันระหว่างสองแนวโน้มหรือไม่ ฉันสามารถทำการทดสอบ Mann-Kendall สำหรับทั้งชุดข้อมูลและเปรียบเทียบ แต่ไม่รู้ว่าเป็นวิธีที่ถูกต้องในการทำสิ่งต่าง ๆ หรือว่ามีวิธีที่ดีกว่า ฉันทำทั้งหมดนี้ใน R ดังนั้นหากการทดสอบที่คุณแนะนำมีแพ็คเกจ R แล้วโปรดแจ้งให้เราทราบ
43 r  time-series 

2
ทำไมรุ่นซีรีย์เวลา MA (q) เรียกว่า "ค่าเฉลี่ยเคลื่อนที่"
เมื่อฉันอ่าน "ค่าเฉลี่ยเคลื่อนที่" สัมพันธ์กับอนุกรมเวลาฉันคิดว่าหรืออาจเป็นน้ำหนัก เฉลี่ยเช่น{t-3} (ฉันรู้ว่าสิ่งเหล่านี้เป็นแบบจำลอง AR (3) แต่สิ่งเหล่านี้เป็นสิ่งที่สมองของฉันกระโดดไป) ทำไม MA (q) แบบจำลองสูตรของข้อผิดพลาดหรือ "นวัตกรรม" อะไรมีจะทำอย่างไรกับค่าเฉลี่ยเคลื่อนที่? ฉันรู้สึกเหมือนฉันขาดสัญชาตญาณบางอย่าง( xt - 1+ xt - 2+ xt - 3)3(xเสื้อ-1+xเสื้อ-2+xเสื้อ-3)3\frac{(x_{t-1} + x_{t-2} + x_{t-3})}30.5 xt - 1+ 0.3 xt - 2+ 0.2 xt - 30.5xเสื้อ-1+0.3xเสื้อ-2+0.2xเสื้อ-30.5x_{t-1} + 0.3x_{t-2} + 0.2x_{t-3}{ ϵ }{ε}\{\epsilon\}

5
วิธีที่จะทำให้ชุดเวลานิ่ง?
นอกเหนือจากการรับความแตกต่างแล้วมีเทคนิคอื่นใดสำหรับการสร้างซีรีส์เวลาที่ไม่หยุดนิ่ง ปกติหนึ่งหมายถึงชุดว่า " บูรณาการของการสั่งซื้อหน้า " ถ้ามันสามารถทำนิ่งผ่านผู้ประกอบการล่าช้าX_t(1−L)PXt(1−L)PXt(1-L)^P X_t

5
การจัดกลุ่มการแปรปรวนเวลาแบบไดนามิก
วิธีใดที่จะใช้ Dynamic Time Warping (DTW) เพื่อทำคลัสเตอร์ของอนุกรมเวลา ฉันได้อ่านเกี่ยวกับ DTW เป็นวิธีการค้นหาความคล้ายคลึงกันระหว่างสองอนุกรมเวลาในขณะที่พวกเขาสามารถเลื่อนเวลา ฉันสามารถใช้วิธีนี้เป็นวิธีการวัดความคล้ายคลึงกันสำหรับอัลกอริทึมการจัดกลุ่มอย่าง k- หมายถึงได้หรือไม่

5
อนุกรมเวลา 'การจัดกลุ่ม' ใน R
ฉันมีชุดข้อมูลอนุกรมเวลา แต่ละซีรี่ส์ครอบคลุมช่วงเวลาเดียวกันแม้ว่าวันที่ที่เกิดขึ้นจริงในแต่ละช่วงเวลาอาจไม่ตรงกับ กล่าวคือถ้าหากต้องอ่านอนุกรมเวลาในเมทริกซ์ 2D มันจะมีลักษณะดังนี้: date T1 T2 T3 .... TN 1/1/01 100 59 42 N/A 2/1/01 120 29 N/A 42.5 3/1/01 110 N/A 12 36.82 4/1/01 N/A 59 40 61.82 5/1/01 05 99 42 23.68 ... 31/12/01 100 59 42 N/A etc ฉันต้องการเขียนสคริปต์ R ที่จะแยกอนุกรมเวลา {T1, T2, ... TN} …

2
วิธีการหาแบบที่ดีสำหรับแบบกึ่งไซนัสใน R?
ฉันต้องการสมมติว่าอุณหภูมิผิวน้ำทะเลของทะเลบอลติกเป็นปีเดียวกันแล้วปีเล่าแล้วอธิบายด้วยแบบจำลองเชิงเส้นตรง ความคิดที่ฉันมีคือเพียงแค่ใส่ปีเป็นเลขทศนิยม (หรือ num_months / 12) และทราบว่าอุณหภูมิควรเป็นเท่าไหร่ในช่วงเวลานั้น การโยนมันลงใน lm () ฟังก์ชั่นใน R มันไม่รู้จักข้อมูลไซน์ดังนั้นมันจึงสร้างเส้นตรง ดังนั้นฉันจึงใส่ฟังก์ชั่น sin () ไว้ในวงเล็บ I () และลองใช้ค่าสองสามค่าเพื่อให้พอดีกับฟังก์ชั่นด้วยตนเองและนั่นก็ใกล้เคียงกับสิ่งที่ฉันต้องการ แต่ทะเลร้อนขึ้นเร็วกว่าในฤดูร้อนแล้วเย็นลงในฤดูใบไม้ร่วงช้าลง ... ดังนั้นแบบจำลองจึงผิดพลาดในปีแรกจากนั้นแก้ไขให้ถูกต้องมากขึ้นหลังจากสองสามปีที่ผ่านมาและในอนาคตฉันคิดว่ามันจะยิ่งมากขึ้น และผิดมากขึ้นอีกครั้ง ฉันจะได้รับ R เพื่อประเมินโมเดลสำหรับฉันดังนั้นฉันไม่ต้องเดาตัวเลขเอง กุญแจสำคัญในที่นี้คือฉันต้องการให้มันสร้างค่าเหมือนเดิมทุกปีไม่ใช่แค่ให้ถูกต้องหนึ่งปี ถ้าฉันรู้เรื่องคณิตศาสตร์มากขึ้นฉันอาจเดาได้ว่ามันเป็นเหมือนปัวซองหรือเกาส์แทนบาป () แต่ฉันก็ไม่รู้ว่าจะทำเช่นนั้นได้อย่างไร ความช่วยเหลือใด ๆ ที่จะเข้าใกล้คำตอบที่ดีจะได้รับการชื่นชมอย่างมาก นี่คือข้อมูลที่ฉันใช้และรหัสเพื่อแสดงผลลัพธ์: # SST from Bradtke et al 2010 ToY <- c(1/12,2/12,3/12,4/12,5/12,6/12,7/12,8/12,9/12,10/12,11/12,12/12,13/12,14/12,15/12,16/12,17/12,18/12,19/12,20/12,21/12,22/12,23/12,24/12,25/12,26/12,27/12,28/12,29/12,30/12,31/12,32/12,33/12,34/12,35/12,36/12,37/12,38/12,39/12,40/12,41/12,42/12,43/12,44/12,45/12,46/12,47/12,48/12) Degrees <- c(3,2,2.2,4,7.6,13,16,16.1,14,10.1,7,4.5,3,2,2.2,4,7.6,13,16,16.1,14,10.1,7,4.5,3,2,2.2,4,7.6,13,16,16.1,14,10.1,7,4.5,3,2,2.2,4,7.6,13,16,16.1,14,10.1,7,4.5) SST <- …
37 r  regression  time-series  lm 

4
ความแตกต่างระหว่างการพยากรณ์และการทำนาย?
ฉันสงสัยว่าความแตกต่างและความสัมพันธ์ระหว่างการพยากรณ์และการทำนายคืออะไร โดยเฉพาะในอนุกรมเวลาและการถดถอย ตัวอย่างเช่นฉันแก้ไขให้ถูกต้อง: ในอนุกรมเวลาการคาดการณ์ดูเหมือนว่าจะหมายถึงการประเมินค่าในอนาคตที่กำหนดให้ค่าที่ผ่านมาของอนุกรมเวลา ในการถดถอยการคาดคะเนดูเหมือนจะหมายถึงการประมาณค่าว่าเป็นข้อมูลในอนาคตปัจจุบันหรือในอดีตของข้อมูลที่ได้รับ ขอบคุณและขอแสดงความนับถือ!

5
การวิเคราะห์ข้ามอนุกรมเวลาที่ผ่านการตรวจสอบความถูกต้อง
ฉันใช้ชุดคาเร็ตใน R เพื่อสร้างแบบจำลองการทำนายสำหรับการจำแนกและการถดถอย คาเร็ตมีอินเทอร์เฟซแบบรวมเพื่อปรับแต่งพารามิเตอร์ไฮเปอร์โมเดลโดยการตรวจสอบข้ามหรือการรัดสาย ตัวอย่างเช่นหากคุณกำลังสร้างแบบจำลอง 'เพื่อนบ้านที่ใกล้ที่สุด' อย่างง่ายสำหรับการจำแนกคุณควรใช้เพื่อนบ้านกี่คน 2? 10? 100? คาเร็ตช่วยให้คุณตอบคำถามนี้โดยการสุ่มตัวอย่างข้อมูลของคุณใหม่ลองใช้พารามิเตอร์ที่แตกต่างกันจากนั้นรวบรวมผลลัพธ์เพื่อตัดสินใจว่าผลลัพธ์ใดที่มีความแม่นยำในการทำนายที่ดีที่สุด ฉันชอบวิธีการนี้เนื่องจากเป็นวิธีการที่มีประสิทธิภาพสำหรับการเลือกพารามิเตอร์ไฮเปอร์โมเดลและเมื่อคุณเลือกพารามิเตอร์ไฮเปอร์สุดท้ายแล้วจะมีการประเมินที่ผ่านการตรวจสอบความถูกต้องของวิธีการ 'ดี' โดยใช้ความแม่นยำสำหรับโมเดลการจำแนกประเภท และ RMSE สำหรับตัวแบบการถดถอย ตอนนี้ฉันมีข้อมูลอนุกรมเวลาที่ฉันต้องการสร้างแบบจำลองการถดถอยสำหรับอาจใช้ฟอเรสต์แบบสุ่ม เทคนิคที่ดีในการประเมินความถูกต้องทำนายของแบบจำลองของฉันคืออะไรโดยธรรมชาติของข้อมูล หากป่าสุ่มไม่ได้ใช้กับข้อมูลอนุกรมเวลาวิธีที่ดีที่สุดในการสร้างแบบจำลองวงดนตรีที่ถูกต้องสำหรับการวิเคราะห์อนุกรมเวลาคืออะไร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.