ฉันต้องการตรวจสอบฤดูกาลตามข้อมูลที่ฉันได้รับ มีวิธีการบางอย่างที่ฉันพบเช่นพล็อตย่อยตามฤดูกาลและพล็อตออโต้คอร์เรชั่น แต่สิ่งที่ฉันไม่เข้าใจวิธีการอ่านกราฟทุกคนสามารถช่วยได้หรือไม่ อีกวิธีคือมีวิธีอื่นในการตรวจสอบฤดูกาลที่มีหรือไม่มีผลสุดท้ายในกราฟ?
ฉันต้องการตรวจสอบฤดูกาลตามข้อมูลที่ฉันได้รับ มีวิธีการบางอย่างที่ฉันพบเช่นพล็อตย่อยตามฤดูกาลและพล็อตออโต้คอร์เรชั่น แต่สิ่งที่ฉันไม่เข้าใจวิธีการอ่านกราฟทุกคนสามารถช่วยได้หรือไม่ อีกวิธีคือมีวิธีอื่นในการตรวจสอบฤดูกาลที่มีหรือไม่มีผลสุดท้ายในกราฟ?
คำตอบ:
วิธีที่ดีจริงๆที่จะหาช่วงในชุดปกติใด ๆ ของข้อมูลคือการตรวจสอบคลื่นไฟฟ้าของมันหลังจากที่ถอดแนวโน้มโดยรวม ๆ (สิ่งนี้ให้ผลดีกับการตรวจคัดกรองอัตโนมัติเมื่อกำลังรวมปกติเป็นค่ามาตรฐานเช่นความเป็นเอกภาพ) การกำจัดแนวโน้มเบื้องต้น (และความแตกต่างเพิ่มเติมเพื่อลบความสัมพันธ์แบบอนุกรม) เป็นสิ่งจำเป็นเพื่อหลีกเลี่ยงช่วงเวลาที่สับสนกับพฤติกรรมอื่น ๆ
สเปกตรัมพลังงานคือการแปลงฟูริเยร์แบบไม่ต่อเนื่องของฟังก์ชัน autocovariance ของรุ่นดั้งเดิมที่มีความเรียบเนียนเหมาะสม หากคุณคิดว่าอนุกรมเวลาเป็นการสุ่มตัวอย่างรูปคลื่นทางกายภาพคุณสามารถประเมินได้ว่าจะใช้พลังงานทั้งหมดของคลื่นภายในแต่ละความถี่เท่าใด สเปกตรัมพลังงาน (หรือperiodogram ) แปลงกำลังไฟฟ้ากับความถี่ วงจร (นั่นคือรูปแบบซ้ำหรือตามฤดูกาล) จะปรากฏขึ้นเป็นแหลมขนาดใหญ่ตั้งอยู่ที่ความถี่ของพวกเขา
ยกตัวอย่างเช่นพิจารณาอนุกรมเวลา (จำลอง) ของส่วนที่เหลือจากการวัดรายวันที่ดำเนินการเป็นเวลาหนึ่งปี (ค่า 365)
นี่คือพล็อตของข้อมูลเดียวกันอีกชุดหนึ่งที่วาดขึ้นมาเพื่อช่วยให้เราเห็นรูปแบบเป็นระยะ
หากคุณดูยากจริงๆคุณอาจสังเกตเห็นรูปแบบที่มีเสียงดัง แต่ซ้ำ ๆ ที่เกิดขึ้น 11 ถึง 12 ครั้ง ซีเควนซ์ longish ของค่าเหนือศูนย์และต่ำกว่าศูนย์อย่างน้อยแนะนำ autocorrelation บวกแสดงชุดนี้ไม่สุ่มสมบูรณ์
นี่คือ periodogram ที่แสดงสำหรับความถี่สูงถึง 91 (หนึ่งในสี่ของความยาวทั้งหมด) มันถูกสร้างขึ้นด้วยหน้าต่าง Welch และทำให้เป็นมาตรฐานในพื้นที่หน่วย (สำหรับ periodogram ทั้งหมดไม่ใช่เฉพาะส่วนที่แสดงที่นี่)
พลังงานดูเหมือน "เสียงสีขาว" (ความผันผวนแบบสุ่มขนาดเล็ก) บวกกับหนามแหลมสองอัน มันยากที่จะพลาดใช่มั้ย ขนาดใหญ่เกิดขึ้นที่ระยะเวลา 12 และขนาดเล็กที่ระยะเวลา 52 วิธีนี้ได้ตรวจพบรอบเดือนและรอบสัปดาห์ในข้อมูลเหล่านี้ นั่นคือทั้งหมดที่มีให้มัน หากต้องการตรวจจับรอบอัตโนมัติ ("ฤดูกาล") เพียงแค่สแกนแผ่นเวลา (ซึ่งเป็นรายการค่า) สำหรับค่าสูงสุดในพื้นที่ที่ค่อนข้างใหญ่
ได้เวลาเปิดเผยวิธีสร้างข้อมูลเหล่านี้
ค่าถูกสร้างขึ้นจากผลรวมของคลื่นไซน์สองอันอันหนึ่งที่มีความถี่ 12 (ของแอมพลิจูดกำลังสอง 3/4) และอีกอันที่มีความถี่ 52 (ของแอมพลิจูดกำลังสอง 1/4) นี่คือสิ่งที่แหลมใน periodogram ตรวจพบ ผลรวมของพวกเขาแสดงเป็นเส้นโค้งสีดำหนา Iid เสียงรบกวนปกติของความแปรปรวน 2 ถูกเพิ่มเข้ามาตามที่แสดงโดยแถบสีเทาอ่อนที่ขยายจากเส้นโค้งสีดำไปยังจุดสีแดง เสียงนี้แนะนำให้ใช้ wiggles ระดับต่ำที่ด้านล่างของ periodogram ซึ่งอาจจะเป็นค่าคงที่ 0 เต็มสองในสามของความแปรปรวนทั้งหมดในค่านั้นไม่เป็นระยะและสุ่มซึ่งมีเสียงดังมาก: นั่นคือเหตุผลที่มัน ยากมากที่จะทำให้เป็นระยะเพียงแค่มองไปที่จุดต่างๆ อย่างไรก็ตาม (ส่วนหนึ่งเป็นเพราะมีข้อมูลมาก) การค้นหาความถี่ด้วย periodogram นั้นง่ายและผลลัพธ์นั้นชัดเจน
คำแนะนำและคำแนะนำที่ดีสำหรับการคำนวณช่วงเวลากราฟปรากฏบนไซต์สูตรตัวเลข : มองหาส่วนที่ "การประมาณสเปกตรัมพลังงานโดยใช้ FFT" R
มีรหัสสำหรับการประมาณ periodogram ภาพประกอบเหล่านี้สร้างขึ้นในMathematica 8; periodogram คำนวณด้วยฟังก์ชัน "ฟูริเยร์"
นี่คือตัวอย่างการใช้ข้อมูลรายเดือนเกี่ยวกับการเรียกร้องการว่างงานจากเมืองในรัฐนิวเจอร์ซีย์ (จาก Stata เพียงเพราะนั่นคือสิ่งที่ฉันวิเคราะห์ข้อมูลเหล่านี้ในตอนแรก)
ความสูงของเส้นแสดงความสัมพันธ์ระหว่างตัวแปรและความล่าช้าของตัวมันเอง พื้นที่สีเทาให้ความรู้สึกว่าความสัมพันธ์นี้มีนัยสำคัญหรือไม่ (ช่วงนี้เป็นแนวทางเท่านั้นและไม่ใช่วิธีที่เชื่อถือได้ที่สุดในการทดสอบความสำคัญ) หากความสัมพันธ์นี้สูงแสดงว่ามีความสัมพันธ์แบบอนุกรม สังเกต humps ที่เกิดขึ้นในช่วง 12, 24 และ 36 เนื่องจากนี่เป็นข้อมูลรายเดือนสิ่งนี้ชี้ให้เห็นว่าความสัมพันธ์มีความแข็งแกร่งมากขึ้นเมื่อคุณดูช่วงเวลา 1, 2 หรือ 3 ปีก่อน นี่คือหลักฐานของฤดูกาลรายเดือน
คุณสามารถทดสอบความสัมพันธ์เหล่านี้ได้ทางสถิติโดยการถดถอยตัวแปรกับตัวแปรดัมมี่ที่ระบุองค์ประกอบตามฤดูกาล --- ที่นี่, เดือนหุ่น คุณสามารถทดสอบความสำคัญร่วมกันของหุ่นเหล่านั้นเพื่อทดสอบตามฤดูกาล
ขั้นตอนนี้ไม่ถูกต้องเนื่องจากการทดสอบต้องการให้ข้อกำหนดข้อผิดพลาดไม่สัมพันธ์กันอย่างจริงจัง ดังนั้นก่อนการทดสอบหุ่นตามฤดูกาลเหล่านี้เราจำเป็นต้องลบความสัมพันธ์แบบอนุกรมที่เหลืออยู่ (โดยทั่วไปแล้วรวมถึงการล่าช้าของตัวแปร) อาจมีจังหวะหยุดพักและปัญหาอนุกรมเวลาอื่น ๆ ที่คุณต้องแก้ไขให้ถูกต้องเพื่อให้ได้ผลลัพธ์ที่เหมาะสมจากการทดสอบ คุณไม่ได้ถามถึงสิ่งเหล่านั้นดังนั้นฉันจะไม่ลงรายละเอียด (รวมถึงมีคำถาม CV มากมายในหัวข้อเหล่านั้น) (เพื่อป้อนความอยากรู้อยากเห็นของคุณชุดนี้ต้องใช้เดือนหุ่นความล่าช้าของตัวเองเดียวและองค์ประกอบการเปลี่ยนแปลงเพื่อกำจัดความสัมพันธ์แบบอนุกรม)
ฤดูกาลและสามารถเปลี่ยนแปลงได้ตลอดเวลาดังนั้นมาตรการสรุปอาจไม่เพียงพอในการตรวจจับโครงสร้าง เราต้องทดสอบความไม่ต่อเนื่องของค่าสัมประสิทธิ์ ARIMA และมักจะเปลี่ยนแปลงใน“ หุ่นจำลองตามฤดูกาล” ตัวอย่างเช่นในช่วง 10 ปีที่ผ่านมาอาจไม่มีผลกระทบในเดือนมิถุนายนสำหรับปีแรก k แต่ปี 10-k สุดท้ายมีหลักฐานของผลมิถุนายน คอมโพสิตเอฟเฟกต์มิถุนายนอาจไม่สำคัญเนื่องจากเอฟเฟกต์ไม่คงที่ตลอดเวลา ในทำนองเดียวกันองค์ประกอบ ARIMA ตามฤดูกาลอาจมีการเปลี่ยนแปลงเช่นกัน ควรใช้ความระมัดระวังเพื่อรวมถึงการเปลี่ยนแปลงระดับท้องถิ่นและหรือแนวโน้มเวลาท้องถิ่นในขณะที่มั่นใจว่าความแปรปรวนของข้อผิดพลาดยังคงอยู่ตลอดเวลา เราไม่ควรประเมินการเปลี่ยนแปลงเช่น GLS / น้ำหนักน้อยที่สุดกำลังสองหรือการแปลงพลังงานเช่นบันทึก / รากที่สองเป็นต้น บนข้อมูลดั้งเดิม แต่เกิดจากข้อผิดพลาดจากแบบจำลองเบื้องต้น สมมติฐานแบบเกาส์ไม่มีอะไรเกี่ยวข้องกับข้อมูลที่สังเกต แต่ทั้งหมดเกี่ยวข้องกับข้อผิดพลาดจากตัวแบบ นี่คือสาเหตุที่ underpinnings ของการทดสอบทางสถิติที่ใช้อัตราส่วนของตัวแปรไคสแควร์ที่ไม่ได้เป็นศูนย์กลางกับตัวแปรไคสแควร์กลาง
หากคุณต้องการโพสต์ชุดตัวอย่างจากโลกของคุณฉันยินดีที่จะให้คุณและรายการการวิเคราะห์อย่างละเอียดที่นำไปสู่การตรวจสอบโครงสร้างตามฤดูกาล
คำตอบของ Charlie เป็นสิ่งที่ดีและเป็นจุดเริ่มต้น หากคุณไม่ต้องการใช้กราฟ ACF คุณสามารถสร้างตัวแปรจำลอง k-1 สำหรับช่วงเวลา k ที่มีอยู่ จากนั้นคุณสามารถดูว่าตัวแปรดัมมี่มีความสำคัญในการถดถอยด้วยตัวแปรดัมมี่ (และน่าจะเป็นคำแนวโน้ม)
หากข้อมูลของคุณเป็นรายไตรมาส: dummy Q2 คือ 1 หากนี่คือไตรมาสที่สองหรือ 0 dummy ไตรมาสที่ 3 คือ 1 หากนี่คือไตรมาสที่สามและอีก 0 dummy Q4 คือ 1 หากนี่คือไตรมาสที่สี่และ 0 หมายเหตุไตรมาสที่ 1 คือ กรณีฐาน (ทั้ง 3 ศูนย์หุ่น)
คุณอาจต้องการตรวจสอบ "การแตกสลายอนุกรมเวลา" ใน Minitab - มักเรียกว่า "การสลายตัวแบบคลาสสิก" ในที่สุดคุณอาจต้องการใช้สิ่งที่ทันสมัยกว่านี้ แต่นี่เป็นจุดเริ่มต้นที่เรียบง่าย
ฉันต้องการรับข้อเสนอความช่วยเหลือจากผู้ใช้ IrishStat หรือคนอื่น ๆ ในซีรีส์ตัวอย่างในโลกแห่งความจริง ฉันกำลังพยายามจัดทำดัชนีตามฤดูกาลโดยอิงจากราคาล่วงหน้า 5 ปีของน้ำมันดิบ ฉันได้ managaged การผลิตเฉลี่ยที่เรียบง่ายตามฤดูกาลที่สามารถดูได้ที่นี่
อย่างไรก็ตามฉันต้องการสร้างกราฟฤดูกาลใหม่ทุกปี (ฉันเดาว่าการกลิ้งหมายถึงจุดเริ่มต้นและจุดจบสำหรับปีนั้นมีค่าเท่ากัน) และอยู่ในระดับศูนย์ถึง 100 ตามที่แสดงในภาพตะโกน:
มีข้อมูลระดับราคา 15 วันในสเปรดชีตซึ่งสามารถดาวน์โหลดได้ ตัวอย่างหรือคำใบ้ใด ๆ เกี่ยวกับวิธีการบรรลุเป้าหมายข้างต้นจะได้รับการชื่นชมอย่างมาก
ฉันเป็นคนใหม่สำหรับตัวฉันเอง แต่ความเข้าใจของฉันเกี่ยวกับฟังก์ชั่น ACF คือถ้าเส้นแนวตั้งอยู่เหนือเส้นประด้านบนหรือด้านล่างของเส้นประด้านล่างจะมีการตอบกลับอัตโนมัติบางส่วน