วิธีการจัดเวลาแบบกลุ่ม


22

ฉันมีคำถามเกี่ยวกับการวิเคราะห์กลุ่ม มี 3,000 บริษัท ที่ต้องทำคลัสเตอร์ตามการใช้พลังงานในระยะเวลา 5 ปี แต่ละ บริษัท มีค่าสำหรับทุก ๆ ชั่วโมงในช่วง 5 ปี ฉันต้องการทราบว่าบาง บริษัท มีรูปแบบการใช้พลังงานเหมือนกันในช่วงระยะเวลาหนึ่งหรือไม่ ควรใช้ผลลัพธ์เพื่อทำนายการใช้พลังงานรายวัน หากคุณมีความคิดบางอย่างเกี่ยวกับวิธีการจัดลำดับเวลาใน SPSS โปรดแบ่งปันกับฉัน


1
ฉันขอแนะนำให้คุณตรวจสอบลิงก์ที่เกี่ยวข้องทางด้านขวาของหน้า มีคำถามสองสามข้อที่มีลักษณะคล้ายกันมากดูเป็นไปได้ไหมที่จะทำการจัดกลุ่มอนุกรมเวลาตามรูปร่างโค้ง และการสร้างแบบจำลองข้อมูลระยะยาวที่ผลกระทบของเวลาแตกต่างกันไปในรูปแบบการทำงานระหว่างบุคคลเพียงสองตัวอย่าง
Andy W

Proc Similarity ใน SAS สามารถทำอนุกรมเวลาได้
พยากรณ์

คำตอบ:


11

A)ใช้เวลามากในการประมวลผลข้อมูลล่วงหน้า การประมวลผลล่วงหน้า 90% ของงานของคุณ

B)เลือกการวัดความคล้ายคลึงกันที่เหมาะสมสำหรับอนุกรมเวลา ตัวอย่างเช่นระยะทางข้ามเขตแดนอาจเป็นตัวเลือกที่ดีที่นี่ คุณอาจไม่ต้องการระยะทางแปรปรวนเวลาแบบไดนามิกเว้นแต่ว่าคุณจะมีเขตเวลาที่แตกต่างกัน การข้ามเกณฑ์อาจเหมาะสมกว่าในการตรวจสอบรูปแบบชั่วคราวขณะที่ไม่สนใจขนาดที่แท้จริง (ซึ่งน่าจะแตกต่างจาก บริษัท หนึ่งไปอีก บริษัท หนึ่ง)

C) Cluster เมทริก dissimlarity ที่เกิดขึ้นโดยใช้วิธีการเช่นการจัดกลุ่มแบบลำดับชั้นหรือ DBSCAN ที่สามารถทำงานกับฟังก์ชันระยะทางโดยพลการ


คุณสามารถอธิบายได้ไหมว่าทำไมระยะเวลาแปรปรวนแบบไดนามิกไม่มีทางเลือกที่ดีสำหรับการจัดกลุ่มอนุกรมเวลา
Hardik Gupta

นั่นไม่ใช่คำแถลงทั่วไป ไม่ว่าจะดีหรือไม่นั้นขึ้นอยู่กับว่าคุณต้องการให้เวลาแปรปรวนหรือไม่
Anony-Mousse - Reinstate Monica

7

คุณอาจต้องการดูการพยากรณ์อนุกรมเวลารายชั่วโมงโดยมีการแจกแจงรายวันรายสัปดาห์และรายปีสำหรับการสนทนาของข้อมูลรายชั่วโมงที่เกี่ยวข้องกับข้อมูลรายวันและวันหยุด / regressors คุณมีข้อมูล 5 ปีในขณะที่การสนทนาอื่น ๆ เกี่ยวข้องกับค่ารายวัน 883 สิ่งที่ฉันอยากจะแนะนำก็คือคุณสามารถสร้างการคาดการณ์รายชั่วโมงซึ่งรวมเอา regressors ไว้เช่น day-of-the-week; สัปดาห์ของปีและวันหยุดโดยใช้ผลรวมรายวันเป็นตัวทำนายเพิ่มเติม ด้วยวิธีนี้คุณจะมี 24 โมเดลสำหรับแต่ละ บริษัท 3,000 แห่ง ตอนนี้สิ่งที่คุณต้องการทำคือประมาณชั่วโมงให้ประมาณ 3,000 รุ่นโดยใช้โครงสร้างบัญชี ARIMAX ทั่วไปสำหรับรูปแบบการตอบสนองของผู้ลงทะเบียนแต่ละรายวันต่อสัปดาห์การเปลี่ยนแปลงในวันต่อสัปดาห์ พารามิเตอร์และตัวชี้วัดรายสัปดาห์ในขณะที่แยกค่าผิดปกติ จากนั้นคุณสามารถประมาณค่าพารามิเตอร์ทั่วโลกโดยใช้ บริษัท 3,000 แห่ง ทำการทดสอบ Chow http://en.wikipedia.org/wiki/Chow_testสำหรับความมั่นคงของพารามิเตอร์และเมื่อปฏิเสธกลุ่ม บริษัท ในกลุ่มที่เป็นเนื้อเดียวกัน ฉันเรียกสิ่งนี้ว่าการวิเคราะห์คลัสเตอร์มิติเดียว เนื่องจาก SPSS มีความสามารถที่ จำกัด มากในอนุกรมเวลาคุณจึงอาจต้องการหาที่อื่นในซอฟต์แวร์


1
"วานิลลา" ดูเหมือนคำแปลก ๆ ที่จะใช้เกี่ยวกับ R; ไม่ชัดเจนในการแปลในคำศัพท์ R ปกติมากขึ้น ความแตกต่างระหว่างฐาน R และแพ็คเกจเสริมจาก CRAN นั้นไม่ได้ทำให้ผู้ใช้ที่มีประสบการณ์หรือแม้แต่คนที่เพิ่งหัดใช้งานจริงเพราะพวกเขามีอิสระเท่ากันและเข้าถึงได้เท่าเทียมกัน ความประทับใจของฉันคือคนที่สามารถเข้าถึง SPSS สามารถพูดได้ค่อนข้างง่ายว่าปัจจุบัน SPSS บางอย่างไม่สามารถทำได้โดยไม่ต้องเขียนโปรแกรม ในการพูดเกี่ยวกับ R นั้นต้องใช้ความคุ้นเคยกับแพ็คเกจอนุกรมเวลาทั้งหมด
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.