คำถามติดแท็ก lags

5
การรวมตัวแปรขึ้นอยู่กับความล่าช้าในการถดถอย
ฉันสับสนมากว่าการรวมตัวแปรที่ล้าหลังลงในแบบจำลองการถดถอยนั้นถูกต้องหรือไม่ โดยทั่วไปฉันคิดว่าถ้ารุ่นนี้มุ่งเน้นไปที่ความสัมพันธ์ระหว่างการเปลี่ยนแปลงใน Y และตัวแปรอิสระอื่น ๆ จากนั้นการเพิ่มตัวแปรที่ขึ้นต่อกันล้าหลังในด้านขวามือสามารถรับประกันได้ว่าสัมประสิทธิ์ก่อนค่า IV อื่น ๆ เป็นอิสระจากค่าก่อนหน้าของ Y บางคนบอกว่าการรวม LDV จะทำให้ค่าสัมประสิทธิ์ของ IV อื่น ๆ ลดลง บางคนบอกว่าสามารถรวม LDV ซึ่งสามารถลดความสัมพันธ์แบบอนุกรม ฉันรู้ว่าคำถามนี้ค่อนข้างทั่วไปในแง่ของการถดถอยชนิดใด แต่ความรู้ทางสถิติของฉันมี จำกัด และฉันมีเวลายากมากที่จะหาว่าถ้าฉันควรรวมตัวแปรที่ล้าหลังลงในแบบจำลองการถดถอยเมื่อโฟกัสคือการเปลี่ยนแปลงของ Y เมื่อเวลาผ่านไป มีวิธีอื่นที่จะจัดการกับอิทธิพลของ Xs ที่มีต่อการเปลี่ยนแปลงของ Y เมื่อเวลาผ่านไปหรือไม่? ฉันลองใช้คะแนนการเปลี่ยนแปลงที่แตกต่างกันเช่น DV แต่ R กำลังสองในสถานการณ์นั้นต่ำมาก

1
อนุกรมเวลาหลายตัวแปรใน R. วิธีการค้นหาความสัมพันธ์ล้าหลังและสร้างแบบจำลองสำหรับการพยากรณ์
ฉันใหม่ในหน้านี้และค่อนข้างใหม่ในสถิติและอาร์ฉันกำลังทำงานในโครงการสำหรับวิทยาลัยโดยมีวัตถุประสงค์เพื่อค้นหาความสัมพันธ์ระหว่างฝนและระดับน้ำไหลในแม่น้ำ เมื่อได้รับการพิสูจน์ความสัมพันธ์ฉันต้องการที่จะคาดการณ์ / ทำนายมัน ข้อมูลที่ ฉันมีชุดข้อมูลเป็นเวลาหลายปี (ถ่ายทุกๆ 5 นาที) สำหรับแม่น้ำที่มี: ปริมาณน้ำฝนหน่วยเป็นมิลลิเมตร แม่น้ำไหลในลูกบาศก์เมตรต่อวินาที แม่น้ำนี้ไม่มีหิมะดังนั้นโมเดลจึงขึ้นอยู่กับฝนและเวลาเท่านั้น มีการแช่แข็งอุณหภูมิเป็นครั้งคราว แต่ฉันกำลังคิดที่จะลบช่วงเวลาเหล่านั้นออกจากข้อมูลเป็นค่าผิดปกติเนื่องจากสถานการณ์นั้นอยู่นอกขอบเขตสำหรับโครงการของฉัน ตัวอย่างที่ นี่คุณมีตัวอย่างข้อมูลสองสามแปลงจากฝนและน้ำขึ้นในไม่กี่ชั่วโมงต่อมา เส้นสีแดงคือการไหลของแม่น้ำ สีส้มคือฝน คุณสามารถเห็นฝนตกทุกครั้งก่อนที่น้ำจะไหลขึ้นมาในแม่น้ำ มีฝนเริ่มอีกครั้งในตอนท้ายของอนุกรมเวลา แต่มันจะส่งผลกระทบต่อการไหลของแม่น้ำในภายหลัง ความสัมพันธ์อยู่ที่นั่น นี่คือสิ่งที่ฉันทำใน R เพื่อพิสูจน์ความสัมพันธ์โดยใช้ ccf ใน R: ข้ามสหสัมพันธ์ ตัวแปรชั้นนำ ความล่าช้า นี่คือสาย R ของฉันที่ใช้สำหรับตัวอย่างที่สอง (หนึ่งช่วงเวลาปริมาณน้ำฝน): ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain") การตีความของฉันคือ: ฝนจะนำไปสู่ ​​(เกิดขึ้นก่อน) ≈ 450≈450\approx 450 ≈ …

1
เมื่อใดที่จำเป็นต้องรวมความล่าช้าของตัวแปรตามในแบบจำลองการถดถอยและความล่าช้าใด
ข้อมูลที่เราต้องการใช้เป็นตัวแปรตามจะมีลักษณะเช่นนี้ (นับเป็นข้อมูล) เรากลัวว่าเนื่องจากมันมีองค์ประกอบวงจรและโครงสร้างแนวโน้มการถดถอยจึงกลายเป็นลำเอียงอย่างใด เราจะใช้การถดถอยแบบทวินามเชิงลบในกรณีที่มันช่วย ข้อมูลเป็นพาเนลที่สมดุลหนึ่งจำลองต่อบุคคล (รัฐ) ภาพที่แสดงแสดงผลรวมของตัวแปรตามสำหรับทุกรัฐ แต่รัฐส่วนใหญ่เพียงอย่างเดียวมีพฤติกรรมที่คล้ายกัน เรากำลังพิจารณาโมเดลเอฟเฟกต์คงที่ ตัวแปรตามไม่ได้มีความสัมพันธ์กันอย่างมากส่วนหนึ่งของการวิจัยคือการหาความสัมพันธ์ที่ไม่คาดคิดระหว่างตัวแปรนี้ดังนั้นความสัมพันธ์ที่อ่อนแอจึงเป็นสิ่งที่ดี อะไรคือภัยที่แน่นอนของการไม่รวมตัวแปรล่าช้าของตัวแปรตาม? หากมีความจำเป็นที่จะต้องรวมหนึ่งจะมีการทดสอบที่จะรู้ว่าหนึ่ง (s)? มีการนำไปใช้งานใน R หมายเหตุ : ฉันได้อ่านโพสต์นี้แต่ไม่ได้ช่วยแก้ไขปัญหาของเรา

3
autocorrelation ที่เหลือเมื่อเทียบกับตัวแปรที่ล้าหลัง
เมื่อการสร้างแบบจำลองอนุกรมเวลาหนึ่งมีความเป็นไปได้ที่จะ (1) แบบจำลองโครงสร้างความสัมพันธ์ของข้อผิดพลาดเช่นกระบวนการ AR (1) กระบวนการ (2) รวมถึงตัวแปรขึ้นอยู่กับ lagged เป็นตัวแปรอธิบาย (ทางด้านขวามือ) ฉันเข้าใจว่าบางครั้งพวกเขาก็มีเหตุผลมากมายที่ต้องไปเพื่อ (2) อย่างไรก็ตามวิธีการมีเหตุผลอะไรที่จะทำอย่างใดอย่างหนึ่ง (1) หรือ (2) หรือทั้งสองอย่าง?

2
การเชื่อมโยงชุดเวลาของปริมาณ
พิจารณากราฟต่อไปนี้: เส้นสีแดง (แกนซ้าย) อธิบายปริมาณการซื้อขายของหุ้นหนึ่ง ๆ เส้นสีฟ้า (แกนขวา) อธิบายปริมาณข้อความทวิตเตอร์สำหรับหุ้นนั้น ตัวอย่างเช่นในวันที่ 9 พฤษภาคม (05-09) มีการซื้อขายประมาณ 1.100 ล้านครั้งและทวีต 4.000 รายการ ฉันต้องการคำนวณว่ามีความสัมพันธ์กันระหว่างไทม์ซีรี่ส์หรือไม่ในวันเดียวกันหรือมีความล่าช้าตัวอย่างเช่นปริมาณทวีตสัมพันธ์กับปริมาณการซื้อขายในอีกหนึ่งวันต่อมา ฉันกำลังอ่านบทความมากมายที่ได้ทำการวิเคราะห์เช่นCorrelating Financial Time Series กับ Micro-Blogging Activityแต่พวกเขาไม่ได้อธิบายว่าการวิเคราะห์ดังกล่าวเกิดขึ้นได้อย่างไรในแง่ของการปฏิบัติ ต่อไปนี้ระบุไว้ในบทความ: อย่างไรก็ตามฉันมีประสบการณ์น้อยมากเกี่ยวกับการวิเคราะห์ทางสถิติและไม่ทราบวิธีการดำเนินการนี้ในซีรี่ส์ที่ฉันมี ฉันใช้ SPSS (หรือที่รู้จักกันว่า PASW) และคำถามของฉันคือ: ขั้นตอนในการวิเคราะห์เช่นนี้คืออะไรจากจุดที่ฉันมี datafile ที่อ้างอิงภาพข้างบน การทดสอบดังกล่าวเป็นคุณสมบัติเริ่มต้น (และเรียกว่าอะไร) และ / หรือฉันจะใช้งานได้อย่างไร? ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชมอย่างมาก :-)

1
คำสั่ง Lag สำหรับการทดสอบ Granger Causality
สมมติว่าฉันกำลังพิจารณาตัวแปรอิสระหลายตัวสำหรับการรวมไว้ในโมเดล ARIMAX ที่ฉันกำลังพัฒนา ก่อนที่จะปรับตัวแปรที่แตกต่างกันฉันต้องการคัดกรองตัวแปรที่มีสาเหตุแบบย้อนกลับโดยใช้การทดสอบ Granger (ฉันใช้granger.testฟังก์ชั่นจากMSBVARแพ็คเกจใน R แม้ว่าฉันเชื่อว่าการทำงานอื่น ๆ คล้ายกัน) ฉันจะกำหนดจำนวนการทดสอบที่ล่าช้าได้อย่างไร ฟังก์ชัน R คือ: granger.test(y, p)โดยที่ydata frame หรือ matrix และpเป็น lags สมมติฐานคือว่าที่ผ่านมาค่าของไม่ได้ช่วยในการทำนายค่าของYpppXXXYYY มีเหตุผลใดที่จะไม่เลือกความล่าช้าที่สูงมากที่นี่ (นอกเหนือจากการสูญเสียการสังเกต)? โปรดทราบว่าฉันได้แตกต่างทุกอนุกรมเวลาในกรอบข้อมูลของฉันตามลำดับของการรวมของอนุกรมเวลาขึ้นอยู่กับฉัน (เช่นทำให้ความแตกต่างของอนุกรมเวลาขึ้นต่อกันของฉันทำให้มันหยุดนิ่งดังนั้นฉันจึงแตกต่างอนุกรมเวลา "อิสระ" ทั้งหมดหนึ่งครั้ง)

3
การสร้างค่าสุ่มที่มีความสัมพันธ์อัตโนมัติใน R
เรากำลังพยายามสร้างค่าสุ่มที่มีความสัมพันธ์โดยอัตโนมัติซึ่งจะใช้เป็นชุดเวลา เราไม่มีข้อมูลที่เราอ้างถึงและเพียงต้องการสร้างเวกเตอร์ตั้งแต่เริ่มต้น ในอีกด้านหนึ่งเราต้องการกระบวนการสุ่มที่มีการแจกแจงและ SD ในอีกทางหนึ่งความสัมพันธ์อัตโนมัติที่มีอิทธิพลต่อกระบวนการสุ่มจะต้องมีการอธิบาย ค่าของเวกเตอร์นั้นมีความสัมพันธ์กันโดยอัตโนมัติพร้อมกับความแข็งแรงลดลงในช่วงเวลาต่าง ๆ เช่น lag1 มี 0.5, lag2 0.3, lag1 0.1 เป็นต้น ดังนั้นในที่สุดเวกเตอร์ควรมองสิ่งที่: 2, 4, 7, 11, 10, 8, 5, 4, 2, -1, 2, 5, 9, 12, 13, 10, 8, 4, 3, 1, -2, -5 และอื่น ๆ

1
แยกแยะระหว่างเอฟเฟกต์ระยะสั้นและระยะยาว
ฉันอ่านบทความต่อไปนี้ในกระดาษ: ความจริงที่ว่ามีความแตกต่างระหว่างค่าสัมประสิทธิ์ระยะสั้นและระยะยาวเป็นผลมาจากข้อกำหนดของเราซึ่งรวมถึงตัวแปรภายนอกที่ล่าช้า พวกเขาใช้การถดถอยในความแตกต่างแรกและรวมถึงความล่าช้าของตัวแปรตาม ตอนนี้พวกเขาโต้แย้งว่าถ้าคุณดูการประมาณค่า (เช่นเรียกการประมาณนี้ว่า ) จากผลลัพธ์นั่นคือผลระยะสั้นของต่อตัวแปรตาม นอกจากนี้พวกเขายืนยันว่าการดูที่ / (1 - การประเมินความล่าช้า) ให้ผลระยะยาวของ p กับตัวแปรตามพีพีpพีพีpพีพีp สามารถดูเอกสารได้ที่: https://www.ecb.europa.eu/pub/pdf/scpwps/ecbwp1328.pdfและการอภิปรายเกี่ยวกับผลกระทบระยะสั้น / ยาวในหน้า 20 ในเชิงอรรถ 23 ฉันไม่เข้าใจว่าทำไมคุณสามารถแยกแยะความแตกต่างระหว่างเอฟเฟ็กต์ระยะสั้นและระยะยาวของกับตัวแปรตาม หากมีคนอธิบายความคิดของพวกเขาให้ละเอียดยิ่งขึ้นมันก็จะมีประโยชน์มากพีพีp

3
ข้อมูลอนุกรมเวลาพยากรณ์พร้อมตัวแปรภายนอก
ขณะนี้ฉันกำลังทำงานในโครงการเพื่อคาดการณ์ข้อมูลอนุกรมเวลา (ข้อมูลรายเดือน) ฉันใช้ R เพื่อทำการพยากรณ์ ฉันมีตัวแปรอิสระ 1 ตัว (y) และตัวแปรอิสระ 3 ตัว (x1, x2, x3) ตัวแปร y มีการสังเกต 73 ครั้งและตัวแปรอีก 3 ตัว (alos 73) ตั้งแต่เดือนมกราคม 2009 ถึงมกราคม 2015 ฉันได้ตรวจสอบความสัมพันธ์และค่า p และมันสำคัญมากที่จะนำมาเป็นแบบจำลอง คำถามของฉันคือ: ฉันจะทำให้การคาดการณ์ที่ดีโดยใช้ตัวแปรอิสระทั้งหมดได้อย่างไร ฉันไม่มีค่าในอนาคตสำหรับตัวแปรเหล่านี้ สมมติว่าฉันต้องการทำนายตัวแปร y ของฉันใน 2 ปี (ในปี 2560) ฉันจะทำสิ่งนี้ได้อย่างไร ฉันลองรหัสต่อไปนี้: model = arima(y, order(0,2,0), xreg = externaldata) …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.