ปัญหาของการใช้ R-squared ในรุ่นอนุกรมเวลาคืออะไร


12

ฉันได้อ่านแล้วว่าการใช้ R-squared สำหรับอนุกรมเวลานั้นไม่เหมาะสมเพราะในบริบทของอนุกรมเวลา (ฉันรู้ว่ามีบริบทอื่น ๆ ) R-squared นั้นไม่เหมือนกันอีกต่อไป ทำไมนี้ ฉันพยายามค้นหามัน แต่ฉันไม่พบอะไรเลย โดยทั่วไปแล้วฉันไม่ได้ให้ความสำคัญกับ R-squared (หรือ Adjusted R-Squared) เมื่อฉันประเมินแบบจำลองของฉัน แต่เพื่อนร่วมงานจำนวนมากของฉัน (เช่นวิชาเอกธุรกิจ) นั้นหลงรัก R-Squared และฉันต้องการที่จะ อธิบายกับพวกเขาว่าทำไม R-Squared จึงไม่เหมาะสมในบริบทของอนุกรมเวลา


3
การค้นหาของ Google: "การถดถอยแบบเผด็จการในเศรษฐมิติ" หรือเช็คเอาท์เกรนเจอร์และ Newbold กระดาษ คนอื่นอาจให้รายละเอียดเพิ่มเติมในคำตอบ
แกรมวอลช์

@Richard Hardy โปรดช่วยอธิบายเกี่ยวกับ "ถ้าเราใช้ตัวอย่าง R2 เป็นตัวชี้วัดประชากรคู่กันมันจะแบ่งย่อยตามอนุกรมเวลารวม"
Siddharth Krishnamurthy

คำตอบ:


18

บางแง่มุมของปัญหา:

ถ้าใครบางคนให้เวกเตอร์ของตัวเลขและเมทริกซ์ที่สอดคล้องกันของ numbersเราไม่จำเป็นต้องรู้ว่าความสัมพันธ์ระหว่างพวกเขาในการดำเนินการพีชคณิตประมาณเท่าไหร่ถือว่าเป็นตัวแปรตาม พีชคณิตจะส่งผลโดยไม่คำนึงว่าตัวเลขเหล่านี้เป็นข้อมูลแบบตัดขวางหรืออนุกรมเวลาหรือข้อมูลพาเนลหรือว่าเมทริกซ์มีค่าล้าหลังของเป็นต้น YXYXY

นิยามพื้นฐานของสัมประสิทธิ์การตัดสินใจคือR2

R2=1-SSRอีsSSเสื้อโอเสื้อ

โดยที่คือผลรวมของกำลังสองเหลือจากขั้นตอนการประมาณค่าบางอย่างและคือผลรวมของการเบี่ยงเบนกำลังสองของตัวแปรตามจากค่าเฉลี่ยตัวอย่างSSRอีsSSเสื้อโอเสื้อ

การรวมจะถูกคำนวณอย่างไม่ซ้ำกันเสมอสำหรับตัวอย่างข้อมูลเฉพาะสูตรเฉพาะของความสัมพันธ์ระหว่างตัวแปรและขั้นตอนการประมาณค่าเฉพาะนั้นขึ้นอยู่กับเงื่อนไขที่กระบวนการประเมินนั้นให้การประมาณจุดเท่านั้น ของปริมาณที่ไม่ทราบที่เกี่ยวข้อง (และด้วยเหตุนี้การประมาณจุดของตัวแปรตามและด้วยเหตุนี้การประมาณค่าของเศษเหลือ) หากทั้งสามด้านใดด้านหนึ่งมีการเปลี่ยนแปลงค่าเลขคณิตของจะเปลี่ยนโดยทั่วไป - แต่สิ่งนี้จะเก็บไว้สำหรับข้อมูลประเภทใด ๆ ไม่ใช่แค่อนุกรมเวลาR2R2

ดังนั้นปัญหาเกี่ยวกับและอนุกรมเวลาไม่ว่าจะเป็น "ที่ไม่ซ้ำกัน" หรือไม่ (เนื่องจากขั้นตอนการประมาณค่าส่วนใหญ่สำหรับข้อมูลอนุกรมเวลาให้การประมาณจุด) ปัญหาคือว่าเฟรมเวิร์กสเปคอนุกรมเวลา "ปกติ" นั้นเป็นมิตรกับทางเทคนิคสำหรับหรือไม่และให้ข้อมูลที่เป็นประโยชน์บ้างหรือไม่ R2R2R2

การตีความของเป็น "สัดส่วนของความแปรปรวนตัวแปรตามอธิบาย" ขึ้นอยู่กับช่วงวิกฤตที่เหลือเพิ่มขึ้นเป็นศูนย์ ในบริบทของการถดถอยเชิงเส้น (ในชนิดข้อมูลใด ๆ ) และการประมาณกำลังสองน้อยที่สุดจะรับประกันได้เฉพาะในกรณีที่ข้อมูลจำเพาะมีคำคงที่ในเมทริกซ์การถดถอย ("ดริฟท์" ในคำศัพท์อนุกรมเวลา) ในโมเดลอนุกรมเวลาอัตโนมัติแบบดริฟท์จะไม่รวมอยู่ในหลาย ๆ กรณี R2

โดยทั่วไปเมื่อเราเผชิญกับข้อมูลอนุกรมเวลา "อัตโนมัติ" เราเริ่มคิดเกี่ยวกับว่าอนุกรมเวลาจะพัฒนาไปสู่อนาคตได้อย่างไร ดังนั้นเราจึงมีแนวโน้มที่จะประเมินผลการศึกษาแบบจำลองอนุกรมเวลาตามเพิ่มเติมเกี่ยวกับวิธีที่ดีที่จะคาดการณ์ในอนาคตค่ากว่าวิธีที่ดีที่เหมาะกับค่าที่ผ่านมา แต่ส่วนใหญ่สะท้อนให้เห็นถึงหลังไม่ใช่อดีต ความจริงที่รู้จักกันดีว่าไม่ลดลงในจำนวนของ regressors หมายถึงการที่เราสามารถขอรับแบบที่สมบูรณ์แบบโดยการเก็บรักษาเพิ่ม regressors ( ใด ๆ regressors คือชุดใด ๆ ของตัวเลขอาจจะไม่เกี่ยวข้องแนวคิดกับตัวแปรตาม) . ประสบการณ์แสดงให้เห็นว่าแบบที่สมบูรณ์แบบที่ได้รับจึงจะให้สุดซึ้งR2R2 การคาดการณ์นอกกลุ่มตัวอย่าง

โดยสัญชาตญาณนี่อาจจะเป็นการแลกเปลี่ยนเชิงสัญชาตญาณที่เกิดขึ้นเพราะโดยการจับความแปรปรวนทั้งหมดของตัวแปรตามในสมการที่ประมาณเราจะเปลี่ยนความแปรปรวนแบบไม่มีระบบให้เป็นระบบอย่างใดอย่างหนึ่งตามการคาดการณ์ - จากมุมมองเชิงปรัชญาที่กำหนดอย่างหมดจดไม่มีสิ่งเช่น "ความแปรปรวนแบบไม่มีระบบ" แต่ในระดับที่ความรู้ จำกัด ของเราบังคับให้เรารักษาความแปรปรวนบางอย่างในฐานะ "ไม่มีระบบ" จากนั้นความพยายามที่จะเปลี่ยนมันให้เป็นระบบ องค์ประกอบนำการทำนายภัยพิบัติมาใช้)

ในความเป็นจริงนี้อาจจะเป็นวิธีที่น่าเชื่อถือมากที่สุดที่จะแสดงให้เห็นว่าทำไมใครบางคนไม่ควรจะเป็นเครื่องมือการประเมินผล / หลักวินิจฉัยเมื่อต้องรับมือกับอนุกรมเวลา: เพิ่มจำนวนของ regressors ถึงจุดที่1 จากนั้นใช้สมการที่ประมาณไว้และพยายามทำนายค่าในอนาคตของตัวแปรตามR2R21


คำอธิบายที่ดี แต่ทำไมจึงมีการเพิ่มสิ่งนี้เป็นเอาท์พุทมาตรฐานของซอฟต์แวร์ในแพคเกจสถิติ

@Brijesh Regression- ประเพณีฉันจะบอกว่า
Alecos Papadopoulos

คำตอบที่ดี! อย่างไรก็ตามมันมีข้อมูลเล็ก ๆ น้อย ๆ ที่เกี่ยวข้องกับอนุกรมเวลา การคาดคะเนเทียบกับการพอดีในตัวอย่างนำไปใช้กับชนิดข้อมูลอื่น ๆ อาจมากเท่ากับชุดข้อมูลเวลา ในอีกด้านหนึ่งที่สำคัญที่เฉพาะกับชุดเวลาหายไป ฉันหมายถึงการถดถอยตัวแปรรวม ถ้าเราใช้ตัวอย่างเป็นหน่วยวัดของประชากรมันจะแบ่งย่อยตามอนุกรมเวลารวม (ฉันจะเขียนนี้ขึ้นเป็นคำตอบ แต่ไม่ได้มีเวลาในขณะนี้.)R2
ริชาร์ดฮาร์ดี
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.