คำถามติดแท็ก regression

เทคนิคในการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปร "dependent" และตัวแปร "อิสระ" หนึ่งตัว

2
ผลกระทบหลักเชิงลบสองประการ แต่มีผลกระทบเชิงบวก
ฉันมีเอฟเฟกต์หลัก ๆ สองแบบ V1 และ V2 ผลกระทบของ V1 และ V2 บนตัวแปรตอบกลับเป็นค่าลบ อย่างไรก็ตามด้วยเหตุผลบางอย่างฉันได้รับค่าสัมประสิทธิ์บวกสำหรับคำศัพท์ที่มีปฏิสัมพันธ์ V1 * V2 ฉันจะตีความสิ่งนี้ได้อย่างไร สถานการณ์ดังกล่าวเป็นไปได้หรือไม่

1
ฟังก์ชั่น“ เอฟเฟกต์” ใน R ทำอะไร?
ฉันไม่เข้าใจคำอธิบายในRไฟล์ช่วยเหลือของเอฟเฟกต์ () : สำหรับโมเดลเชิงเส้นที่ติดตั้งlmหรือaovผลที่ได้คือค่าขององศาอิสระที่ไม่ได้รับความสัมพันธ์ซึ่งได้จากการฉายข้อมูลไปยัง subspaces orthogonal ที่ต่อเนื่องซึ่งสร้างขึ้นโดยการย่อยสลาย QR ในระหว่างกระบวนการติดตั้ง ใครช่วยอธิบายสิ่งนี้ได้บ้าง? subspaces orthogonal พาดพิงถึง subspaces หนึ่งมิติที่ถูกขยายโดยคอลัมน์ของ Q-part ของ QR-decomposition (และจากนั้น orthogonal ต่อกัน)? หรือว่าพวกเขาควรจะตั้งฉากกับสิ่งอื่น?
17 r  regression 

2
การเข้ารหัสตัวแปรเชิงคุณภาพในการถดถอยนำไปสู่“ ภาวะเอกฐาน”
ฉันมีตัวแปรอิสระที่เรียกว่า "คุณภาพ" ตัวแปรนี้มีการตอบสนอง 3 แบบ (คุณภาพไม่ดีคุณภาพปานกลาง; คุณภาพสูง) ฉันต้องการแนะนำตัวแปรอิสระนี้ในการถดถอยเชิงเส้นหลายครั้งของฉัน เมื่อฉันมีตัวแปรไบนารีอิสระ (ตัวแปรดัมมี่ฉันสามารถโค้ด0/ 1) มันเป็นเรื่องง่ายที่จะแนะนำมันในรูปแบบการถดถอยเชิงเส้นหลายแบบ แต่ด้วยการตอบสนอง 3 แบบฉันได้ลองใช้รหัสตัวแปรนี้ดังนี้ Bad quality Medium quality High quality 0 1 0 1 0 0 0 0 1 0 1 0 แต่มีปัญหาเมื่อฉันพยายามทำการถดถอยเชิงเส้นหลายครั้ง: วิธีการMedium qualityให้ฉันNA: Coefficients: (1 not defined because of singularities) ฉันจะเขียนโค้ด "คุณภาพ" ตัวแปรนี้ด้วย 3 แบบได้อย่างไร ฉันต้องสร้างตัวแปรเป็นปัจจัย ( …

2
ฉันจะคำนวณความแปรปรวนของเครื่องมือประมาณค่า OLS
ฉันรู้ว่า และนี่คือสิ่งที่ฉันได้รับเมื่อคำนวณความแปรปรวน:β0^=y¯−β1^x¯β0^=y¯−β1^x¯\hat{\beta_0}=\bar{y}-\hat{\beta_1}\bar{x} Var(β0^)=Var(y¯−β1^x¯)=Var((−x¯)β1^+y¯)=Var((−x¯)β1^)+Var(y¯)=(−x¯)2Var(β1^)+0=(x¯)2Var(β1^)+0=σ2(x¯)2∑i=1n(xi−x¯)2Var(β0^)=Var(y¯−β1^x¯)=Var((−x¯)β1^+y¯)=Var((−x¯)β1^)+Var(y¯)=(−x¯)2Var(β1^)+0=(x¯)2Var(β1^)+0=σ2(x¯)2∑i=1n(xi−x¯)2\begin{align*} Var(\hat{\beta_0}) &= Var(\bar{y} - \hat{\beta_1}\bar{x}) \\ &= Var((-\bar{x})\hat{\beta_1}+\bar{y}) \\ &= Var((-\bar{x})\hat{\beta_1})+Var(\bar{y}) \\ &= (-\bar{x})^2 Var(\hat{\beta_1}) + 0 \\ &= (\bar{x})^2 Var(\hat{\beta_1}) + 0 \\ &= \frac{\sigma^2 (\bar{x})^2}{\displaystyle\sum\limits_{i=1}^n (x_i - \bar{x})^2} \end{align*} แต่เท่าที่ฉันได้รับ สูตรสุดท้ายที่ฉันพยายามจะคำนวณคือ Var(β0^)=σ2n−1∑i=1nx2i∑i=1n(xi−x¯)2Var(β0^)=σ2n−1∑i=1nxi2∑i=1n(xi−x¯)2\begin{align*} Var(\hat{\beta_0}) &= \frac{\sigma^2 n^{-1}\displaystyle\sum\limits_{i=1}^n x_i^2}{\displaystyle\sum\limits_{i=1}^n (x_i - \bar{x})^2} \end{align*} ฉันไม่แน่ใจว่าจะได้รับอย่างไรสมมติว่าคณิตศาสตร์ของฉันถูกต้องตรงนั้น .(x¯)2=1n∑i=1nx2i(x¯)2=1n∑i=1nxi2(\bar{x})^2 = \frac{1}{n}\displaystyle\sum\limits_{i=1}^n …

3
ตัวแปรที่ต่อเนื่องขึ้นอยู่กับตัวแปรอิสระลำดับ
ด้วยตัวแปรy ที่ขึ้นต่อเนื่องและตัวแปรอิสระรวมถึงตัวแปรลำดับX 1ฉันจะพอดีกับตัวแบบเชิงเส้นได้Rอย่างไร? มีเอกสารเกี่ยวกับรูปแบบประเภทนี้หรือไม่?

2
ฉันจะตีความการถดถอยของฉันด้วยตัวแปรที่แตกต่างแรกได้อย่างไร
ฉันมีสองชุดเวลา: พร็อกซีสำหรับพรีเมี่ยมความเสี่ยงด้านตลาด (ERP; สายสีแดง) อัตราปลอดความเสี่ยงโดยพันธบัตรรัฐบาล (เส้นสีน้ำเงิน) ฉันต้องการทดสอบว่าอัตราที่ปราศจากความเสี่ยงสามารถอธิบาย ERP ได้หรือไม่ ด้วยเหตุนี้ฉันจึงปฏิบัติตามคำแนะนำของ Tsay (2010, รุ่นที่ 3, หน้า 96): ซีรี่ส์เวลาทางการเงิน: จัดวางโมเดลการถดถอยเชิงเส้นและตรวจสอบความสัมพันธ์แบบอนุกรมของส่วนที่เหลือ หากซีรี่ย์ที่เหลือเป็นหน่วยที่ไม่ใช่ความแปรปรวนของรูทยูนิตให้รับความแตกต่างแรกของตัวแปรที่ขึ้นอยู่กับและอธิบาย ทำขั้นตอนแรกฉันได้รับผลลัพธ์ต่อไปนี้: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 6.77019 0.25103 26.97 <2e-16 *** Risk_Free_Rate -0.65320 0.04123 -15.84 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ …

4
คำศัพท์เกี่ยวกับข้อผิดพลาดของโมเดลค่าเฉลี่ยเคลื่อนที่
นี่เป็นคำถามพื้นฐานสำหรับรุ่น Box-Jenkins MA ตามที่ผมเข้าใจแบบจำลอง MA เป็นพื้นถดถอยเชิงเส้นของอนุกรมเวลาค่าที่YYYกับก่อนหน้านี้เงื่อนไขข้อผิดพลาดet,...,et−net,...,et−ne_t,..., e_{t-n} n นั่นคือการสังเกตYYYจะถดถอยครั้งแรกกับค่าก่อนหน้านี้Yt−1,...,Yt−nYt−1,...,Yt−nY_{t-1}, ..., Y_{t-n}แล้วหนึ่งหรือมากกว่าY−Y^Y−Y^Y - \hat{Y}ค่าจะถูกใช้เป็นเงื่อนไขข้อผิดพลาดสำหรับรุ่นซาชูเซตส์ แต่ข้อผิดพลาดถูกคำนวณในรูปแบบ ARIMA (0, 0, 2) อย่างไร หากใช้โมเดล MA โดยไม่มีชิ้นส่วนตอบรับอัตโนมัติและไม่มีค่าโดยประมาณฉันจะมีคำผิดได้อย่างไร

4
ยืนยันการกระจายตัวของสารตกค้างในการถดถอยเชิงเส้น
สมมติว่าเราใช้การถดถอยเชิงเส้นอย่างง่ายบันทึกเศษเหลือ^ u iและวาดฮิสโตแกรมของการกระจายตัวของเศษซาก หากเราได้สิ่งที่ดูเหมือนการแจกแจงที่คุ้นเคยเราสามารถสันนิษฐานได้ว่าข้อผิดพลาดของเรามีการกระจายตัวนี้หรือไม่? สมมติว่าถ้าเราพบว่าเศษเหลือคล้ายการแจกแจงแบบปกติมันสมเหตุสมผลหรือไม่ที่จะถือว่าความเป็นบรรทัดฐานของคำผิดพลาดในประชากร? ฉันคิดว่ามันสมเหตุสมผล แต่จะเป็นธรรมได้อย่างไรy=β0+β1x+uY=β0+β1x+ยูy=\beta_0+\beta_1x+uui^ยูผม^\hat{u_i}

3
สัมประสิทธิ์ตามเวลาใน R - จะทำอย่างไร?
อัปเดต : ขออภัยสำหรับการอัปเดตอื่น แต่ฉันพบวิธีแก้ปัญหาที่เป็นไปได้ด้วยพหุนามเศษส่วนและแพ็คเกจเสี่ยงการแข่งขันที่ฉันต้องการความช่วยเหลือ ปัญหา ฉันไม่สามารถหาวิธีง่าย ๆ ในการวิเคราะห์ค่าสัมประสิทธิ์เวลาได้ใน R ฉันต้องการให้สามารถใช้สัมประสิทธิ์ตัวแปรของฉันและทำมันเป็นค่าสัมประสิทธิ์ขึ้นอยู่กับเวลา (ไม่ใช่ตัวแปร) แล้วพล็อตการเปลี่ยนแปลงกับเวลา: βม. Y_ v a r i a b l e= β0+ β1∗ t + β2∗ t2. . .βม.Y_โวลต์aRผมaขล.อี=β0+β1* * * *เสื้อ+β2* * * *เสื้อ2...\beta_{my\_variable}=\beta_0+\beta_1*t+\beta_2*t^2... การแก้ปัญหาที่เป็นไปได้ 1) การแยกชุดข้อมูล ฉันได้ดูตัวอย่างนี้ (Se ส่วนที่ 2 ของเซสชันแล็บ) แต่การสร้างชุดข้อมูลแยกต่างหากดูเหมือนซับซ้อนซับซ้อนคำนวณค่าใช้จ่ายและไม่ง่ายมาก ... 2) Reduced Rank models …

1
คุณสมบัติของการถดถอยโลจิสติก
เรากำลังทำงานกับการถดถอยแบบโลจิสติกส์และเราได้ตระหนักว่าความน่าจะเป็นโดยประมาณโดยเฉลี่ยเท่ากับสัดส่วนของตัวอย่างในตัวอย่าง นั่นคือค่าเฉลี่ยของค่าติดตั้งเท่ากับค่าเฉลี่ยของตัวอย่าง ใครช่วยอธิบายเหตุผลให้ฉันหรือให้ข้อมูลอ้างอิงกับฉันที่ฉันสามารถหาการสาธิตนี้ได้?

3
วิธีการสร้างแบบจำลองตัวแปรเป้าหมายที่ถูกผูกไว้?
ฉันมี 5 ตัวแปรและฉันพยายามที่จะทำนายตัวแปรเป้าหมายของฉันซึ่งจะต้องอยู่ในช่วง 0 ถึง 70 ฉันจะใช้ข้อมูลชิ้นนี้ในการสร้างแบบจำลองเป้าหมายได้ดีขึ้นได้อย่างไร

1
ตรรกะที่อยู่เบื้องหลังการทดสอบ F-ANOVA ในการถดถอยเชิงเส้นอย่างง่าย
ฉันพยายามที่จะเข้าใจตรรกะที่อยู่เบื้องหลังการทดสอบ ANOVA F ในการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย คำถามที่ฉันมีดังต่อไปนี้ เมื่อค่า F คือ MSR/MSEมีขนาดใหญ่เรายอมรับแบบจำลองเป็นสำคัญ เหตุผลเบื้องหลังนี้คืออะไร?
17 regression  anova 

2
ฉันจะใช้วิธีการถดถอยโลจิสติกส์ + ข้อมูลดิบเพื่อรับความน่าจะเป็นได้อย่างไร
ฉันมีโมเดลติดตั้งแล้ว (จากวรรณกรรม) ฉันยังมีข้อมูลดิบสำหรับตัวแปรทำนาย สมการที่ฉันควรใช้เพื่อให้ได้ความน่าจะเป็นคืออะไร โดยพื้นฐานแล้วฉันจะรวมข้อมูลดิบและสัมประสิทธิ์เข้ากับความน่าจะเป็นได้อย่างไร

3
การอนุมานหลังจากใช้ Lasso เพื่อเลือกตัวแปร
ฉันใช้ Lasso สำหรับการเลือกคุณสมบัติในการตั้งค่ามิติที่ค่อนข้างต่ำ (n >> p) หลังจากติดตั้ง Lasso model แล้วฉันต้องการใช้ covariates กับสัมประสิทธิ์ที่ไม่ใช่ศูนย์เพื่อให้พอดีกับ model โดยไม่มีการลงโทษ ฉันกำลังทำเช่นนี้เพราะฉันต้องการการประเมินที่เป็นกลางซึ่ง Lasso ไม่สามารถให้ฉันได้ ฉันยังต้องการค่า p และช่วงความเชื่อมั่นสำหรับการประเมินที่เป็นกลาง ฉันมีปัญหาในการค้นหาวรรณกรรมในหัวข้อนี้ วรรณคดีที่ฉันพบส่วนใหญ่เกี่ยวกับการกำหนดช่วงความเชื่อมั่นในการประเมิน Lasso ไม่ใช่โมเดลที่มีการปรับปรุง จากสิ่งที่ฉันได้อ่านเพียงแค่อ้างอิงโมเดลโดยใช้ชุดข้อมูลทั้งหมดทำให้เกิดข้อผิดพลาด p-values ​​/ std ที่ไม่สมจริง ตอนนี้การแยกตัวอย่าง (ในรูปแบบของ Wasserman และ Roeder (2014) หรือ Meinshausen et al. (2009)) ดูเหมือนจะเป็นแนวทางที่ดี แต่ฉันกำลังมองหาคำแนะนำเพิ่มเติม มีใครพบปัญหานี้หรือไม่? ถ้าเป็นเช่นนั้นคุณช่วยกรุณาให้คำแนะนำได้ไหม

2
คำถามเกี่ยวกับการสร้างมาตรฐานในการถดถอยแบบสัน
เฮ้พวกฉันพบเอกสารหนึ่งหรือสองฉบับที่ใช้การถดถอยแบบสัน (สำหรับข้อมูลบาสเก็ตบอล) ฉันได้รับคำสั่งให้ปรับมาตรฐานตัวแปรของฉันเสมอถ้าฉันวิ่งสันเขาถดถอย แต่ฉันก็แค่บอกให้ทำอย่างนี้เพราะสันเขาเป็นตัวแปรขนาด (การถดถอยสันไม่ได้เป็นส่วนหนึ่งของหลักสูตรของเรา เอกสารเหล่านี้ที่ฉันอ่านไม่ได้ทำให้ตัวแปรของพวกเขาเป็นมาตรฐานซึ่งฉันพบว่าน่าแปลกใจเล็กน้อย พวกเขายังจบลงด้วยค่าแลมบ์ดาขนาดใหญ่ (ประมาณระดับ 2,000-4,000) ผ่านการตรวจสอบความถูกต้องของข้อมูลและฉันได้รับการบอกว่าสิ่งนี้เกิดจากการไม่ปรับมาตรฐานของตัวแปร การปล่อยให้ตัวแปรนำไปสู่ค่าแลมบ์ดาที่ไม่ได้มาตรฐานนั้นมีความแม่นยำเพียงใดและผลที่ตามมาของการไม่ทำให้ตัวแปรโดยทั่วไปเป็นมาตรฐานคืออะไร มันเป็นเรื่องใหญ่จริงเหรอ? ความช่วยเหลือใด ๆ ที่ชื่นชมมาก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.