การถดถอยด้วยตัวแปรอิสระผกผัน


10

สมมุติว่าฉันมี -vectorของตัวแปรตามและ -vectorของตัวแปรอิสระ เมื่อได้วางแผนกับฉันเห็นว่ามีความสัมพันธ์เชิงเส้น (แนวโน้มสูงขึ้น) ระหว่างทั้งสอง ตอนนี้ก็หมายความว่ามีแนวโน้มลดลงเชิงเส้นตรงระหว่างและXY N X Y 1NYNXY YX1XYX

ตอนนี้ถ้าฉันใช้การถดถอย: และรับค่าที่ติดตั้งY = β XY=βX+ϵY^=β^X

จากนั้นฉันก็ทำการถดถอย:และรับค่าติดตั้ง ~ Y = α 1Y=α1X+ϵY~=α^1X

ค่าสองค่าที่คาดการณ์ไว้และจะเท่ากันหรือไม่? ~ YY^Y~

คำตอบ:


10

 เมื่อ Y ได้วางแผนกับฉันเห็นว่ามีความสัมพันธ์เชิงเส้น (แนวโน้มสูงขึ้น) ระหว่างทั้งสอง ตอนนี้ยังหมายความว่ามีแนวโน้มลดลงเชิงเส้นระหว่าง Y และ X1X

ประโยคสุดท้ายนั้นผิด: มีแนวโน้มลดลง แต่มันไม่เชิงเส้น: Y ~ 1 / X Y ~ X

ผมใช้เป็นฟังก์ชั่นบวกบิตของเสียงในYอย่างที่คุณเห็นในขณะที่วางแผนกับให้ผลกับพฤติกรรมเชิงเส้นต่อนั้นไกลจากเส้นตรง YY1f(x)=1xYY YX1XYX

(@whuber ชี้ให้เห็นว่าพล็อตเทียบกับไม่ได้ดูแบบ homoscedastic ฉันคิดว่ามันมีความแปรปรวนที่สูงขึ้นสำหรับต่ำเนื่องจากความหนาแน่นของเคสที่สูงกว่านำไปสู่ช่วงที่กว้างกว่า การรับรู้จริง ๆ แล้วข้อมูลเป็นแบบ homoscedastic: ฉันใช้เพื่อสร้างข้อมูลดังนั้นจึงไม่ขึ้นกับขนาดของ )1Y YX1XYY = 1 / X + rnorm (length (X), sd = 0.1)X

ดังนั้นโดยทั่วไปความสัมพันธ์จึงไม่ใช่เชิงเส้นมาก นั่นคือยกเว้นว่าช่วงของคุณแคบมากจนคุณสามารถประมาณนี่คือตัวอย่าง:d 1Xd1xdx=1x2const.

Y ~ 1 / X Y ~ X

bottomline:

  • โดยทั่วไปแล้วมันเป็นเรื่องยากมากที่จะประมาณ - ฟังก์ชั่นประเภทโดยฟังก์ชั่นเชิงเส้นหรือพหุนาม และหากไม่มีคำศัพท์ชดเชยคุณจะไม่ได้รับการประมาณที่สมเหตุสมผล1X
  • หากช่วงแคบพอที่จะให้การประมาณเชิงเส้นคุณจะไม่สามารถคาดเดาความสัมพันธ์ได้จากและไม่ใช่เชิงเส้น ( )1X X1XX

คุณเริ่มต้นด้วยสมมติฐานที่ไม่ถูกต้อง: OP ไม่เคยยืนยันว่าและเกี่ยวข้องกันเป็นเส้นตรง การยืนยันเพียงอย่างเดียวคือว่าและดูเหมือนจะเกี่ยวข้องกันเป็นเส้นตรง (มีความชันเป็นลบ) ที่แน่นอนแสดงว่าและจะnonlinearlyที่เกี่ยวข้อง ฉันคิดว่านี่เป็นการออกที่รุนแรงจากคำถามที่วางตัวว่าส่วนที่เหลือของโพสต์ของคุณอาจทำให้ผู้อ่านเข้าใจผิดยิ่งขึ้นเท่านั้น X Y 1 / X Y XYXY1/XYX
whuber

2
@whuber: ฉันเสียใจโดยสิ้นเชิง แต่ตอนนี้ดูเหมือนจะค่อนข้างหนาแน่น คำถามพูดว่า: "เมื่อ Y ถูกพล็อตเทียบกับ 1 / X ฉันเห็นว่ามีความสัมพันธ์เชิงเส้น (แนวโน้มสูงขึ้น)" นั่นคือสิ่งที่ฉันพยายามอธิบายในภาพที่ 1 และ 3: Y มากกว่า 1 / X เพิ่มขึ้นเป็นเส้นตรง จากนั้นฉันพล็อต Y ที่สอดคล้องกันบน X (ไม่เชิงเส้นลดลง) ฉันจะเข้าใจผิด OP อยู่ที่ไหน?
cbeleites ไม่มีความสุขกับ SX

1
อย่าเสียใจ - ฉันแค่โพสต์ของคุณผิด (โดยเลื่อนป้ายกำกับของแกน X ในภาพแรก)! ความผิดคือของฉันทั้งหมด ดังนั้นฉันจึงถอนคำตอบของคุณซึ่งถูกต้องและให้ข้อมูล หากคุณได้รับโอกาสคุณอาจต้องการแสดงความคิดเห็นเกี่ยวกับผลกระทบของการเปลี่ยนแปลงนี้ต่อความเป็นเนื้อเดียวกัน (หรือไม่มีเลย) ของส่วนที่เหลือ (ซึ่งสามารถตรวจพบได้ในพล็อต vs ) 1 / XY1/X
whuber

ขอบคุณสำหรับข้อสังเกตเกี่ยวกับความเป็นเนื้อเดียวกัน โดยการเปลี่ยนตัวแปรอิสระคุณจะไม่เปลี่ยนความเป็นเอกภาพของการตอบสนอง - แต่รูปลักษณ์ของมันสามารถเปลี่ยนแปลงได้อย่างแน่นอนเมื่อคุณชี้ให้เห็นซึ่งมีประโยชน์ที่จะรู้ (เราได้เห็นปรากฏการณ์นี้ในโพสต์อื่น ๆ อีกหลายเรื่องซึ่งผู้คนต่างเข้าใจผิดต่างกันถึงความแตกต่างในกลุ่มประชากร)
whuber

คำตอบและความคิดเห็นอย่างละเอียดมาก! ขอบคุณ @cbeleites และ @whuber!
Mayou

2

ฉันไม่เห็นเหตุผลที่พวกเขาจะ "โดยประมาณเท่ากัน" โดยทั่วไป - แต่คุณหมายถึงอะไรโดยประมาณเท่ากัน?

นี่คือตัวอย่างของเล่น:

library(ggplot2)
n <- 10^3
df <- data.frame(x=runif(n, min=1, max=2))
df$y <- 5 / df$x + rnorm(n)
p <- (ggplot(df, aes(x=x, y=y)) +
      geom_point() +
      geom_smooth(method="lm", formula=y ~ 0 + x) +  # Blue, OP's y hat
      geom_smooth(method="lm", formula=y ~ 0 + I(x^-1), color="red"))  # Red, OP's y tilde
p

ภาพ:

ฉันบอกว่าสิ่งเหล่านี้อยู่ไกลจาก "ประมาณเท่ากัน"

แบบจำลอง "สีน้ำเงิน" จะทำได้ดีกว่ามากหากได้รับอนุญาตให้มีการตัดคำ (เช่นค่าคงที่) ...


เป็นการยากที่จะบอกว่าคุณกำลังทำอะไรกับโมเดลสีน้ำเงิน แต่แน่นอนว่ามันไม่เหมือนที่ OP อธิบาย! สีแดงใกล้เคียงกับสถานการณ์ที่ปรากฏในคำถาม
whuber

Y1/XYXY1/X
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.