มีช่วงของความเป็นไปได้ที่อธิบายโดย JW Gillard ในภาพรวมเชิงประวัติศาสตร์ของการถดถอยเชิงเส้นพร้อมข้อผิดพลาดในตัวแปรทั้งสอง
หากคุณไม่สนใจรายละเอียดหรือเหตุผลในการเลือกวิธีอื่นมากกว่าเพียงแค่วิธีที่ง่ายที่สุดซึ่งก็คือการลากเส้นผ่านเซนทรอยด์ด้วยความชันคืออัตราส่วนของการเบี่ยงเบนมาตรฐานที่สังเกต (ทำให้เครื่องหมายของความชันเท่ากับสัญลักษณ์ของความแปรปรวนร่วมของและ ) ในขณะที่คุณสามารถออกกำลังกายได้สิ่งนี้จะเป็นการสกัดกั้น -axis ของ(x¯,y¯)β^=sy/sxxyyα^=y¯−β^x¯.
ข้อดีของวิธีนี้คือ
- มันจะช่วยให้สายเดียวกันเปรียบเทียบกับเป็นกับ ,xyyx
- มันเป็นค่าคงที่ดังนั้นคุณไม่ต้องกังวลกับยูนิต
- มันอยู่ระหว่างเส้นถดถอยเชิงเส้นธรรมดาสองเส้น
- มันข้ามพวกเขาโดยที่พวกเขาข้ามกันที่เซนทรอยด์ของการสำรวจและ
- มันง่ายในการคำนวณ
ความชันเป็นค่าเฉลี่ยทางเรขาคณิตของความชันของทั้งสองเส้นถดถอยเชิงเส้นสามัญ นอกจากนี้ยังเป็นสิ่งที่คุณจะได้รับหากคุณกำหนดมาตรฐานการสังเกตและให้ลากเส้นที่ 45 ° (หรือ 135 °หากมีความสัมพันธ์เชิงลบ) แล้วยกเลิกการกำหนดมาตรฐาน มันอาจถูกมองว่าเทียบเท่ากับการตั้งสมมติฐานโดยนัยที่ความแปรปรวนของข้อผิดพลาดสองชุดนั้นแปรผันตามความแปรปรวนของการสังเกตสองชุด เท่าที่ฉันสามารถบอกได้คุณอ้างว่าไม่รู้ว่าวิธีนี้ผิดxy
นี่คือตัวอย่างรหัส R เพื่อแสดง: เส้นสีแดงในแผนภูมิคือ OLS regression ของบน , เส้นสีฟ้าคือ OLS regression ของบนและเส้นสีเขียวเป็นวิธีง่าย ๆ โปรดทราบว่าความลาดชันควรประมาณ 5XYXXY
X0 <- 1600:3600
Y0 <- 5*X0 + 700
X1 <- X0 + 400*rnorm(2001)
Y1 <- Y0 + 2000*rnorm(2001)
slopeOLSXY <- lm(Y1 ~ X1)$coefficients[2] #OLS slope of Y on X
slopeOLSYX <- 1/lm(X1 ~ Y1)$coefficients[2] #Inverse of OLS slope of X on Y
slopesimple <- sd(Y1)/sd(X1) *sign(cov(X1,Y1)) #Simple slope
c(slopeOLSXY, slopeOLSYX, slopesimple) #Show the three slopes
plot(Y1~X1)
abline(mean(Y1) - slopeOLSXY * mean(X1), slopeOLSXY, col="red")
abline(mean(Y1) - slopeOLSYX * mean(X1), slopeOLSYX, col="blue")
abline(mean(Y1) - slopesimple * mean(X1), slopesimple, col="green")