โดยเฉพาะฉันหมายถึงสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน
โดยเฉพาะฉันหมายถึงสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน
คำตอบ:
ความแตกต่างระหว่างความสัมพันธ์ระหว่างและและการถดถอยเชิงเส้นทำนายจาก ?Y Y X
ครั้งแรกที่คล้ายคลึงกันบางอย่าง:
ประการที่สองความแตกต่างบางอย่าง:
lm
และcor.test
ในR
, จะให้ค่า p เหมือนกัน
นี่คือคำตอบที่ฉันโพสต์บนเว็บไซต์ graphpad.com :
ความสัมพันธ์และการถดถอยเชิงเส้นไม่เหมือนกัน พิจารณาความแตกต่างเหล่านี้:
ในกรณีของการทำนายความถดถอยเชิงเส้นเดียวความชันมาตรฐานมีค่าเท่ากับสัมประสิทธิ์สหสัมพันธ์ ข้อได้เปรียบของการถดถอยเชิงเส้นคือความสัมพันธ์สามารถอธิบายได้ในลักษณะที่คุณสามารถทำนายได้ (ขึ้นอยู่กับความสัมพันธ์ระหว่างตัวแปรสองตัว) คะแนนของตัวแปรทำนายที่ให้ค่าใด ๆ ของตัวแปรทำนาย โดยเฉพาะอย่างยิ่งข้อมูลชิ้นเดียวที่การถดถอยเชิงเส้นทำให้คุณรู้ว่าสหสัมพันธ์นั้นไม่ได้เป็นจุดตัดค่าของตัวแปรที่ทำนายไว้เมื่อตัวทำนายคือ 0
ในระยะสั้น - พวกเขาสร้างผลลัพธ์ที่เหมือนกันการคำนวณ แต่มีองค์ประกอบเพิ่มเติมที่สามารถตีความได้ในการถดถอยเชิงเส้นอย่างง่าย หากคุณสนใจเพียงแค่จำแนกขนาดของความสัมพันธ์ระหว่างสองตัวแปรให้ใช้สหสัมพันธ์ - หากคุณสนใจที่จะทำนายหรืออธิบายผลลัพธ์ของคุณในแง่ของค่าเฉพาะที่คุณอาจต้องการการถดถอย
การวิเคราะห์ความสัมพันธ์เชิงปริมาณเท่านั้นความสัมพันธ์ระหว่างสองตัวแปรที่ไม่สนใจซึ่งเป็นตัวแปรที่ขึ้นอยู่กับที่เป็นอิสระ แต่ก่อนที่ appliyng regression คุณต้อง calrify ผลกระทบของตัวแปรที่คุณต้องการตรวจสอบตัวแปรอื่น ๆ
คำตอบที่ให้ไว้ทั้งหมดให้ข้อมูลเชิงลึกที่สำคัญ แต่ไม่ควรลืมว่าคุณสามารถเปลี่ยนพารามิเตอร์ของข้อหนึ่งเป็นอีกข้อหนึ่งได้
การถดถอย:
การเชื่อมต่อระหว่างพารามิเตอร์การถดถอยและสหสัมพันธ์, ความแปรปรวนร่วม, ความแปรปรวน, ค่าเบี่ยงเบนมาตรฐานและค่าเฉลี่ย: b= ˉ y -m ˉ x
ดังนั้นคุณสามารถแปลงทั้งสองเป็นกันและกันโดยการปรับขนาดและการเปลี่ยนพารามิเตอร์ของพวกเขา
ตัวอย่างใน R:
y <- c(4.17, 5.58, 5.18, 6.11, 4.50, 4.61, 5.17, 4.53, 5.33, 5.14)
x <- c(4.81, 4.17, 4.41, 3.59, 5.87, 3.83, 6.03, 4.89, 4.32, 4.69)
lm(y ~ x)
##
## Call:
## lm(formula = y ~ x)
##
## Coefficients:
## (Intercept) x
## 6.5992 -0.3362
(m <- cov(y, x) / var(x)) # slope of regression
## [1] -0.3362361
cor(y, x) * sd(y) / sd(x) # the same with correlation
## [1] -0.3362361
mean(y) - m*mean(x) # intercept
## [1] 6.599196
จากความสัมพันธ์เราสามารถรับดัชนีที่อธิบายความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัวเท่านั้น ในการถดถอยเราสามารถคาดการณ์ความสัมพันธ์ระหว่างมากกว่าสองตัวแปรและสามารถใช้ในการระบุว่าตัวแปรxสามารถคาดการณ์ผลตัวแปรY
การอ้างอิง Altman DG, "สถิติเชิงปฏิบัติสำหรับการวิจัยทางการแพทย์" Chapman & Hall, 1991, หน้า 321: "สหสัมพันธ์ลดชุดข้อมูลเป็นตัวเลขเดียวที่ไม่มีความสัมพันธ์โดยตรงกับข้อมูลจริงการถดถอยเป็นวิธีที่มีประโยชน์มากกว่า ผลลัพธ์ที่เกี่ยวข้องอย่างชัดเจนกับการวัดที่ได้รับความแข็งแกร่งของความสัมพันธ์นั้นชัดเจนและความไม่แน่นอนสามารถเห็นได้อย่างชัดเจนจากช่วงความมั่นใจหรือช่วงการทำนาย "
การวิเคราะห์การถดถอยเป็นเทคนิคในการศึกษาสาเหตุของผลกระทบของความสัมพันธ์ระหว่างตัวแปรสองตัว ในขณะที่การวิเคราะห์ความสัมพันธ์เป็นเทคนิคในการศึกษาปริมาณความสัมพันธ์ระหว่างสองตัวแปร
ความสัมพันธ์เป็นดัชนี (เพียงหนึ่งหมายเลข) ของความแข็งแกร่งของความสัมพันธ์ การถดถอยคือการวิเคราะห์ (การประมาณค่าพารามิเตอร์ของแบบจำลองและการทดสอบทางสถิติของความสำคัญ) ของความเพียงพอของความสัมพันธ์การทำงานเฉพาะ ขนาดของสหสัมพันธ์นั้นเกี่ยวข้องกับความแม่นยำของการทำนายการถดถอย
ความสัมพันธ์เป็นคำศัพท์ในสถิติที่กำหนดว่ามีความสัมพันธ์ระหว่างสองและจากนั้นระดับของความสัมพันธ์ ช่วงนี้มีตั้งแต่ -1 ถึง +1 ในขณะที่การถดถอยหมายถึงการกลับไปสู่ค่าเฉลี่ย จากการถดถอยเราทำนายค่าโดยการคงไว้ซึ่งตัวแปรหนึ่งตัวและอื่น ๆ ที่เป็นอิสระ แต่มันควรจะชี้แจงค่าของตัวแปรที่เราต้องการทำนาย