ในหัวของฉันมีความสับสนเกี่ยวกับตัวประมาณสองประเภทของค่าประชากรของสัมประสิทธิ์สหสัมพันธ์เพียร์สัน
A. ฟิชเชอร์ (2458)แสดงให้เห็นว่าสำหรับประชากรปกติ bivariate เชิงประจักษ์คือตัวเอนเอียงของลำเอียงแม้ว่าอคติจะมีจำนวนมากพอสมควรจริงเพียงเล็กน้อยสำหรับกลุ่มตัวอย่างขนาดเล็ก ( ) ตัวอย่างดูถูกในแง่ที่ว่ามันอยู่ใกล้กับกว่า\(ยกเว้นเมื่อสมัยเป็นหรือสำหรับแล้วเป็นกลาง.) หลายเกือบประมาณเป็นกลางของได้รับการเสนอที่ดีที่สุดคนหนึ่งอาจจะเป็นOlkin และแพรตต์ (1958)ρ n < 30 r ρρ 0 ± 1 rแก้ไข :
B.มีการกล่าวกันว่าในการถดถอยพบว่าประเมินค่าประชากร R-square ที่สอดคล้องกัน หรือมีการถดถอยง่ายๆก็คือว่า overestimates 2 จากข้อเท็จจริงนั้นฉันได้เห็นข้อความมากมายที่บอกว่านั้นมีอคติเชิงบวกเมื่อเทียบกับซึ่งหมายถึงค่าสัมบูรณ์:นั้นไกลจากมากกว่า (นั่นเป็นคำสั่งจริงหรือไม่) ข้อความบอกว่ามันเป็นปัญหาเดียวกันกับการประมาณค่าเกินของค่าเบี่ยงเบนมาตรฐานโดยค่าตัวอย่าง มีหลายสูตรที่จะ "ปรับ" สังเกตใกล้กับพารามิเตอร์ประชากรของ Wherry's (1931)r 2 ρ 2 rr 0 ρ R 2 เป็นที่รู้จักมากที่สุด (แต่ไม่ดีที่สุด) รูทของการปรับนั้นถูกเรียกว่าshrunken :
ปัจจุบันมีประมาณสองแตกต่างกันของ\แตกต่างกันมาก: ครั้งแรกหนึ่งพอง , ขึงขังที่สองrจะตกลงกันได้อย่างไร ที่จะใช้ / รายงานหนึ่งและที่ไหน - อื่น ๆ ?r r
โดยเฉพาะอย่างยิ่งมันเป็นความจริงหรือไม่ที่ตัวประเมิน "หด" เป็น (เกือบ) ไม่เอนเอียงเกินไปเช่นเดียวกับ "ไม่ลำเอียง" แต่มีเฉพาะในบริบทที่แตกต่าง - ในบริบทที่ไม่สมดุลของการถดถอย สำหรับในการถดถอย OLS เราพิจารณาค่าของด้านหนึ่ง (ตัวทำนาย) ว่าเป็นค่าคงที่การเข้าร่วมโดยไม่มีข้อผิดพลาดแบบสุ่มจากกลุ่มตัวอย่างถึงกลุ่มตัวอย่าง? (และเพื่อเพิ่มที่นี่การถดถอยไม่จำเป็นต้องมีค่าเฉลี่ยแบบ bivariate )