วิธีการเลือกระหว่างสูตรAdjustedแตกต่างกันอย่างไร


15

ฉันมีในใจสูตร R - squared ปรับเสนอโดย:

  • Ezekiel (1930) ซึ่งฉันเชื่อว่าเป็นสิ่งที่ใช้ใน SPSS

    Radjusted2=1(N1)(Np1)(1R2)
  • Olkin และแพรตต์ (1958)

    Runbiased2=1(N3)(1R2)(Np1)2(N3)(1R2)2(Np1)(Np+1)

ภายใต้สถานการณ์ใด (ถ้ามี) ผมจะชอบ 'ปรับ' เป็น 'เป็นกลาง' ?R2

อ้างอิง

  1. Ezekiel, M. (1930) วิธีการวิเคราะห์ความสัมพันธ์ John Wiley and Sons, นิวยอร์ก
  2. Olkin I. แพรตต์เจดับบลิว (1958) การประมาณค่าสัมประสิทธิ์สหสัมพันธ์แบบไม่เอนเอียง พงศาวดารของสถิติคณิตศาสตร์ , 29 (1), 201-211

คำตอบ:


5

โดยไม่ต้องการรับเครดิตสำหรับคำตอบของ @ttnphns ฉันต้องการย้ายคำตอบออกจากความคิดเห็น (โดยเฉพาะอย่างยิ่งเมื่อพิจารณาว่าลิงก์ไปยังบทความเสียชีวิตแล้ว) คำตอบของ Matt Krause ให้การอภิปรายที่มีประโยชน์เกี่ยวกับความแตกต่างระหว่างR2และRadj2แต่ไม่ได้กล่าวถึงการตัดสินใจที่Radj2สูตรใช้ในกรณีใดก็ตาม

เมื่อฉันพูดถึงคำตอบนี้ Yin และ Fan (2001) ให้ภาพรวมที่ดีของสูตรที่แตกต่างกันมากมายสำหรับการประมาณค่าความแปรปรวนของประชากรที่อธิบายซึ่งทั้งหมดอาจจะต้องติดฉลากประเภทของการปรับ R 2ρ2R2

พวกเขาทำการจำลองเพื่อประเมินว่าสูตร r-square ที่ปรับได้หลากหลายแบบใดให้การประมาณที่ไม่เอนเอียงที่ดีที่สุดสำหรับขนาดตัวอย่างที่แตกต่างกันและอินเทอร์เรเตอร์สัมพันธ์ของตัวทำนาย พวกเขาแนะนำว่าสูตรของแพรตต์อาจเป็นตัวเลือกที่ดี แต่ฉันไม่คิดว่าการศึกษาจะชัดเจนในเรื่องนี้ρ2

อัปเดต: Raju et al (1997) โปรดทราบว่าสูตรที่ปรับแล้วนั้นแตกต่างกันไปขึ้นอยู่กับว่าพวกมันถูกออกแบบมาเพื่อประมาณค่าR 2 ที่ปรับแล้วโดยสมมติว่า predcitors แบบคงที่หรือแบบสุ่ม -x โดยเฉพาะสูตร Ezekial ได้รับการออกแบบเพื่อประเมินR2R2ในบริบทคงที่ x และ Olkin-แพรตต์และแพรตต์สูตรถูกออกแบบมาเพื่อประเมิน ρ 2ในบริบทสุ่ม x ไม่มีความแตกต่างกันมากระหว่างสูตร Olkin-Pratt และ Pratt สมมติฐานที่คงที่ -x สอดคล้องกับการทดลองที่วางแผนไว้สมมติฐานแบบสุ่ม -x จะสอดคล้องกับเมื่อคุณสมมติว่าค่าของตัวแปรตัวทำนายเป็นตัวอย่างของค่าที่เป็นไปได้เช่นเดียวกับกรณีทั่วไปในการศึกษาเชิงสังเกตการณ์ ดูρ2ρ2คำตอบนี้สำหรับการอภิปรายต่อไป นอกจากนี้ยังมีความแตกต่างระหว่างสูตรสองประเภทไม่มากนักเมื่อขนาดตัวอย่างมีขนาดใหญ่พอสมควร (ดูที่นี่สำหรับการอภิปรายเกี่ยวกับขนาดของความแตกต่าง )

บทสรุปของกฎของ Thumb

  • หากคุณสมมติว่าการสังเกตตัวแปรทำนายเป็นตัวอย่างแบบสุ่มจากประชากรและคุณต้องการประมาณ สำหรับประชากรเต็มรูปแบบทั้งการพยากรณ์และเกณฑ์ (เช่นสุ่ม x สมมติฐาน) แล้วใช้สูตร Olkin-แพรตต์ (หรือ สูตร Pratt)ρ2
  • หากคุณคิดว่าการสังเกตของคุณได้รับการแก้ไขหรือคุณไม่ต้องการพูดเกินกว่าระดับที่คุณคาดการณ์ไว้ให้ประมาณด้วยสูตรเอเสเคียลρ2
  • หากคุณต้องการทราบเกี่ยวกับการทำนายตัวอย่างโดยใช้สมการการถดถอยตัวอย่างคุณจะต้องการดูขั้นตอนการตรวจสอบข้ามรูปแบบบางอย่าง

อ้างอิง

  • Raju, NS, Bilgic, R. , Edwards, JE, & Fleer, PF (1997) การทบทวนวิธีการ: การประมาณความตรงของประชากรและความตรงข้ามและการใช้น้ำหนักเท่ากันในการทำนาย การวัดทางจิตวิทยาประยุกต์, 21 (4), 291-305
  • Yin, P. , & Fan, X. (2001) การประมาณการหดตัวในการถดถอยหลายครั้ง: การเปรียบเทียบวิธีการวิเคราะห์ที่แตกต่างกัน วารสารการศึกษาทดลอง, 69 (2), 203-224 ไฟล์ PDFR2

13

ทางเลือกของหรือปรับR 2ขึ้นอยู่กับสิ่งที่คุณกำลังพยายามที่จะทำ ในบริบทการถดถอยR 2ปกติจะใช้เป็นเครื่องวัดความดีที่เหมาะกับแบบจำลองของคุณ อย่างไรก็ตามลองจินตนาการว่าคุณกำลังเปรียบเทียบหลายรุ่นที่มีพารามิเตอร์ต่างกัน ทุกสิ่งเท่ากันโมเดลที่มีพารามิเตอร์มากขึ้นจะเหมาะสมกับการสังเกตของคุณมากขึ้น ในขีด จำกัด คุณสามารถมีโมเดลพร้อมพารามิเตอร์สำหรับแต่ละจุดข้อมูล แต่มีหนึ่งแบบ สิ่งนี้จะให้ความพอดีกับข้อสังเกตของคุณ แต่จะไร้ประโยชน์สำหรับการคาดการณ์ใหม่เนื่องจากมันจะจับสัญญาณ 'สัญญาณ' และเสียงรบกวนใด ๆ ที่เกี่ยวข้อง Adjusted R 2เป็นความพยายามในการแก้ปัญหานี้โดยการปรับRR2R2R2R2ค่าตามจำนวนพารามิเตอร์ในรูปแบบR2

พวกเขามีวัตถุประสงค์ที่แตกต่างกันเล็กน้อย อธิบายว่าชุดข้อมูลที่แตกต่างกันนั้นเหมาะสมกับแบบจำลองอย่างไร คุณอาจเขียนบางอย่างเช่น "แบบจำลองที่อธิบายไว้ข้างต้นทำนายประสิทธิภาพของส่วน A ( r 2 = 0.9) ได้อย่างแม่นยำแต่ไม่ใช่ Widget B ( r 2 = 0.05) ภายใต้เงื่อนไขการทดสอบมาตรฐาน" R 2 ที่ปรับปรุงแล้วจะอธิบายว่าแบบจำลองที่ต่างกันนั้นเหมาะสมกับข้อมูลเดียวกันมากน้อยเพียงใด (หรือข้อมูลที่คล้ายกัน) ตัวอย่างเช่น "ผลลัพธ์จากแบบสอบถามสั้นและยาวทำนายการใช้จ่ายประจำปีของลูกค้าอย่างเท่าเทียมกัน (ปรับR 2 = 0.8 สำหรับทั้งคู่)"R2r2r2R2R2


2
ขอบคุณฉันพบว่าการอธิบายอย่างชัดเจนเกี่ยวกับความแตกต่างระหว่าง R-squared และ R-squared ที่ปรับแล้ว ในมุมมองของคุณ R-squared ที่ไม่ลำเอียงเข้ากับภาพนี้ได้อย่างไร
user1205901 - Reinstate Monica

5
แน่นอนมีสูตรหลากหลายที่จะประมาณประชากร R ^ 2 ดูตัวอย่างstudyforquals.pbworks.com/f/yin.pdf ฟิชเชอร์ส (= Wherry's) "มีการปรับค่า R ^ 2" บอกว่าจะลำเอียงในทางลบเล็กน้อย (มันยังคงขึ้นอยู่กับขนาดตัวอย่างในขณะที่ไม่ขึ้นอยู่กับจำนวนของตัวทำนาย) ดังนั้น Olkin-Pratt อาจจะค่อนข้างดีกว่า
ttnphns

1
@ttnphns อาจเป็นคำตอบแทนที่จะเป็นความคิดเห็น สำหรับฉันดูเหมือนว่าจะตอบคำถามต้นฉบับมากกว่าคำตอบนี้
gung - Reinstate Monica

1
R2R2

1
@ttnphns ฉันเห็นด้วยกับ Gung! คุณควรเขียนคำตอบและจดเครดิต นอกจากนี้คุณสามารถยืนยันสิ่งที่ฉันเขียน? JStor ทำตัวแปลก ๆ วันนี้และจะไม่ให้ฉันอ่านต้นฉบับ Olkin และ Pratt paper
Matt Krause
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.