ตัวทำนายที่มีความแปรปรวนมากขึ้น“ ดีกว่า” หรือไม่?


13

ฉันมีคำถามแนวคิดเกี่ยวกับ "สถิติพื้นฐาน" ในฐานะนักเรียนฉันอยากรู้ว่าฉันกำลังคิดผิดเกี่ยวกับเรื่องนี้โดยสิ้นเชิงหรือไม่และถ้าเป็นเช่นนั้น:

สมมุติว่าฉันพยายามดูความสัมพันธ์ระหว่าง "ปัญหาการจัดการความโกรธ" และพูดว่าการหย่า (ใช่ / ไม่ใช่) ในการถดถอยโลจิสติกส์และฉันมีตัวเลือกในการใช้คะแนนการจัดการความโกรธสองแบบ - ทั้ง 100
คะแนน 1 มาจากเครื่องมือให้คะแนนแบบสอบถาม 1 และตัวเลือกอื่นของฉัน คะแนน 2 มาจากแบบสอบถามอื่น สมมุติฐานเรามีเหตุผลที่จะเชื่อว่าจากการทำงานก่อนหน้านี้ว่าปัญหาการจัดการความโกรธทำให้เกิดการหย่าร้าง
หากในตัวอย่างของฉันมีคน 500 คนความแปรปรวนของคะแนน 1 สูงกว่าคะแนน 2 มากมีเหตุผลใดที่เชื่อว่าคะแนน 1 จะเป็นคะแนนที่ดีกว่าที่จะใช้เป็นตัวทำนายการหย่าร้างตามความแปรปรวนหรือไม่

สำหรับฉันแล้วสัญชาตญาณดูเหมือนว่าจะถูก แต่มันเป็นอย่างนั้นเหรอ?


คำถามที่น่าสนใจฉันเชื่อว่าคำตอบของ Whuber อธิบายได้อย่างสมบูรณ์ คำตอบแรกของฉันสำหรับคำถามคือ: 'ความแปรปรวนที่เพิ่มขึ้นไม่ได้นำมาซึ่งข้อมูลการเลือกปฏิบัติในชั้นเรียนที่สูงขึ้น'
Zhubarb

คำตอบ:


11

คะแนนสั้น ๆ :

  • ความแปรปรวนสามารถเพิ่มขึ้นหรือลดลงได้เองโดยการใช้สเกลที่แตกต่างกันสำหรับตัวแปรของคุณ การคูณสเกลด้วยค่าคงที่ที่มากกว่าหนึ่งจะเพิ่มความแปรปรวน แต่ไม่เปลี่ยนพลังการทำนายของตัวแปร
  • คุณอาจสับสนกับความน่าเชื่อถือแปรปรวน ทุกอย่างเท่าเทียมกัน (และสมมติว่ามีการทำนายคะแนนจริงอย่างน้อย) การเพิ่มความน่าเชื่อถือที่คุณวัดสิ่งก่อสร้างควรเพิ่มพลังการทำนาย ตรวจสอบการอภิปรายของนี้การแก้ไขลดทอน
  • สมมติว่าเครื่องชั่งทั้งสองนั้นประกอบด้วยสิ่งของยี่สิบห้าจุดและมีคะแนนรวมตั้งแต่ 20 ถึง 100 จากนั้นรุ่นที่มีความแปรปรวนมากขึ้นก็จะมีความน่าเชื่อถือมากกว่า (อย่างน้อยก็ในแง่ของความสอดคล้องภายใน)
  • ความน่าเชื่อถือที่สอดคล้องกันภายในไม่ใช่มาตรฐานเดียวที่ใช้ตัดสินการทดสอบทางจิตวิทยาและไม่ได้เป็นเพียงปัจจัยเดียวที่แยกความสามารถในการทำนายของสเกลหนึ่งเทียบกับอีกสเตจสำหรับการสร้างที่กำหนด

9

ตัวอย่างง่ายๆช่วยให้เราระบุสิ่งที่จำเป็น

ให้

Y=C+γX1+ε

ที่และเป็นพารามิเตอร์คือคะแนนของเครื่องดนตรีชิ้นแรก (หรือตัวแปรอิสระ) และแสดงถึงข้อผิดพลาด iid ที่ไม่เอนเอียง ให้คะแนนในตราสารที่สองเกี่ยวข้องกับคะแนนแรกผ่านCγX1ε

X1=αX2+β.

ยกตัวอย่างเช่นคะแนนในตราสารที่สองอาจจะอยู่ในช่วง 25-75 และคะแนนในวันแรกจาก 0 ถึง 100 ด้วย50 ความแปรปรวนของเป็นครั้งแปรปรวนของX_2อย่างไรก็ตามเราสามารถเขียนใหม่ได้X1=2X250X1α2X2

Y=C+γ(αX2+β)=(C+βγ)+(γα)X2+ε=C+γX2+ε.

การเปลี่ยนแปลงพารามิเตอร์และความแปรปรวนของการเปลี่ยนแปลงตัวแปรอิสระแต่ความสามารถในการคาดการณ์ของรูปแบบยังคงไม่เปลี่ยนแปลง

โดยทั่วไปความสัมพันธ์ระหว่างและอาจไม่เป็นเชิงเส้น ซึ่งเป็นตัวทำนายที่ดีกว่าของจะขึ้นอยู่กับว่ามีความสัมพันธ์เชิงเส้นใกล้กับมากขึ้น ดังนั้นปัญหาไม่ได้อยู่ในระดับหนึ่ง (ตามที่สะท้อนจากความแปรปรวนของ ) แต่จะต้องตัดสินใจโดยความสัมพันธ์ระหว่างเครื่องมือและสิ่งที่พวกเขาใช้ในการทำนาย ความคิดนี้จะต้องเกี่ยวข้องกับการสำรวจในหนึ่งคำถามล่าสุดเกี่ยวกับการเลือกตัวแปรอิสระในการถดถอยX 2 Y Y X iX1X2YYXi

X1X2YYX1X2X2


1

ตรวจสอบสมมติฐานสำหรับการทดสอบทางสถิติที่คุณใช้เสมอ!

หนึ่งในสมมติฐานของการถดถอยโลจิสติกคือความเป็นอิสระของข้อผิดพลาดซึ่งหมายความว่ากรณีของข้อมูลไม่ควรเกี่ยวข้อง เช่น. คุณไม่สามารถวัดคนเดียวกันในเวลาที่แตกต่างกันซึ่งฉันกลัวว่าคุณอาจทำกับแบบสำรวจการจัดการความโกรธของคุณ

ฉันก็จะเป็นห่วงว่าด้วยแบบสำรวจการจัดการความโกรธ 2 รายการที่คุณกำลังวัดในสิ่งเดียวกันและการวิเคราะห์ของคุณอาจประสบกับความหลากหลาย


1
ฉันคิดว่า N26 แนะนำการทดสอบความคิด นั่นคือถ้าหากคุณออกแบบการศึกษาคุณมีทางเลือกระหว่างเครื่องชั่งสองเครื่องคุณควรเลือกแบบที่ดีกว่าหรือไม่ นอกจากนี้การมีตัวทำนายสองตัวที่เป็นตัวแทนของโครงสร้างเดียวกัน แต่การวัดต่างกันนั้นไม่ได้ละเมิดสมมติฐานของความเป็นอิสระของการสังเกต
Jeromy Anglim
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.