วิธีที่ถูกต้องในการทดสอบความแตกต่างอย่างมีนัยสำคัญระหว่างค่าสัมประสิทธิ์คืออะไร?


18

ฉันหวังว่าบางคนสามารถช่วยชี้ประเด็นความสับสนให้ฉันได้ ว่าฉันต้องการทดสอบว่าสัมประสิทธิ์การถดถอย 2 ชุดนั้นแตกต่างกันอย่างมีนัยสำคัญหรือไม่ด้วยการตั้งค่าต่อไปนี้:

  • , มี 5 ตัวแปรอิสระyi=α+βxi+ϵi
  • 2 กลุ่มโดยมีขนาดเท่ากันโดยประมาณ (แม้ว่าอาจแตกต่างกัน)n1,n2
  • การถดถอยที่คล้ายกันหลายพันครั้งจะเกิดขึ้นพร้อมกันดังนั้นการแก้ไขสมมติฐานบางอย่างจึงต้องทำ

วิธีการหนึ่งที่แนะนำให้ฉันคือการใช้การทดสอบ Z:

Z=b1b2(SEb12+SEb22)

อีกสิ่งที่ฉันได้เห็นข้อเสนอแนะในบอร์ดนี้คือการแนะนำตัวแปรจำลองสำหรับการจัดกลุ่มและเขียนแบบจำลองใหม่เป็น:

โดยที่ gคือตัวแปรการจัดกลุ่มซึ่งเขียนเป็น 0, 1yi=α+βxi+δ(xigi)+ϵiก.

คำถามของฉันคือวิธีการทั้งสองนี้มีวิธีการที่แตกต่างกัน (เช่นสมมติฐานที่แตกต่างกันทำมีความยืดหยุ่น)? มีความเหมาะสมมากกว่าอีกอย่างหรือไม่? ฉันคิดว่ามันค่อนข้างธรรมดา แต่การชี้แจงใด ๆ จะได้รับการชื่นชมอย่างมาก


ฉันเชื่อว่าคำตอบและความเห็นต่อคำถามที่คล้ายกันอาจให้คำอธิบายที่คุณต้องการ
whuber

ขอบคุณมาก ฉันคุ้นเคยกับคำตอบนั้น จากการสนทนาใต้คำตอบที่ยอมรับ (และความคิดเห็นของคุณที่นั่น) ฉันรู้สึกว่าการเปรียบเทียบค่าสัมประสิทธิ์ของการแยก 2 แบบนั้นไม่เหมาะสม การทดสอบ z นำไปใช้กับสัมประสิทธิ์จากส่วนแยกที่ไม่ถูกต้องหรือว่าการเข้ารหัสตัวแปรดัมมี่นั้นง่ายกว่าและให้คำตอบที่เทียบเท่าหรือไม่
เงินสด

1
โปรดดูย่อหน้าสุดท้ายของคำตอบของฉัน ("ข้อ จำกัด หลัก ... ") Z-การทดสอบที่ถูกต้องสมมติว่ามีขนาดใหญ่ (มิฉะนั้นจะใช้ในการทดสอบ) และประมาณค่าเบี่ยงเบนมาตรฐานS E ฉันไม่ได้แตกต่างกันเกินไปจากกันและกัน ทั้งสองวิธีจะดีที่สุดเมื่อค่าเบี่ยงเบนมาตรฐานแตกต่างกันมาก (โดยประมาณมากกว่าอัตราส่วน 3: 1) niSEbi
whuber

คำตอบ:


13

ทั้งสองวิธีต่างกัน

ให้ข้อผิดพลาดมาตรฐานโดยประมาณของทั้งสองถดถอยเป็นและs 2 จากนั้นเนื่องจากการถดถอยแบบรวม (ที่มีค่าสัมประสิทธิ์ - ปฏิสัมพันธ์หุ่น) เหมาะกับสัมประสิทธิ์เดียวกันมันมีค่าคงที่เดียวกันดังนั้นจึงสามารถคำนวณข้อผิดพลาดมาตรฐานเป็นs1s2

s=(n1p)s12+(n2p)s22)n1+n22p.

จำนวนพารามิเตอร์เท่ากับ6p6ในตัวอย่าง: ห้าลาดและการสกัดกั้นในการถดถอยแต่ละครั้ง

b1b2b

SE(b)=s(SE(b1)/s1)2+(SE(b2)/s2)2.

s sนี่จะเป็นตัวส่วนสำหรับการทดสอบ t เห็นได้ชัดว่ามันไม่เหมือนกับตัวส่วนที่นำเสนอในคำถาม

ข้อสันนิษฐานของการถดถอยแบบรวมคือความแปรปรวนของค่าคงที่นั้นเหมือนกันทั้งในการถดถอยแบบแยกกัน หากไม่ใช่ในกรณีนี้การทดสอบ z จะไม่ดีเช่นกัน (ยกเว้นขนาดตัวอย่างที่มีขนาดใหญ่): คุณต้องการใช้การทดสอบ CABFหรือWelch-Satterthwaite t-test


9

วิธีที่ตรงที่สุดในการทดสอบความแตกต่างของสัมประสิทธิ์ระหว่างสองกลุ่มคือการรวมคำการโต้ตอบลงในการถดถอยของคุณซึ่งเกือบจะเป็นสิ่งที่คุณอธิบายไว้ในคำถามของคุณ โมเดลที่คุณต้องการรันมีดังต่อไปนี้:

yi=α+βxi+γgi+δ(xi×gi)+εi

tH0:δ=0gi=0

yi=α+βxi+εi

gi=1

yi=(α+γ)+(β+δ)xi+εi

δ


ขอบคุณสำหรับการแก้ไขแบบจำลอง (ฉันเชื่อว่ารุ่นของฉันด้านบนบังคับใช้เพียงจุดตัดที่เหมือนกันในทั้งสองกลุ่ม ... ) มากกว่าประเด็นนี่จะเท่ากับการทดสอบ z ที่ฉันโพสต์ไว้ด้านบนหรือไม่
เงินสด

Yผม=α+βxผม+γก.ผม+εผมYผม=α+βxผม+γก.ผม+δ(xผม×ก.ผม)+εผมเหมาะสมไหม
miura

@ matt-blackwell แนวคิดนี้เหมือนกับการแบ่งโมเดลโดยแต่ละค่าของ g หรือไม่ (เช่น. b จะเป็นสัมประสิทธิ์ของ x เมื่อ g = 0, และ beta + delta เมื่อ g = 1) แม้ว่าฉันจะพอใจที่การแบ่งชั้นไม่อนุญาตให้มีการเปรียบเทียบทางสถิติ
bobmcpop
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.