การทดสอบความเท่าเทียมกันของสัมประสิทธิ์จากการถดถอยสองแบบที่แตกต่างกัน


44

นี่ดูเหมือนจะเป็นปัญหาพื้นฐาน แต่ฉันเพิ่งรู้ว่าจริง ๆ แล้วฉันไม่รู้วิธีทดสอบความเท่าเทียมของสัมประสิทธิ์จากการถดถอยสองแบบที่แตกต่างกัน มีใครบ้างไหมที่ให้แสงนี้?

อีกอย่างเป็นทางการเช่นสมมติว่าฉันวิ่งต่อไปนี้สองถดถอย: และ ที่หมายถึงเมทริกซ์การออกแบบของการถดถอยและเวกเตอร์ของสัมประสิทธิ์ในการถดถอย . โปรดทราบว่าและอาจแตกต่างกันมากที่มีขนาดแตกต่างกัน ฯลฯ ฉันสนใจในตัวอย่างหรือไม่{21}ปี2 = X 2 β 2 + ε 2 X ฉันฉันβ ฉันฉันX 1 X 2 β 11β 21

y1=X1β1+ϵ1
y2=X2β2+ϵ2
XiiβiiX1X2β^11β^21

หากสิ่งเหล่านี้มาจากการถดถอยแบบเดียวกันนี่จะไม่สำคัญ แต่เนื่องจากพวกเขามาจากคนที่แตกต่างกันฉันไม่แน่ใจว่าจะทำอย่างไร ไม่มีใครมีความคิดหรือสามารถให้คำแนะนำกับฉันได้บ้าง

ปัญหาของฉันในรายละเอียด: สัญชาตญาณแรกของฉันคือการดูช่วงความมั่นใจและหากพวกเขาทับซ้อนกันฉันจะบอกว่าพวกเขาเหมือนกัน ขั้นตอนนี้ไม่ได้มาพร้อมกับขนาดของการทดสอบที่ถูกต้องแม้ว่า (เช่นแต่ละช่วงความเชื่อมั่นของแต่ละบุคคลมีพูด แต่การดูพวกมันด้วยกันจะไม่มีความน่าจะเป็นแบบเดียวกัน) สัญชาตญาณ "ที่สอง" ของฉันคือการทดสอบแบบปกติ นั่นคือเอาα=0.05

β11β21sd(β11)

โดยที่ถูกนำมาเป็นค่าของสมมติฐานว่างของฉัน สิ่งนี้ไม่ได้คำนึงถึงความไม่แน่นอนในการประมาณของและคำตอบอาจขึ้นอยู่กับคำสั่งของการถดถอย (ซึ่งฉันเรียก 1 และ 2) β 21β21β21

ความคิดที่สามของฉันคือการทำแบบทดสอบมาตรฐานเพื่อความเท่าเทียมกันของสัมประสิทธิ์สองตัวจากการถดถอยเดียวกันนั่นคือ

β11β21sd(β11β21)

ภาวะแทรกซ้อนเกิดขึ้นเนื่องจากข้อเท็จจริงที่ว่าทั้งสองมาจากการถดถอยที่แตกต่างกัน สังเกตได้ว่า

Var(β11β21)=Var(β11)+Var(β21)2Cov(β11,β21)
แต่เนื่องจาก พวกเขามาจากการถดถอยต่างกันฉันจะได้รับอย่างไรCov(β11,β21)

นี่ทำให้ฉันถามคำถามนี้ที่นี่ นี่จะต้องเป็นขั้นตอนมาตรฐาน / การทดสอบมาตรฐาน แต่ฉันพบว่าไม่มีอะไรที่คล้ายกับปัญหานี้เพียงพอ ดังนั้นถ้าใครสามารถชี้ให้ฉันไปยังขั้นตอนที่ถูกต้องฉันจะขอบคุณมาก!


2
สิ่งนี้ดูเหมือนจะเกี่ยวข้องกับการสร้างแบบจำลองสมการเชิงโครงสร้าง วิธีหนึ่งในการแก้ปัญหานี้คือการปรับสมการทั้งสองแบบพร้อมกันเช่นมีความเป็นไปได้สูงสุดแล้วใช้การทดสอบอัตราส่วนความน่าจะเป็นของข้อ จำกัด ในทางปฏิบัติสามารถทำได้ด้วยซอฟต์แวร์ SEM (Mplus, lavaan และอื่น ๆ )
tomka

2
คุณรู้เกี่ยวกับการถดถอยที่ไม่เกี่ยวข้อง (SUR) หรือไม่?
Dimitriy V. Masterov

2
ฉันคิดว่าคำถามการเพิ่มของคุณคือวิธีรับโควตของค่าสัมประสิทธิ์ทั้งสองนี้จะถูกแก้ไขโดย SEM ซึ่งจะให้เมทริกซ์ var-cov ของสัมประสิทธิ์ทั้งหมด จากนั้นคุณสามารถใช้การทดสอบ Wald ในแบบที่คุณแนะนำแทนการทดสอบ LRT นอกจากนี้คุณยังสามารถใช้การสุ่มตัวอย่าง / bootstrap ซึ่งอาจจะตรงกว่า
tomka

3
ใช่คุณพูดถูกเกี่ยวกับเรื่องนี้ @tomka ในแบบจำลอง SUR (ซึ่งคุณสามารถพูดอย่างอิสระให้พิจารณากรณีพิเศษของแบบจำลอง SEM) ฉันจะได้รับแบบทดสอบที่เหมาะสม ขอบคุณที่ชี้นำฉันในทิศทางนั้น! ฉันคิดว่าฉันไม่ได้คิดเกี่ยวกับมันเพราะดูเหมือนว่าจะยิงนกกระจอกด้วยปืนใหญ่ แต่ฉันก็ไม่สามารถคิดวิธีที่ดีกว่านี้ได้ หากคุณเขียนคำตอบฉันจะทำเครื่องหมายว่าถูกต้อง มิฉะนั้นฉันจะเขียนมันด้วยตัวเองในไม่ช้าพร้อมคำอธิบายทางทฤษฎีอย่างรวดเร็วและอาจเป็นตัวอย่าง
coffeinjunky

1
SUR ใช้งานง่าย นี่คือตัวอย่างหนึ่งที่มี Stata ด้วย R คุณต้องการsystemfit ที่เหมาะสม
Dimitriy V. Masterov

คำตอบ:


30

แม้ว่านี่ไม่ใช่การวิเคราะห์ทั่วไป แต่เป็นสิ่งที่น่าสนใจอย่างหนึ่ง คำตอบที่ได้รับการยอมรับนั้นเหมาะกับวิธีที่คุณถามคำถามของคุณ แต่ฉันจะให้เทคนิคอื่นที่ได้รับการยอมรับอย่างดีพอสมควรซึ่งอาจจะใช่หรือไม่ก็เท่ากัน

วิธีนี้คือการใช้การทดสอบ Z ต่อไปนี้:

Z=β1β2(SEβ1)2+(SEβ2)2

ที่ไหนเป็นข้อผิดพลาดมาตรฐานของ\บีตาSEββ

สมการนี้จัดทำโดยClogg, CC, Petkova, E. , & Haritou, A. (1995) วิธีการทางสถิติสำหรับการเปรียบเทียบค่าสัมประสิทธิ์การถดถอยระหว่างตัวแบบ วารสารสังคมวิทยาอเมริกัน , 100 (5), 1261-1293 และอ้างถึงโดยPaternoster, R. , Brame, R. , Mazerolle, P. , & Piquero, A. (1998) การใช้การทดสอบทางสถิติที่ถูกต้องเพื่อความเท่าเทียมกันของสัมประสิทธิ์การถดถอย อาชญวิทยา , 36 (4), 859-866 สมการที่ 4 ซึ่งมีให้บริการฟรีจาก paywall ฉันได้ปรับสูตรของ Peternoster ให้ใช้มากกว่าb ββbเพราะเป็นไปได้ว่าคุณอาจสนใจ DV ที่แตกต่างกันด้วยเหตุผลอันน่ากลัวและความทรงจำของ Clogg et al คือการที่พวกเขาใช้สูตร\ฉันยังจำได้ว่าข้ามการตรวจสอบสูตรนี้กับโคเฮนโคเฮนเวสต์และไอเคนและรากของความคิดเดียวกันสามารถพบได้ในช่วงความเชื่อมั่นของความแตกต่างระหว่างค่าสัมประสิทธิ์สมการ 2.8.6, pg 46-47β


ดูเพิ่มเติมที่: stats.stackexchange.com/questions/55501/…
russellpierce

คำตอบที่ยอดเยี่ยม! คำถามติดตามผล: สิ่งนี้นำไปใช้กับชุดค่าผสมเชิงเส้นของจากรุ่น 1 และจากรุ่น 2 หรือไม่ ชอบβ 2 Z = A β 1 - B β 2β1β2
Z=Aβ1Bβ2(SEAβ1)2+(SEBβ2)2
Sibbs พนัน

1
นอกจากนี้ฉันสังเกตเห็นว่ากระดาษพูดถึงกรณีที่นางแบบหนึ่งซ้อนกันในอีกโมเดลและ DV ของทั้งสองรุ่นเหมือนกัน เกิดอะไรขึ้นถ้าเงื่อนไขทั้งสองนี้ไม่เป็นไปตาม แต่ฉันมีเมทริกซ์การออกแบบของทั้งสองรุ่นเหมือนกัน แต่มี DV ที่ต่างกัน สูตรนี้ยังใช้อยู่หรือไม่? ขอบคุณมาก!
การพนัน Sibbs

1
@SibbsGambling: คุณอาจต้องการทำให้คำถามนั้นถูกต้องเพื่อดึงดูดความสนใจมากขึ้น
russellpierce

β1β2

12

สำหรับคนที่มีคำถามคล้ายกันฉันจะให้คำตอบง่ายๆ

y1y2

(y1y2)=(X1  00  X2)(β1β2)+(e1e2)

สิ่งนี้จะนำไปสู่เมทริกซ์ความแปรปรวนร่วม - ความแปรปรวนร่วมที่อนุญาตให้ทดสอบความเท่าเทียมกันของสัมประสิทธิ์ทั้งสอง


11
ฉันใช้วิธีที่คุณแนะนำและเปรียบเทียบกับวิธีข้างต้น ฉันพบความแตกต่างที่สำคัญคือการสันนิษฐานว่าความแปรปรวนข้อผิดพลาดเหมือนกันหรือไม่ วิธีการของคุณจะถือว่าความแปรปรวนข้อผิดพลาดเหมือนกันและวิธีการข้างต้นไม่ถือว่า
KH Kim Kim

2
นี้ทำงานได้ดีสำหรับฉัน. ใน Stata ฉันทำสิ่งที่ชอบ: expand =2, generate(indicator); generate y = cond(indicator, y2, y1); regress y i.indicator##c.X, vce(cluster id); การใช้บัญชีข้อผิดพลาดมาตรฐานแบบกลุ่มเนื่องจากข้อเท็จจริงที่ว่า e1 และ e2 ไม่เป็นอิสระจากการสังเกตเดียวกันหลังจากซ้อนชุดข้อมูล
wkschwartz

1
  • Var(β1β2)=Var(β1)+Var(β2)

  • covar(β1,β2)0

  • (Clogg, CC, Petkova, E. , & Haritou, A. (1995). วิธีการทางสถิติสำหรับการเปรียบเทียบค่าสัมประสิทธิ์การถดถอยระหว่างแบบจำลองวารสารอเมริกันของสังคมวิทยา, 100 (5), 1261-1293) นำเสนอคำตอบในกรณีพิเศษ ของสมการที่ซ้อนกัน (เช่นเพื่อให้ได้สมการที่สองพิจารณาสมการแรกและเพิ่มตัวแปรอธิบายสองสามอย่าง) พวกเขาบอกว่ามันง่ายที่จะใช้

  • หากฉันเข้าใจเป็นอย่างดีในกรณีพิเศษนี้การทดสอบ Haussman ก็สามารถนำมาใช้ได้ ความแตกต่างที่สำคัญคือการทดสอบของพวกเขาพิจารณาว่าเป็นจริงสมการที่สอง (เต็ม) ในขณะที่การทดสอบของ Haussman ถือว่าเป็นจริงของสมการแรก

  • โปรดทราบว่า Clogg et al (1995) ไม่เหมาะกับข้อมูลพาเนล แต่การทดสอบของพวกเขาได้รับการสรุปโดย (Yan, J. , Aseltine Jr, RH, & Harel, O. (2013) การเปรียบเทียบสัมประสิทธิ์การถดถอยระหว่างโมเดลเชิงเส้นซ้อนสำหรับข้อมูลคลัสเตอร์กับสมการประมาณทั่วไปวารสารการศึกษาและสถิติพฤติกรรม, 38 (2), 172-189.) พร้อมแพ็คเกจที่ให้ไว้ใน R: geepack ดู: https://www.jstor.org/stable/pdf/41999419.pdf?refreqid=excelsior%3Aa0a3b20f2bc68223edb59e3254c234be&seq=1

และ (สำหรับแพ็คเกจ R): https://cran.r-project.org/web/packages/geepack/index.html

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.