รูปแบบร่วมกับเงื่อนไขการทำงานร่วมกับการถดถอยแบบแยกต่างหากสำหรับการเปรียบเทียบกลุ่ม


13

หลังจากรวบรวมข้อเสนอแนะที่มีค่าจากคำถามและการอภิปรายก่อนหน้านี้ฉันได้พบกับคำถามต่อไปนี้: สมมติว่าเป้าหมายคือการตรวจจับความแตกต่างของเอฟเฟ็กต์ทั้งสองกลุ่ม มีสองวิธีในการทำ:

  1. ใช้การถดถอยสองแบบแยกกันสำหรับทั้งสองกลุ่มและใช้การทดสอบ Wald เพื่อปฏิเสธ (หรือไม่) สมมติฐานว่าง : b 1 - b 2 = 0โดยที่b 1คือสัมประสิทธิ์ของหนึ่ง IV ในการถดถอยชายและb 2คือ สัมประสิทธิ์ของ IV เดียวกันในการถดถอยหญิงH0b1b2=0b1b2

  2. รวมกลุ่มทั้งสองเข้าด้วยกันและเรียกใช้โมเดลร่วมโดยรวมเพศจำลองและคำที่ใช้โต้ตอบ (IV * genderdummy) จากนั้นการตรวจจับผลกระทบของกลุ่มจะขึ้นอยู่กับสัญลักษณ์ของการมีปฏิสัมพันธ์และการทดสอบ t เพื่อความสำคัญ

เกิดอะไรขึ้นถ้าโฮถูกปฏิเสธในกรณีที่ (1) เช่นความแตกต่างของกลุ่มมีความสำคัญ แต่ค่าสัมประสิทธิ์ของระยะการโต้ตอบในกรณีที่ (2) ไม่มีนัยสำคัญทางสถิตินั่นคือความแตกต่างของกลุ่มนั้นไม่สำคัญ หรือในทางกลับกันโฮจะไม่ปฏิเสธในกรณีที่ (1) และคำที่ใช้ในการโต้ตอบนั้นมีความสำคัญในกรณีที่ (2) ฉันลงเอยด้วยผลลัพธ์นี้หลายครั้งและฉันสงสัยว่าผลลัพธ์จะน่าเชื่อถือมากขึ้นและอะไรคือเหตุผลเบื้องหลังความขัดแย้งนี้

ขอบคุณมาก!


1
ความแตกต่างระหว่างโพรซีเดอร์คือสิ่งหนึ่งถือว่าความแปรปรวนเดียวกันสำหรับทั้งสองกลุ่ม การวิเคราะห์ที่แยกต่างหากถือว่าแตกต่างกัน
ความน่าจะเป็นทาง

ขอบคุณมากคุณทราบหรือไม่โปรดอ้างอิงถึงการพูดคุยเกี่ยวกับปัญหาของความแปรปรวนเมื่อเปรียบเทียบแบบจำลองที่แตกต่างกัน?
Bill718

คำตอบ:


7

โมเดลแรกจะโต้ตอบเพศกับผู้ร่วมพันธุ์อื่น ๆ ในโมเดลอย่างเต็มที่ โดยพื้นฐานแล้วผลของ covariate แต่ละอัน (b2, b3 ... bn) ในโมเดลที่สองเอฟเฟกต์ของเพศนั้นมีปฏิสัมพันธ์กับ IV ของคุณเท่านั้น ดังนั้นสมมติว่าคุณมีโควาเรียต์มากกว่าแค่ IV และเพศนี่อาจทำให้เกิดผลลัพธ์ที่แตกต่างกันบ้าง

หากคุณมีเพื่อนร่วมชาติสองคนมีโอกาสจัดทำเอกสารซึ่งความแตกต่างในการเพิ่มประสิทธิภาพสูงสุดระหว่างการทดสอบ Wald และการทดสอบอัตราส่วนความน่าจะเป็นนำไปสู่คำตอบที่แตกต่างกัน (ดูเพิ่มเติมเกี่ยวกับวิกิพีเดีย )

ในประสบการณ์ของฉันฉันพยายามที่จะได้รับคำแนะนำจากทฤษฎี หากมีทฤษฎีที่โดดเด่นที่แนะนำเพศจะมีปฏิสัมพันธ์กับ IV เท่านั้น แต่ไม่ใช่ covariates อื่น ๆ ฉันจะไปมีปฏิสัมพันธ์บางส่วน


ขอบคุณ! ใช่จริง ๆ แล้วมีโกวาเรียต่าง ๆ ไม่ใช่แค่ IV เดียวฉันแค่พูดถึง IV หนึ่งคำถามเพื่อความเรียบง่าย ประเด็นก็คือว่าไม่มีทฤษฎีที่แข็งแกร่งที่สามารถรองรับการปฏิสัมพันธ์ระหว่างเพศและเพื่อนร่วมงานบางคนมันคือการวิเคราะห์เชิงสำรวจดังนั้นฉันต้องทดสอบกับการโต้ตอบและแบบจำลองที่เหมาะสม รูปแบบเริ่มต้นมี 30 ทำนาย ...
Bill718

@ Bill718 นอกจากนี้โมเดลที่แยกต่างหากจะมีการสกัดกั้นที่แตกต่างกันในขณะที่โมเดลเดี่ยวจะไม่ยกเว้นคุณจะระบุเพศเพียงอย่างเดียวเป็น IV เพิ่มเติม (ไม่ใช่แค่เป็นการโต้ตอบ)
Robert Kubrick

5

เมื่อใดก็ตามที่มีการใช้สองโพรซีเดอร์ที่แตกต่างกันในการทดสอบสมมติฐานเฉพาะจะมีค่า p ต่างกัน การพูดแบบหนึ่งสำคัญและอีกอันไม่สามารถทำการตัดสินใจขาวดำได้ที่ระดับ 0.05 หากการทดสอบหนึ่งให้ค่า p-0.03 และอีกอันบอกว่า 0.07 ฉันจะไม่เรียกผลลัพธ์ที่ขัดแย้งกัน หากคุณกำลังจะเข้มงวดในการคิดเกี่ยวกับความสำคัญมันเป็นเรื่องง่ายที่จะมีทั้งสถานการณ์ (i) หรือ (ii) เกิดขึ้นเมื่อความสำคัญของกระดานเป็นกรณี

ดังที่ฉันได้กล่าวถึงในการตอบคำถามก่อนหน้าการตั้งค่าของฉันสำหรับการโต้ตอบคือการถดถอยแบบรวม


ใช่มันเป็นความจริงที่การถดถอยแบบรวมดูเหมือนว่าจะทำงานได้ดีขึ้นอย่างน้อยก็ในกรณีของฉันและเป็นวิธีการที่ยืดหยุ่นมากเนื่องจากมีใครบางคนสามารถลองใช้การโต้ตอบและรูปแบบที่แตกต่างกันได้ฉันแค่อยากรู้อยากเห็น เพื่อค้นหาว่าอะไรคือเหตุผลเบื้องหลังผลลัพธ์ที่ต่างกัน เกี่ยวกับค่า p ฉันเคยได้ยินบางคนยอมรับความสำคัญเท่านั้นที่ระดับ = 0.5% หรือน้อยกว่า ฉันมีความยืดหยุ่นมากขึ้นโดยใช้ระดับ = 1% แต่ปวดหัวใหญ่มาเมื่อค่า p แตกต่างกันโดยสิ้นเชิง
Bill718

ฉันได้เห็นการศึกษาตัวอย่างเช่นเมื่อ IV หนึ่งมีความสำคัญมากเมื่อใช้ modet logit ที่สั่งซื้อในขณะที่ IV เดียวกันนั้นไม่มีนัยสำคัญเมื่อใช้ OLS ดังนั้นในกรณีนี้คำอธิบายของผลลัพธ์อาจยุ่งยากเล็กน้อย ขอบคุณมากสำหรับความคิดเห็นและข้อเสนอแนะของคุณ!
Bill718

0.070.03

2

ในกรณีที่สองซอฟต์แวร์มาตรฐานจะแนะนำให้คุณใช้สถิติ t-student กับ t-student ในขณะที่สำหรับกรณีแรกการทดสอบ Wald อาจมีสองตัวเลือก ภายใต้ข้อผิดพลาดปกติทฤษฏีการคาดการณ์ Wald สถิติดังต่อไปนี้สถิติฟิชเชอร์ที่แน่นอน ในขณะที่ภายใต้ภาวะปกติเชิงซีเควนซ์วอลด์สถิติมีการแจกแจงแบบ Chi2 (ซึ่งเป็นการวิเคราะห์ทางสถิติของที - สแตทหลังจากการแจกแจงแบบปกติแบบอะซิมทีโทรติก) คุณคิดว่าการกระจายแบบใด ขึ้นอยู่กับความเสี่ยงค่า p ของคุณเพื่อให้ผลลัพธ์ที่แตกต่าง

ในตำราคุณจะพบว่าสำหรับการทดสอบทวิภาคีเดี่ยว (หนึ่งพารามิเตอร์) ทั้ง t-student และสถิติฟิชเชอร์จะเทียบเท่า

หากตัวอย่างของคุณไม่ใหญ่นักให้เปรียบเทียบการเปรียบเทียบค่า chi2 และ t-stat จะให้ผลลัพธ์ที่แตกต่างกัน ในกรณีที่สมมติว่า dsitribution dsymptotic จะไม่สมเหตุสมผล หากตัวอย่างของคุณมีขนาดค่อนข้างเล็กถ้าสมมติว่าปกตินั้นมีเหตุผลมากกว่านี้ก็หมายความว่า t-stat และ Fisher pvalues ​​สำหรับกรณีที่ 2 และ 1 ตามลำดับ


อันที่จริงฉันมีสองตัวอย่างที่มีขนาดไม่เท่ากันอันแรกมีการสังเกต 3000 ครั้ง แต่ครั้งที่สองนั้นค่อนข้างเล็ก 500 การสังเกต และซอฟต์แวร์รายงานไคสแควร์เมื่อคำนวณสถิติ Wald ดังนั้นดูเหมือนว่านี่คือเหตุผลของความคลาดเคลื่อน โดยปกติทั้งสองตัวอย่างจะถูกกระจายแม้ว่าโดยเฉพาะอย่างยิ่งในกรณีของตัวอย่างขนาดใหญ่ ขอบคุณมาก!
Bill718

1
ฉันขอโทษที่หลอกลวงคุณ แต่ขนาดตัวอย่างที่ไม่เท่ากันนั้นไม่ใช่ปัญหา ยิ่งกว่านั้นคุณก็ดูเหมือนตัวอย่างใหญ่สำหรับฉัน ดังนั้นขั้นตอนทั้งสองควรให้ผลลัพธ์ที่คล้ายกัน ฉันสังเกตเห็นว่า @probabilityislogic เป็นจุดที่ดี การใช้ตัวอย่างที่รวมกลุ่มหนึ่งหมายถึงความแปรปรวนที่เหลือเท่ากับดังนั้นอาจเป็นแหล่งที่มาของความหลากหลาย ไม่ทราบว่าคุณกำลังใช้ขั้นตอนการถดถอยแยกจากกันอย่างไร แต่ก็เป็นเรื่องง่ายที่จะทำผิดพลาดหากคุณกำลังคำนวณสถิติด้วยตัวคุณเอง สิ่งนี้ทำให้การถดถอยพูเป็นวิธีที่ตรงไปตรงมาอย่างปลอดภัย
JDav

1
เพื่อแก้ปัญหาความแปรปรวนที่ไม่เท่ากันในกลุ่มต่างๆ (heterosckedasticity) ลองใช้ White (aka Newey-west, Sandwich หรือ Robust ถ้าคุณใช้ stata) ตัวประมาณค่าความแปรปรวน วิธีนี้แก้ไขสำหรับ heteroscedascity ประเภทที่ไม่รู้จัก
JDav

โอ้ใช่แล้วฉันเห็นจริง ๆ แล้วข้อสังเกตในตัวอย่างมาจากภูมิภาคต่าง ๆ ของประเทศดังนั้นจึงเป็นไปได้มากที่ฉันเดาว่ามีปัญหาความแตกต่างกันอยู่!
Bill718
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.