จะทดสอบว่าสัมประสิทธิ์การถดถอยนั้นมีการควบคุมโดยตัวแปรการจัดกลุ่มหรือไม่?


9

ฉันได้ทำการถดถอยกับกลุ่มตัวอย่างสองกลุ่มโดยใช้ตัวแปรตัวควบคุม (พูดเพศ) ฉันกำลังทำการทดสอบอย่างง่ายสำหรับเอฟเฟกต์การตรวจสอบโดยการตรวจสอบว่าความสำคัญของการถดถอยนั้นหายไปในหนึ่งชุดขณะที่ยังคงอยู่ในอีกชุดหนึ่งหรือไม่

Q1: วิธีการข้างต้นถูกต้องใช่ไหม

Q2: ระดับความมั่นใจในการวิจัยของฉันตั้งไว้ที่ 95% สำหรับกลุ่มหนึ่งการถดถอยมีนัยสำคัญที่. 000 สำหรับคนอื่น ๆ มันมีความสำคัญที่ 0.038 ดังนั้นฉันเชื่อว่าฉันต้องยอมรับการถดถอยทั้งสองอย่างมีนัยสำคัญและไม่มีผลการกลั่นกรอง โดยการยอมรับการถดถอยมีความสำคัญในขณะที่มันพิสูจน์แล้วว่าไม่ได้อยู่ที่ 0.01 น. ฉันทำให้เกิดข้อผิดพลาด Type I (ยอมรับอาร์กิวเมนต์ที่ผิดพลาด)?

คำตอบ:


12

วิธีการของคุณไม่ปรากฏขึ้นเพื่อตอบคำถามโดยสมมติว่า "ผลการกลั่นกรอง" เป็นการเปลี่ยนแปลงค่าสัมประสิทธิ์การถดถอยหนึ่งค่าหรือมากกว่าระหว่างสองกลุ่ม การทดสอบความสำคัญในการถดถอยประเมินว่าสัมประสิทธิ์เป็นศูนย์หรือไม่ การเปรียบเทียบค่า p ในสองการถดถอยจะบอกคุณเล็กน้อย (ถ้ามี) เกี่ยวกับความแตกต่างของสัมประสิทธิ์เหล่านั้นระหว่างสองตัวอย่าง

ให้แนะนำเพศเป็นตัวแปรจำลองและโต้ตอบกับสัมประสิทธิ์ที่สนใจ จากนั้นทดสอบความสำคัญของสัมประสิทธิ์ที่เกี่ยวข้อง

ตัวอย่างเช่นในกรณีที่ง่ายที่สุด (ของตัวแปรอิสระหนึ่งตัว) ข้อมูลของคุณสามารถแสดงเป็นรายการได้ (xi,yi,gi) อันดับที่ gi เป็นเพศที่เขียนรหัสเป็น 0 และ 1. แบบจำลองสำหรับเพศ0 คือ

yi=α0+β0xi+εi

(ในกรณีที่ i จัดทำดัชนีข้อมูลที่ gi=0) และโมเดลสำหรับเพศ 1 คือ

yi=α1+β1xi+εi

(ในกรณีที่ i จัดทำดัชนีข้อมูลที่ gi=1) พารามิเตอร์คือα0, α1, β0และ β1. ข้อผิดพลาดคือεi. สมมติว่าพวกมันมีความเป็นอิสระและกระจายตัวเหมือนกันด้วยศูนย์วิธี แบบจำลองรวมเพื่อทดสอบความแตกต่างในทางลาด (βสามารถเขียนเป็น

yi=α+β0xi+(β1β0)(xigi)+εi

(ในกรณีที่ i ช่วงข้อมูลทั้งหมด) เพราะเมื่อคุณตั้ง gi=0 เทอมสุดท้ายออกมาให้โมเดลแรกด้วย α=α0และเมื่อคุณตั้งค่า gi=1 สองทวีคูณของ xi รวมกันเพื่อให้ β1ให้รูปแบบที่สองด้วย α=α1. ดังนั้นคุณสามารถทดสอบว่าเนินเดียวกันหรือไม่

yi=α+βxi+γ(xigi)+εi

และการทดสอบว่าขนาดผลการควบคุมโดยประมาณ γ^เป็นศูนย์ หากคุณไม่แน่ใจว่าการสกัดกั้นจะเหมือนกันให้รวมคำที่สี่:

yi=α+δgi+βxi+γ(xigi)+εi.

คุณไม่จำเป็นต้องทดสอบว่า δ^ มีค่าเป็นศูนย์ถ้านั่นไม่ใช่สิ่งที่น่าสนใจ: มันถูกรวมเพื่ออนุญาตให้แยกเชิงเส้นพอดีกับสองเพศโดยไม่บังคับให้พวกเขามีการสกัดกั้นเดียวกัน

ข้อ จำกัด หลักของวิธีนี้คือสมมติฐานที่ว่าผลต่างของความผิดพลาดεiเหมือนกันทั้งสองเพศ ถ้าไม่คุณต้องรวมความเป็นไปได้นั้นไว้และต้องใช้งานซอฟต์แวร์เพิ่มเติมอีกเล็กน้อยเพื่อให้พอดีกับแบบจำลองและคิดอย่างลึกซึ้งเกี่ยวกับวิธีทดสอบความสำคัญของสัมประสิทธิ์


ขอบคุณฉันสามารถเข้าใจวิธีการทำงาน วิธีการนี้ใช้งานได้หรือไม่หากฉันมีตัวแปรควบคุมหลายตัว? พูดเช่นภูมิภาค (ชนบท / เมือง) ระดับการศึกษา (มัธยมปลายมีการศึกษาหรือไม่)? ฉันสามารถเพิ่มตัวแปรดัมมี่เพิ่มเติมและทดสอบเอฟเฟกต์ได้หรือไม่
แมงป่อง

1
@ เมื่อไรฉันก็เจอสถานการณ์ที่คล้ายกับการใช้งานซึ่งนักวิเคราะห์แยกตัวอย่างออกเป็นสองกลุ่มโดยใช้ตัวแปรอิสระชุดเดียวกันสำหรับทั้งสองกลุ่มและเปรียบเทียบค่าสัมประสิทธิ์เชิงคุณภาพ มีข้อได้เปรียบใด ๆ จากสถานการณ์ที่ฉันเพิ่งอธิบายเกี่ยวกับสูตรการใช้เอฟเฟกต์ปฏิสัมพันธ์นี้หรือไม่?
Andy W

3
@Andy หากไม่มีความตั้งใจที่จะทำให้เกิดเสียงวิจารณ์หรือลดค่าความได้เปรียบเพียงอย่างเดียวที่ฉันสามารถคิดได้สำหรับวิธีการเชิงคุณภาพคือมันไม่ต้องการความเข้าใจหรือความสามารถของนักวิเคราะห์: มันทำให้ผู้คนจำนวนมากสามารถเข้าถึงได้ วิธีการเชิงคุณภาพเต็มไปด้วยความยากลำบาก ตัวอย่างเช่นอาจมีความแตกต่างอย่างชัดเจนระหว่างทั้งเนินลาดและจุดตัดโดยบังเอิญเพียงอย่างเดียว การประเมินคุณภาพเชิงสัมประสิทธิ์จะไม่สามารถแยกแยะสถานการณ์นี้จากผลกระทบที่แท้จริง
whuber

1
@whuber ความคิดเริ่มแรกของฉันเหมือนกันและฉันเพิ่งให้คำแนะนำแบบเดียวกันกับเพื่อนร่วมงานที่ไม่สนใจคำแนะนำเพื่อความเรียบง่าย (ตามที่คุณพูดถึง) ฉันคิดว่าบางทีความคิดเห็นเกี่ยวกับข้อสันนิษฐานของความแปรปรวนข้อผิดพลาดที่เหมือนกันสำหรับทั้งสองเพศอาจทำให้วิธีการทั้งสองแบบมีความเหมาะสมมากกว่าเนื่องจากข้อสันนิษฐานนั้นถูกละเมิด
Andy W

1
@Andy ใช่ แต่ความเป็นไปได้ที่แตกต่างกันไม่ได้เพิ่มคุณค่าของการเปรียบเทียบที่ไม่ใช่เชิงคุณภาพ แต่จะเรียกการเปรียบเทียบเชิงปริมาณที่เหมาะสมยิ่งขึ้นของการประมาณพารามิเตอร์ ตัวอย่างเช่นในฐานะที่เป็นคร่าวๆ (แต่ให้ข้อมูล) การประมาณหนึ่งสามารถดำเนินการตัวแปรของ CABF หรือ Satterthwaite t-test ตามความแปรปรวนข้อผิดพลาดโดยประมาณและองศาอิสระ แม้แต่การตรวจสอบด้วยสายตาของสแกตเตอร์แปลงที่สร้างมาอย่างดีนั้นจะทำได้ง่ายและให้ข้อมูลมากกว่าการเปรียบเทียบสัมประสิทธิ์การถดถอย
whuber

-1

ฉันเดาว่าการควบคุมตัวแปรการจัดกลุ่มจะทำงานได้ดีพอ ๆ กันเมื่อเปรียบเทียบค่าสัมประสิทธิ์การถดถอยข้ามคลื่นอิสระของข้อมูลหน้าตัด (เช่นปี 1 ปี 2 ปีและปี 3 เป็นกลุ่ม 1 กลุ่ม 2 และกลุ่ม 3)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.