การถดถอยแบบกลั่นกรอง: ทำไมเราคำนวณคำว่า * product * ระหว่างตัวทำนาย?


12

การวิเคราะห์การถดถอยแบบ Moderated มักใช้ในสังคมศาสตร์เพื่อประเมินปฏิสัมพันธ์ระหว่างผู้ทำนาย / เพื่อนร่วมทุนสองคนขึ้นไป

โดยทั่วไปด้วยตัวแปรทำนายสองตัวจะใช้โมเดลต่อไปนี้:

Y=β0+β1X+β2M+β3XM+e

ขอให้สังเกตว่าการทดสอบการกลั่นกรองดำเนินการโดยคำว่าผลิตภัณฑ์XM (การคูณระหว่างตัวแปรอิสระXและตัวแปรผู้ควบคุมM ) คำถามพื้นฐานมากของฉันคือทำไมเราจริงคำนวณระยะสินค้าระหว่างXและM ? ทำไมไม่เช่นนั้นความแตกต่างที่แน่นอน|MX|หรือแค่ผลรวมX+M ?

ที่น่าสนใจ Kenny กล่าวถึงปัญหานี้ที่นี่http://davidakenny.net/cm/moderation.htmโดยพูดว่า: "ตามที่เห็นการทดสอบการกลั่นจะไม่สามารถใช้งานได้โดยคำศัพท์ผลิตภัณฑ์ XM" แต่ไม่มีคำอธิบายเพิ่มเติมใด ๆ . ภาพประกอบหรือหลักฐานที่เป็นทางการน่าจะเป็นความกระจ่างฉันเดา / หวังว่า

คำตอบ:


12

"โมเดอเรเตอร์" ส่งผลกระทบต่อสัมประสิทธิ์การถดถอยของเทียบกับ : พวกมันอาจเปลี่ยนไปตามค่าของการเปลี่ยนแปลงของโมเดอเรเตอร์ ดังนั้นโดยทั่วไปแล้วรูปแบบการถดถอยแบบง่ายของการควบคุมคือYX

E(Y)=α(M)+β(M)X

ที่และมีฟังก์ชั่นของผู้ดูแลมากกว่าคงได้รับผลกระทบจากค่านิยมของMαβMM

ในจิตวิญญาณเดียวกันซึ่งการถดถอยตั้งอยู่บนการประมาณเชิงเส้นตรงของความสัมพันธ์ระหว่างและเราอาจหวังว่าทั้งและอย่างน้อยประมาณ - ฟังก์ชันเชิงเส้นของตลอดช่วงค่าในข้อมูล:XYαβMM

E(Y)=α0+α1M+O(M2)+(β0+β1M+O(M2))X=α0+β0X+α1M+β1MX+O(M2)+O(M2)X.

การลดเงื่อนไข nonlinear ("big-O") ด้วยความหวังว่ามันเล็กเกินไปที่จะสำคัญทำให้รูปแบบการโต้ตอบแบบหลายค่า (bilinear)

(1)E(Y)=α0+β0X+α1M+β1MX.

มานี้แสดงให้เห็นความหมายที่น่าสนใจของค่าสัมประสิทธิ์: เป็นอัตราที่เปลี่ยนแปลงตัดขณะที่เป็นอัตราที่เปลี่ยนความลาดชัน (และมีความลาดชันและตัดเมื่อคือ (อย่างเป็นทางการ) ตั้งค่าเป็นศูนย์.) คือค่าสัมประสิทธิ์ของ "ระยะผลิตภัณฑ์ที่" MXมันตอบคำถามด้วยวิธีนี้:α1Mβ1Mα0β0Mβ1MX

เราจำลองการกลั่นกรองด้วยระยะสินค้าเมื่อเราคาดหวังว่าผู้ดูแลจะ (ประมาณโดยเฉลี่ย) มีความสัมพันธ์เชิงเส้นที่มีความลาดชันของ VS XMXMY X


สิ่งที่น่าสนใจคือจุดกำเนิดนี้ชี้ไปยังส่วนขยายตามธรรมชาติของโมเดลซึ่งอาจแนะนำวิธีตรวจสอบความเหมาะสม หากคุณไม่เกี่ยวข้องกับความไม่เชิงเส้นในคุณรู้หรือคิดว่าโมเดลนั้นถูกต้อง - จากนั้นคุณต้องการขยายโมเดลเพื่อรองรับคำศัพท์ที่ถูกทิ้ง:X(1)

E(Y)=α0+β0X+α1M+β1MX+α2M2+β2M2X.

การทดสอบสมมติฐานประเมินความดีของความพอดี การประมาณและสามารถระบุได้ว่าควรจะขยายโมเดลแบบใดในรูปแบบใด: เพื่อรวมความไม่เชิงเส้นใน (เมื่อ ) หรือความสัมพันธ์การควบคุมที่ซับซ้อนมากขึ้น (เมื่อ ) ทั้งสอง (โปรดทราบว่าการทดสอบนี้จะไม่ได้รับการแนะนำโดยการขยายอนุกรมกำลังของฟังก์ชันทั่วไป )α2=β2=0α2β2(1)Mα20β20f(X,M)


ท้ายที่สุดถ้าคุณต้องค้นพบว่าสัมประสิทธิ์การปฏิสัมพันธ์นั้นไม่แตกต่างจากศูนย์อย่างมีนัยสำคัญแต่ความพอดีไม่เชิงเส้น (ตามหลักฐานโดยค่าที่สำคัญของ ) คุณจะสรุป (a) มีการควบคุม แต่ (() ข) มันไม่ได้เป็นแบบจำลองโดยระยะ แต่แทนที่จะตามข้อกำหนดขั้นสูงบางอย่างเริ่มต้นด้วยMนี่อาจเป็นปรากฏการณ์ที่เคนนี่พูดถึงβ1β2MXM2X


8

หากคุณใช้ผลรวมของตัวทำนายผลเพื่อจำลองปฏิสัมพันธ์ของพวกเขาสมการของคุณจะเป็น:

Y=β0+β1X+β2M+β3(X+M)+e=β0+β1X+β2M+β3X+β3M+e=β0+(β1+β3)X+(β2+β3)M+e=β0+β1X+β2M+e

ที่และ\ดังนั้นโมเดลของคุณจะไม่มีการโต้ตอบเลย เห็นได้ชัดว่านี่ไม่ใช่กรณีของผลิตภัณฑ์β1=β1+β3β2=β2+β3

เรียกคืนนิยามของค่าสัมบูรณ์:

|XM|={XM,XMMX,X<M

แม้ว่าคุณสามารถลดรูปแบบต่อหนึ่งเงื่อนไขและเท่านั้นโดยใช้ def จากค่าสัมบูรณ์เป็น "รูปแบบเฉพาะของการควบคุมที่ไม่น่าจะเป็นจริงในหลาย ๆ สถานการณ์" ดังที่ระบุไว้ในความคิดเห็นด้านล่างβ0+β1X+β2M+β3|XM|+eXM|XM|


1
จริงๆแล้วรวมถึงระยะ demonstrably รูปแบบของการดูแล A: ค่าของเปลี่ยนแปลง\อย่างไรก็ตามมันเป็นรูปแบบเฉพาะของการกลั่นกรองที่ไม่น่าจะเป็นจริงในหลาย ๆ สถานการณ์ ไม่ถูกต้องที่จะบอกว่าโมเดลดังกล่าวมี "เอฟเฟกต์หลักเท่านั้น" |XM|Mβ2
whuber

1
ใช่คุณพูดถูกเป็นรูปแบบหนึ่งของการกลั่นกรองฉันดำเนินการโดยการเปลี่ยนแปลงและจะแก้ไขคำตอบตามนั้น ขอบคุณที่ชี้นำสิ่งนี้ |XM|
Milos

@Milos: ตัวอย่างของคุณเกี่ยวกับผลรวมของผู้ทำนายคือผู้เปิดตาคนที่น่าอายฉันต้องพูดเพราะฉันควรจะได้ตระหนักถึงผลกระทบทางคณิตศาสตร์แล้ว) whuber: เท่าที่ฉันเข้าใจแล้วค่าสัมบูรณ์มีประโยชน์เท่านั้น เมื่อตัวแปรตัวทำนายทั้งสองถูกวัดในหน่วยเดียวกัน (เช่นการทดสอบไซโครเมทริกสองครั้งโดยใช้เมตริกเดียวกันเช่นคะแนน z หรือคะแนน T) ความแตกต่างที่แน่นอนระหว่าง X และ M เป็นตัวชี้วัดที่มีประโยชน์แม้ว่าจะไม่สามารถทำได้เพียงตัวเดียวเท่านั้น (เช่นสามารถใช้คำว่า prodcut ได้)
ตัวหาร

6

คุณจะไม่พบข้อพิสูจน์ที่เป็นทางการสำหรับการใช้ตัวควบคุมแบบ multiplicative คุณสามารถสนับสนุนวิธีนี้ได้ด้วยวิธีการอื่น ตัวอย่างเช่นดูการขยายตัวของ Taylor-MacLaurin ของฟังก์ชัน :f(X,M)

f(X,M)=f(0,0)+f(0,0)TT+f(0,0)MM+2f(0,0)TMTM+2f(0,0)2T2T2+2f(0,0)2M2M2

หากคุณเสียบฟังก์ชั่นของฟอร์มนี้ในสมการเทย์เลอร์คุณจะได้สิ่งนี้:f(X,M)=β0+βXX+βMM+βXMXM

f(X,M)=β0+βXX+βMM+βXMXM

ดังนั้นเหตุผลนี่คือรูปแบบ multiplicative นี้โดยเฉพาะของการดูแลนั้นเป็นลำดับที่สองเทย์เลอร์ประมาณของความสัมพันธ์การดูแลทั่วไปf(X,M)

อัปเดต: หากคุณรวมคำที่มีกำลังสองตามที่ @whuber แนะนำดังนั้นสิ่งนี้จะเกิดขึ้น: เสียบสิ่งนี้เข้ากับเทย์เลอร์:

g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2
g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2

นี้แสดงให้เห็นว่ารูปแบบใหม่ของเรากับเงื่อนไขการกำลังสองสอดคล้องกับการเต็มรูปแบบลำดับที่สองเทย์เลอร์ประมาณเหมือนเดิมรูปแบบการดูแลM)g(X,M)f(X,M)


ตั้งแต่พื้นฐานของการโต้แย้งของคุณคือการขยายตัวเทย์เลอร์, ทำไมคุณถึงไม่ ได้แก่ อีกสองแง่กำลังสองและ ? ทรูพวกเขาไม่ได้เป็นรูปแบบของการดูแลแต่รวมของพวกเขาในรูปแบบมักจะมีผลต่อ{} X2M2βXM
whuber

@ โฮเบอร์ฉันตัดสินใจโพสต์สั้น ๆ นั่นคือเหตุผลหลัก มิฉะนั้นฉันเริ่มเขียนเกี่ยวกับการตั้งค่าของฉันที่จะรวมคำสั่งซื้อที่สองเมื่อใดก็ตามที่คุณมีคำไขว้แล้วตัดออก
Aksakal
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.