การทดสอบ Wald ในการถดถอย (OLS และ GLMs): t- กับการกระจาย z


22

ฉันเข้าใจว่าการทดสอบ Wald สำหรับสัมประสิทธิ์การถดถอยขึ้นอยู่กับคุณสมบัติต่อไปนี้ที่เก็บ asymptotically (เช่น Wasserman (2006): สถิติทั้งหมดหน้า 153, 214-215): โดยที่แสดงถึงสัมประสิทธิ์การถดถอยโดยประมาณแสดงถึงข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอยและเป็นค่าที่น่าสนใจ (มักจะเป็น 0 เพื่อทดสอบว่าค่าสัมประสิทธิ์เป็นหรือไม่ แตกต่างจาก 0) ดังนั้นขนาดการทดสอบ Wald คือ: ปฏิเสธเมื่อใดβ^SE(β)β0β0αH0| W| >zα/2

(β^β0)se^(β^)N(0,1)
β^se^(β^)β0β0αH0|W|>zα/2โดยที่
W=β^se^(β^).

แต่เมื่อคุณทำการถดถอยเชิงเส้นด้วยlmใน R, -value แทน -value จะใช้ในการทดสอบว่าสัมประสิทธิ์การถดถอยแตกต่างกันอย่างมีนัยสำคัญจาก 0 (กับ) ยิ่งไปกว่านั้นเอาต์พุตของin in บางครั้งให้ - และบางครั้งค่าเป็นสถิติทดสอบ เห็นได้ชัดว่ามีการใช้เมื่อพารามิเตอร์การกระจายถูกสันนิษฐานว่าเป็นที่รู้จักและใช้ค่าเมื่อพารามิเตอร์การกระจายถูกกำจัด (ดูลิงค์นี้ )z z t z ttzsummary.lmglmztzt

มีคนอธิบายได้ไหมว่าทำไมบางครั้ง distribution ใช้สำหรับการทดสอบ Wald แม้ว่าอัตราส่วนของค่าสัมประสิทธิ์t

แก้ไขหลังจากตอบคำถามแล้ว

โพสต์นี้ยังให้ข้อมูลที่เป็นประโยชน์กับคำถาม


2
อะไรทำให้คุณคิดว่าสถิติการทดสอบที่รายงานนั้นจำเป็นต้องเป็นการทดสอบแบบ Wald
Glen_b

3
เพราะ - หรือ -values อยู่เสมอค่าสัมประสิทธิ์การหารด้วยข้อผิดพลาดมาตรฐานในและ tztlmglm
COOLSerdash

คำตอบ:


20

เอาต์พุตจากการglmใช้การแจกแจงแบบปัวซงให้ค่า value เนื่องจากมีการแจกแจงแบบปัวซงค่าเฉลี่ยและพารามิเตอร์ความแปรปรวนจะเท่ากัน ในโมเดลปัวซองคุณต้องประมาณพารามิเตอร์เดียว ( ) ในที่ที่คุณต้องประเมินทั้งค่าเฉลี่ยและพารามิเตอร์การกระจายคุณควรเห็น -distribution ที่ใช้λ tzλglmt

สำหรับการถดถอยเชิงเส้นแบบมาตรฐานคุณจะถือว่าคำว่าข้อผิดพลาดกระจายตามปกติ ที่นี่พารามิเตอร์ความแปรปรวนจะต้องมีการประเมิน - ดังนั้นการใช้ -distribution สำหรับสถิติการทดสอบ หากคุณรู้ความแปรปรวนประชากรของคำผิดพลาดคุณสามารถใช้สถิติทดสอบแทนztz

ตามที่คุณพูดถึงในโพสต์ของคุณการกระจายการทดสอบเป็นปกติแบบไม่แสดงอาการ ดิสทริบิวชันเป็นแบบปกติเชิงเส้นกำกับดังนั้นในกลุ่มตัวอย่างขนาดใหญ่ความแตกต่างจะเล็กน้อยt


3

ในกรอบ GLM ในทั่วไปWสถิติทดสอบที่คุณกล่าวถึงเป็น asymptotically ปกติกระจายที่ว่าทำไมคุณเห็นใน R Zค่า

นอกจากนั้นเมื่อจัดการกับรูปแบบเชิงเส้นเช่น GLM กับตัวแปรตอบสนองกระจายปกติ, การกระจายของสถิติทดสอบคือเสื้อของนักเรียนดังนั้นในRคุณมีเสื้อค่า

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.