ไตรลักษณ์ของการทดสอบในความเป็นไปได้สูงสุด: จะทำอย่างไรเมื่อเผชิญกับข้อสรุปที่ขัดแย้งกัน?


10

การทดสอบอัตราส่วนตัวบ่งชี้ความน่าจะเป็นและตัวคูณลากรองจ์ในบริบทของการประมาณความน่าจะเป็นสูงสุดนั้นจะเทียบเท่ากันแบบเชิงเส้นกำกับ อย่างไรก็ตามสำหรับตัวอย่างเล็ก ๆ พวกเขามีแนวโน้มที่จะแตกต่างกันเล็กน้อยและในบางกรณีพวกเขาส่งผลให้ข้อสรุปที่แตกต่างกัน

พวกเขาสามารถจัดอันดับตามพวกเขามีแนวโน้มที่จะปฏิเสธโมฆะได้อย่างไร จะทำอย่างไรเมื่อการทดสอบมีคำตอบที่ขัดแย้งกัน คุณสามารถเลือกคำตอบที่ต้องการหรือมี "กฎ" หรือ "คำแนะนำ" เป็นวิธีการดำเนินการต่อไปได้หรือไม่?


บางทีนี่อาจเป็นกรณีที่การประมาณเชิงซีมโทติคของการแจกแจงโมฆะของสถิติการทดสอบหนึ่งหรือมากกว่านั้นไม่ดี? ผลที่ได้อาจแตกต่างกันเนื่องจากขนาดที่แท้จริงของการทดสอบแตกต่างกันอย่างไร ตัวอย่างของคุณมีขนาดเท่าใด
ronaf

คำตอบ:


5

ฉันไม่ทราบว่าวรรณกรรมในพื้นที่ดีพอที่จะตอบสนองโดยตรง อย่างไรก็ตามดูเหมือนว่าสำหรับฉันหากการทดสอบทั้งสามแตกต่างกันนั่นเป็นข้อบ่งชี้ว่าคุณต้องการการวิจัยเพิ่มเติม / การรวบรวมข้อมูลเพื่อตอบคำถามของคุณอย่างชัดเจน

นอกจากนี้คุณยังอาจต้องการที่จะดูที่นี้การค้นหาของ Google Scholar

อัปเดตตามความคิดเห็นของคุณ:

หากไม่สามารถรวบรวมข้อมูลเพิ่มเติมได้แสดงว่ามีวิธีแก้ไขเพียงวิธีเดียว ทำแบบจำลองที่สะท้อนโครงสร้างข้อมูลขนาดตัวอย่างและแบบจำลองที่คุณเสนอ คุณสามารถตั้งค่าพารามิเตอร์เป็นค่าที่ระบุไว้ล่วงหน้า ประเมินโมเดลโดยใช้ข้อมูลที่สร้างขึ้นจากนั้นตรวจสอบหนึ่งในสามของการทดสอบที่ชี้ให้คุณเห็นรูปแบบที่ถูกต้อง การจำลองดังกล่าวจะให้คำแนะนำเกี่ยวกับการทดสอบที่จะใช้สำหรับข้อมูลจริงของคุณ มันสมเหตุสมผลไหม


1
คุณหมายถึงกระดาษเฉพาะ? ฉันคิดว่าฉันสามารถหาคำตอบให้กับคำถามของฉันได้ถ้าฉันค้นคว้าศึกษาอ่านมาก แต่อาจจะ 95% ของคำถามที่คนอื่นถามที่นี่ ... นอกจากนี้ในบางกรณีโดยเฉพาะอย่างยิ่งกับข้อมูลเศรษฐศาสตร์มหภาค (ซึ่งเป็นพื้นที่ของฉัน ) ไม่มีข้อมูลที่จะรวบรวมอีกต่อไป ข้อมูลขาดแคลน (จำนวนการสังเกตที่ฉันหมายถึง) และคุณต้องอยู่กับมัน ไม่มีวิธี "รับข้อมูลเพิ่มเติม" ฉันหวังว่าบางคนที่นี่จะรู้หัวข้อ แต่ดูเหมือนจะไม่เป็นเช่นนั้น บางทีเมื่อเปิดเว็บไซต์ให้กับบุคคลทั่วไปแล้ว
Vivi

ฉันสงสัยว่าคำตอบสำหรับคำถามของคุณจะเป็นโดเมน / รุ่นที่เฉพาะเจาะจงและด้วยเหตุนี้ฉันไม่แน่ใจว่าฉันสามารถแนะนำกระดาษเฉพาะ

1
ขออภัยสำหรับการตอบกลับปลาย. ฉันชอบข้อเสนอแนะของคุณสำหรับการจำลอง แต่นั่นไม่ใช่เรื่องง่ายเลย ความจริงก็คือสิ่งที่ฉันเห็นในทางปฏิบัติคือนักวิจัยเพิ่งทำแบบทดสอบที่คำนวณได้ง่ายขึ้นหรือให้ผลลัพธ์ที่พวกเขาต้องการ
Vivi

8

ฉันจะไม่ให้คำตอบที่ชัดเจนในแง่ของการจัดอันดับทั้งสาม สร้าง CIs 95% รอบ ๆ พารามิเตอร์ของคุณตามแต่ละตัวและหากพวกมันแตกต่างกันอย่างสิ้นเชิงขั้นตอนแรกของคุณก็ควรที่จะขุดลึกลงไป แปลงข้อมูลของคุณ (แม้ว่า LR จะไม่เปลี่ยนแปลง), ปรับความเป็นไปได้ของคุณให้เป็นมาตรฐานเป็นต้นในเวลาสั้น ๆ ฉันอาจเลือกใช้การทดสอบ LR และ CI ที่เกี่ยวข้อง อาร์กิวเมนต์คร่าวๆดังนี้

parametrization (เช่น T กับ logit (T)) สถิติของ Wald ถือว่าปกติของ (T - T0) / SE (T) หากล้มเหลว CI ของคุณจะไม่ดี สิ่งที่ดีเกี่ยวกับ LR คือคุณไม่จำเป็นต้องหาการแปลง f (T) เพื่อให้เป็นไปตามปกติ 95% CI จาก T จะเหมือนกัน นอกจากนี้หากโอกาสของคุณไม่ได้เป็นกำลังสองการ Wald 95% CI ซึ่งสมมาตรอาจเป็นเรื่องตลกเพราะมันอาจจะให้คุณค่ากับโอกาสที่ต่ำกว่าสำหรับผู้ที่มีโอกาสสูงกว่า

อีกวิธีหนึ่งในการคิดเกี่ยวกับ LR คือการใช้ข้อมูลมากขึ้นการพูดอย่างหลวม ๆ จากฟังก์ชันความน่าจะเป็น Wald นั้นมีพื้นฐานมาจาก MLE และความโค้งของโอกาสที่จะเป็นโมฆะ คะแนนขึ้นอยู่กับความชันเป็นโมฆะและความโค้งเป็นโมฆะ LR ประเมินความเป็นไปได้ภายใต้ค่าว่างและโอกาสภายใต้การรวมกันของค่าว่างและทางเลือกและรวมทั้งสองอย่างเข้าด้วยกัน หากคุณถูกบังคับให้เลือกอย่างใดอย่างหนึ่งนี่อาจจะเป็นที่พอใจสำหรับการเลือก LR

โปรดทราบว่ามีเหตุผลอื่น ๆ เช่นความสะดวกสบายหรือการคำนวณเพื่อเลือกใช้ Wald หรือคะแนน Wald เป็นวิธีที่ง่ายที่สุดและได้รับพารามิเตอร์หลายตัวแปรหากคุณกำลังทดสอบการตั้งค่าหลาย ๆ ค่าเป็น 0 มีวิธีที่สะดวกในการประมาณความน่าจะเป็น หรือถ้าคุณต้องการเพิ่มตัวแปรทีละชุดจากบางชุดคุณอาจไม่ต้องการเพิ่มความเป็นไปได้สูงสุดสำหรับแต่ละรุ่นใหม่และการใช้การทดสอบคะแนนนำเสนอความสะดวกสบายบางอย่างที่นี่ Wald และ Score นั้นน่าสนใจเมื่อนางแบบและความน่าจะเป็นของคุณไม่น่าสนใจ (แต่ฉันไม่คิดว่านี่เป็นสิ่งที่คุณสงสัยเนื่องจากคุณมีทั้งสามข้อ ... )

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.