จะทำอย่างไรเมื่อบางเวลามีการตอบสนองที่เบ้อย่างหนักและบางคนไม่ได้ทำการศึกษาซ้ำหลายครั้ง?


12

โดยทั่วไปเมื่อมีการวัดผลอย่างต่อเนื่อง แต่เบ้ในการออกแบบระยะยาว (พูดด้วยผลระหว่างวิชาหนึ่ง) วิธีการทั่วไปคือการเปลี่ยนผลลัพธ์ให้เป็นปกติ หากสถานการณ์นั้นรุนแรงเช่นด้วยการสังเกตที่ถูกตัดทอนอย่างใดอย่างหนึ่งอาจจะมีจินตนาการและใช้โมเดลการเติบโตของ Tobit หรือบางอย่าง

แต่ฉันกำลังสูญเสียเมื่อฉันเห็นผลลัพธ์ที่กระจายตามปกติในบางช่วงเวลาและจากนั้นก็เบ้อย่างหนักที่คนอื่น ๆ ; การแปลงอาจเสียบการรั่วไหลหนึ่ง แต่ฤดูใบไม้ผลิอื่น คุณจะแนะนำอะไรในกรณีเช่นนี้? มีโมเดลมิกซ์เอฟเฟ็กต์รุ่นที่ไม่ใช่พารามิเตอร์ที่ฉันไม่ทราบหรือไม่

หมายเหตุ: ตัวอย่างที่ใช้จะเป็นคะแนนการทดสอบความรู้ก่อน / โพสต์ชุดของการแทรกแซงการศึกษา คะแนนเริ่มต้นตามปกติ แต่จากนั้นจัดกลุ่มที่ระดับสูงสุดของระดับต่อไป


6
ตัวอย่างน่าสนใจเพราะมันเกิดขึ้นตลอดเวลา มีการแปลงที่รู้จักกันดีในการจัดการกับมันเช่นการแปลงพลังงานแบบ "พับ" ของ Tukey สิ่งเหล่านี้ทำให้การเปลี่ยนแปลงเล็กน้อยในระดับกลาง แต่รักษาความเบ้ที่ปลายทั้งสอง ฉันได้พบว่ารากที่พับและบันทึกทำงานได้ดีมากสำหรับการเปรียบเทียบการทดสอบก่อน / หลังมาตรฐาน
whuber

ขอขอบคุณคุณWhuber ฉันจะดูวิธีการแปลงพับ
Brenden Dufault

1
สำหรับความหมายและตัวอย่าง Brenden ดูstats.stackexchange.com/a/10979 สำหรับคำแนะนำในการใช้งานของพวกเขาให้ดูที่บทไม่กี่ครั้งสุดท้ายในหนังสือของ Tukey EDA
whuber

2
หมายเหตุเพิ่มเติม - โปรดจำไว้ว่ามีการตั้งสมมติฐานเกี่ยวกับส่วนที่เหลือของโมเดลไม่ใช่ตัวแปรจริงที่เกี่ยวข้อง
Peter Flom - Reinstate Monica

คำตอบ:


1

สมมติว่าปัญหาเกิดขึ้นในส่วนที่เหลือของคุณ (เนื่องจากการกระจายตัวของตัวแปรผลลัพธ์มักจะไม่เป็นปัญหา) ฉันจะพยายามตรวจสอบสาเหตุของปัญหาแทนที่จะพยายาม "แก้ไข" ผ่านการแปลงหรือการประยุกต์ใช้ แบบจำลองที่ไม่ใช่พารามิเตอร์

หากเป็นกรณีที่ดูเหมือนว่าจะมีแนวโน้ม (เช่นได้รับความก้าวหน้ามากขึ้นหรือน้อยลงตามปกติ) หรือการแบ่งที่ชัดเจนระหว่างเมื่อมันเปลี่ยนจากปกติเป็นไม่ปกติแล้วมันแสดงให้เห็นว่า "การเปลี่ยนแปลงระบอบการปกครอง" ในบางประเภท ข้อมูลของคุณ (เช่นกลไกการสร้างข้อมูลกำลังเปลี่ยนแปลงตลอดเวลา) หรือปัญหาตัวแปรที่ขาดหายไปบางประเภท

หากเป็นกรณีที่ไม่มีรูปแบบที่ชัดเจน (เช่นช่วงเวลา 1 และ 3 ดูปกติและช่วงเวลา 2 และ 4 ไม่ได้) ฉันจะดูอย่างรอบคอบสำหรับปัญหาความสมบูรณ์ของข้อมูล

วิธีง่าย ๆ ในการตรวจสอบเพื่อดูว่าคุณมีการเปลี่ยนแปลงระบอบการปกครองหรือไม่คือการประมาณตัวแบบโดยใช้ช่วงเวลา "ปกติ" เท่านั้นจากนั้นประเมินอีกครั้งโดยใช้ช่วงเวลาอื่นและดูว่ามีความแตกต่างเกิดขึ้นหรือไม่ วิธีการที่ซับซ้อนกว่านี้คือการใช้โมเดลคลาสแฝงซึ่งอาจใช้เวลาเป็นตัวแปรร่วมกัน

สำหรับคำถามของคุณเกี่ยวกับตัวแบบผสมที่ไม่ใช่พารามิเตอร์นั้นขึ้นอยู่กับสิ่งที่คุณหมายถึงโดยพารามิเตอร์ หากคุณหมายถึงโมเดลที่ไม่ถือว่าตัวแปรตามตัวเลขนั้นมีโมเดลดังกล่าวจำนวนมาก (เช่น LIMDEP มีจำนวนน้อยมาก) นอกจากนี้โปรดทราบว่าการละเมิดข้อสันนิษฐานทั่วไปอาจเป็นปัญหาจากมุมมองการอนุมานหากขนาดตัวอย่างของคุณมีขนาดเล็ก วิธีหนึ่งในการตรวจสอบเรื่องนี้ก็คือลองเปลี่ยนรูปแบบต่าง ๆ ที่กล่าวถึงในความคิดเห็นและคำตอบอื่น ๆ แล้วดูว่ามันส่งผลกระทบต่อข้อสรุปของคุณหรือไม่


+1 ขอบคุณทิม ฉันขอขอบคุณข้อเสนอแนะของคุณเกี่ยวกับแบบจำลองชั้นเรียนแฝงและ LIMDEP วิธีการเหล่านี้กำลังดึงดูดฉันมากขึ้นเมื่อฉันเริ่มเรียนรู้เพิ่มเติมเกี่ยวกับพวกเขา
Brenden Dufault

0

มีการแปลง Box-Cox ซึ่งเพิ่มตัวแปรเป็นแลมบ์ดาพาวเวอร์ซึ่งแลมบ์ดารวมอยู่ในการประมาณค่าพารามิเตอร์โมเดล ฉันไม่คุ้นเคยกับการเปลี่ยนแปลงพลังงานแบบพับของ Tukey ดังนั้นฉันไม่รู้ว่าเรากำลังพูดถึงสิ่งเดียวกันหรือไม่ ในการคาดการณ์แลมบ์ดาคุณจำเป็นต้องมีหลายจุด คุณต้องการจัดให้มีการแจกแจงที่แตกต่างกันในแต่ละช่วงเวลาที่มีการกำหนดการแจกแจงในชุดของวิชาที่จะทำการทดสอบในแต่ละช่วงเวลาหรือไม่? แม้ว่าจะเป็นเช่นนั้นหากคุณรู้ว่าบางครั้งคะแนนควรมีการแจกแจงแบบเดียวกันคุณอาจต้องการรวมพวกมันเข้าด้วยกันในครั้งเดียว

อีกวิธีหนึ่งซึ่งไม่ใช่พารามิเตอร์และไม่เกี่ยวข้องกับการแปลงค่าปกติจะใช้ bootstrap ในแต่ละจุดเวลาหรือแต่ละจุดรวมกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.