ข้อผิดพลาดของแบบผสมเชิงเส้น


18

ข้อผิดพลาดหลักของการใช้โมเดลเอฟเฟกต์แบบผสมคืออะไร อะไรคือสิ่งสำคัญที่สุดในการทดสอบ / ระวังในการประเมินความเหมาะสมของแบบจำลองของคุณ เมื่อเปรียบเทียบแบบจำลองของชุดข้อมูลเดียวกันสิ่งที่สำคัญที่สุดที่ควรมองหาคืออะไร

คำตอบ:


16

นี่เป็นคำถามที่ดี

นี่คือข้อผิดพลาดทั่วไป:

  1. การใช้ทฤษฎีความน่าจะเป็นมาตรฐานเราอาจได้รับการทดสอบเพื่อเปรียบเทียบสมมติฐานที่ซ้อนกันสองข้อคือและH 1โดยการคำนวณสถิติการทดสอบอัตราส่วนความน่าจะเป็น การแจกแจงโมฆะของสถิติการทดสอบนี้ประมาณไค - สแควร์กับองศาอิสระเท่ากับความแตกต่างในมิติของพื้นที่พารามิเตอร์ทั้งสอง น่าเสียดายที่การทดสอบนี้เป็นเพียงค่าประมาณและต้องการสมมติฐานหลายประการ ข้อสันนิษฐานที่สำคัญอย่างหนึ่งคือพารามิเตอร์ภายใต้ค่า null ไม่ได้อยู่ในขอบเขตของพื้นที่พารามิเตอร์ เนื่องจากเรามักจะสนใจในการทดสอบสมมติฐานเกี่ยวกับเอฟเฟกต์แบบสุ่มที่อยู่ในรูปแบบ: H 0 : σ 2 = 0นี่เป็นข้อกังวลที่แท้จริงH0H1

    H0:σ2=0
    วิธีการแก้ไขปัญหานี้คือใช้ REML แต่ถึงกระนั้นค่า p จะมีแนวโน้มที่จะใหญ่กว่าที่ควรจะเป็น ซึ่งหมายความว่าหากคุณสังเกตเห็นผลกระทบที่สำคัญโดยใช้การประมาณχ2คุณสามารถมั่นใจได้ว่ามันสำคัญจริง ๆ ค่า p ขนาดเล็ก แต่ไม่สำคัญอาจกระตุ้นให้ใช้วิธีบู๊ตสแตรปที่แม่นยำกว่า แต่ใช้เวลามาก
  2. การเปรียบเทียบเอฟเฟกต์คงที่: หากคุณวางแผนที่จะใช้การทดสอบอัตราส่วนความน่าจะเป็นเพื่อเปรียบเทียบแบบจำลองซ้อนสองแบบที่แตกต่างกันในเอฟเฟกต์คงที่คุณจะไม่สามารถใช้วิธีการประมาณค่า REML เหตุผลก็คือ REML ประมาณการผลกระทบแบบสุ่มโดยพิจารณาจากการรวมกันเชิงเส้นของข้อมูลที่ลบผลกระทบคงที่ หากเอฟเฟกต์คงที่เหล่านี้มีการเปลี่ยนแปลงโอกาสของทั้งสองรุ่นจะไม่สามารถเปรียบเทียบกันได้โดยตรง

  3. ค่า P: ค่า p ที่สร้างโดยการทดสอบอัตราส่วนความน่าจะเป็นสำหรับผลกระทบคงที่เป็นค่าประมาณและน่าเสียดายที่มีขนาดเล็กเกินไปซึ่งบางครั้งก็เป็นการพูดเกินความสำคัญของผลกระทบบางอย่าง เราอาจใช้วิธีบูตสแตรปแบบไม่มีพารามิเตอร์เพื่อหาค่า p ที่แม่นยำยิ่งขึ้นสำหรับการทดสอบอัตราส่วนความน่าจะเป็น

  4. มีข้อกังวลอื่น ๆ เกี่ยวกับค่า p สำหรับการทดสอบเอฟเฟกต์คงที่ซึ่งเน้นโดยดร. ดั๊กเบตส์ [ ที่นี่ ]

ฉันแน่ใจว่าสมาชิกคนอื่นของฟอรั่มจะมีคำตอบที่ดีกว่า

ที่มา: การขยายโมเดลเชิงเส้นด้วย R - Dr. Julain Faraway


9

หลุมพรางทั่วไปที่ฉันเห็นคือไม่สนใจความแปรปรวนของเอฟเฟกต์แบบสุ่ม ถ้ามันมีขนาดใหญ่เมื่อเทียบกับความแปรปรวนที่เหลือหรือความแปรปรวนของตัวแปรตามความพอดีมักจะดูดี แต่เพียงเพราะผลกระทบแบบสุ่มบัญชีสำหรับความแปรปรวนทั้งหมด แต่เนื่องจากกราฟของการคาดการณ์ที่เกิดขึ้นจริงกับการคาดการณ์นั้นดูดีคุณจึงมีแนวโน้มที่จะคิดว่าแบบจำลองของคุณนั้นดี

ทุกอย่างพังทลายลงเมื่อใช้โมเดลดังกล่าวในการทำนายข้อมูลใหม่ โดยทั่วไปแล้วคุณสามารถใช้เอฟเฟ็กต์คงที่และขนาดพอดีอาจแย่มาก


6

การสร้างแบบจำลองโครงสร้างความแปรปรวนเป็นคุณสมบัติเดียวที่มีประสิทธิภาพและสำคัญที่สุดของโมเดลผสม สิ่งนี้ขยายเกินโครงสร้างความแปรปรวนเพื่อรวมความสัมพันธ์ระหว่างการสังเกต ต้องใช้ความระมัดระวังในการสร้างโครงสร้างความแปรปรวนร่วมที่เหมาะสมมิฉะนั้นการทดสอบสมมติฐานช่วงเวลาความเชื่อมั่นและการประเมินวิธีการรักษาอาจไม่ถูกต้อง บ่อยครั้งที่คนเราต้องการความรู้ในการทดลองเพื่อระบุเอฟเฟกต์แบบสุ่มที่ถูกต้อง

SAS สำหรับรุ่นผสมคือการไปใช้ทรัพยากรของฉันแม้ว่าฉันต้องการทำการวิเคราะห์ใน R

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.