นี่เป็นคำถามเก่าที่มีคำตอบที่ดีมาก แต่ฉันคิดว่ามันสามารถได้รับประโยชน์จากคำตอบใหม่เพื่อตอบรับมุมมองที่เป็นจริงมากขึ้น
เมื่อใดที่เราไม่ควรอนุญาตให้ใช้เอฟเฟกต์คงที่ในการปรับระดับเอฟเฟกต์แบบสุ่ม
ฉันจะไม่แก้ไขปัญหาที่อธิบายไว้แล้วในคำตอบอื่น ๆ แต่ฉันจะอ้างถึงตอนนี้ที่มีชื่อเสียงถึงแม้ว่าฉันอยากจะพูดว่า "เสียชื่อ" บทความโดย Barr et al (2013) มักจะเรียกว่า "Keep it maximal"
Barr, DJ, Levy, R. , Scheepers, C. และ Tily, HJ, 2013. โครงสร้างผลแบบสุ่มสำหรับการทดสอบสมมติฐานยืนยัน: เก็บไว้ให้มากที่สุด วารสารหน่วยความจำและภาษา, 68 (3), pp.255-278
ในบทความนี้ผู้เขียนยืนยันว่าผลกระทบคงที่ทั้งหมดควรได้รับอนุญาตให้แตกต่างกันไปตามระดับของปัจจัยการจัดกลุ่ม (การสกัดแบบสุ่ม) ข้อโต้แย้งของพวกเขานั้นค่อนข้างน่าสนใจ - โดยพื้นฐานแล้วโดยที่ไม่ยอมให้พวกเขาเปลี่ยนแปลงมันเป็นข้อ จำกัด ของรูปแบบ นี่คือคำอธิบายที่ดีในคำตอบอื่น ๆ อย่างไรก็ตามอาจมีปัญหาร้ายแรงเกี่ยวกับวิธีการนี้ซึ่งอธิบายโดย Bates el al (2015):
เบตส์, D. , Kliegl, R. , Vasishth, S. และ Baayen, H. , 2015. แบบจำลองผสม พิมพ์ล่วงหน้าarXiv arXiv: 1506.04967
เป็นที่น่าสังเกตว่า Bates เป็นผู้เขียนหลักของlme4
แพ็คเกจสำหรับรุ่นผสมที่เหมาะสมใน R ซึ่งอาจเป็นแพคเกจที่ใช้กันอย่างแพร่หลายสำหรับรุ่นดังกล่าว เบตส์เอตอัลโปรดทราบว่าในแอปพลิเคชันในโลกแห่งความเป็นจริงจำนวนมากข้อมูลจะไม่สนับสนุนโครงสร้างเอฟเฟกต์แบบสุ่มสูงสุดบ่อยครั้งเนื่องจากมีการสังเกตจำนวนไม่เพียงพอในแต่ละคลัสเตอร์สำหรับตัวแปรที่เกี่ยวข้อง สิ่งนี้สามารถประจักษ์เองในรูปแบบที่ล้มเหลวในการบรรจบกันหรือเป็นเอกพจน์ในลักษณะพิเศษแบบสุ่ม คำถามจำนวนมากในเว็บไซต์นี้เกี่ยวกับโมเดลดังกล่าวยืนยันได้ พวกเขายังทราบด้วยว่า Barr et al ใช้การจำลองที่ค่อนข้างง่ายโดยมีเอฟเฟกต์แบบสุ่ม "well-behaved" เป็นพื้นฐานสำหรับกระดาษของพวกเขา Bates et al แนะนำวิธีต่อไปนี้แทน:
เราเสนอ (1) เพื่อใช้ PCA เพื่อกำหนดมิติความแปรปรวนร่วม - ความแปรปรวนร่วมของโครงสร้างสุ่ม - ผล (2) เพื่อ จำกัด พารามิเตอร์ความสัมพันธ์เริ่มแรกให้เป็นศูนย์โดยเฉพาะอย่างยิ่งเมื่อความพยายามเริ่มต้นเพื่อให้พอดีกับแบบจำลองสูงสุด และ (3) เพื่อวางองค์ประกอบความแปรปรวนที่ไม่มีนัยสำคัญและพารามิเตอร์สหสัมพันธ์ที่เกี่ยวข้องจากโมเดล
ในกระดาษเดียวกันพวกเขายังทราบ:
ที่สำคัญความล้มเหลวในการบรรจบกันนั้นไม่ได้เกิดจากความบกพร่องของอัลกอริทึมการประมาณค่า แต่เป็นผลที่ตามมาจากการพยายามให้พอดีกับแบบจำลองที่ซับซ้อนเกินกว่าจะรองรับข้อมูลได้อย่างเหมาะสม
และ:
ไม่จำเป็นต้องใช้แบบจำลองสูงสุดเพื่อป้องกันข้อสรุปเชิงอนุรักษ์นิยม การป้องกันนี้จัดทำขึ้นอย่างสมบูรณ์โดยรุ่นที่ครอบคลุมซึ่งได้รับคำแนะนำจากความคาดหวังที่สมจริงเกี่ยวกับความซับซ้อนที่ข้อมูลสามารถรองรับได้ ในสถิติเช่นเดียวกับที่อื่น ๆ ในด้านวิทยาศาสตร์ความประหยัดเป็นคุณธรรมไม่ใช่เป็นรอง
Bates et al (2015)
จากมุมมองที่มีการนำมาใช้มากขึ้นการพิจารณาเพิ่มเติมที่ควรทำคือกระบวนการสร้างข้อมูลหรือไม่ทฤษฎีทางชีววิทยา / กายภาพ / เคมีที่รองรับข้อมูลควรเป็นแนวทาง