ฉันต้องการเข้าใจการใช้การจำลอง Monte Carlo ในchisq.test()
ฟังก์ชันใน R
ฉันมีตัวแปรเชิงคุณภาพซึ่งมี 128 ระดับ / คลาส ขนาดตัวอย่างของฉันคือ 26 (ฉันไม่สามารถสุ่มตัวอย่าง "บุคคล" เพิ่มเติมได้) เห็นได้ชัดว่าฉันจะมีบางระดับที่มี 0 "บุคคล" แต่ความจริงก็คือฉันมีชั้นเรียนจำนวนน้อยมากจากจำนวน 127 ที่เป็นไปได้ ตามที่ฉันได้ยินมาว่าการใช้การทดสอบแบบไคสแควร์เราควรมีอย่างน้อย 5 คนในแต่ละระดับ (ฉันไม่เข้าใจเหตุผลอย่างสมบูรณ์) ฉันคิดว่าฉันต้องใช้simulate.p.value
ตัวเลือกในการใช้การจำลอง Monte Carlo เพื่อประเมินการกระจายตัว และคำนวณค่า p หากไม่มีการจำลองมอนติคาร์โล R จะให้ค่า p กับ< 1e-16
ฉัน ด้วยการจำลอง Monte Carlo มันทำให้ฉัน p-value 4e-5
ที่
ฉันพยายามคำนวณ p-value ด้วยเวกเตอร์ 26 อันและ 101 ศูนย์และด้วยการจำลอง Monte-Carlo ฉันได้ p-value ที่ 1
ตกลงหรือไม่ถึงแม้ว่าขนาดตัวอย่างของฉันจะเล็กเมื่อเทียบกับจำนวนคลาสที่เป็นไปได้การแจกแจงที่สังเกตได้นั้นไม่น่าเป็นไปได้ที่คลาสที่เป็นไปได้ทั้งหมดจะมีความน่าจะเป็นแบบเดียวกัน (1/127) ในประชากรจริง ?