ฉันกำลังพยายามใช้การทดสอบที่แน่นอนของฟิชเชอร์ในปัญหาพันธุศาสตร์จำลอง แต่ค่า p ดูเหมือนจะเอียงไปทางขวา ในฐานะนักชีววิทยาฉันคิดว่าฉันขาดอะไรบางอย่างที่ชัดเจนกับนักสถิติทุกคนดังนั้นฉันจะขอขอบคุณสำหรับความช่วยเหลือของคุณ
การตั้งค่าของฉันคือ: (การตั้งค่า 1, ระยะขอบคงที่)
สองตัวอย่างของ 0s และ 1s ถูกสร้างแบบสุ่มใน R แต่ละตัวอย่าง n = 500 ความน่าจะเป็นของการสุ่มตัวอย่าง 0 และ 1 จะเท่ากัน จากนั้นฉันจะเปรียบเทียบสัดส่วน 0/1 ในแต่ละตัวอย่างด้วยการทดสอบที่แน่นอนของฟิชเชอร์ (เพียงแค่fisher.test
ลองซอฟต์แวร์อื่นที่มีผลลัพธ์คล้ายกัน) การสุ่มตัวอย่างและการทดสอบซ้ำแล้วซ้ำอีก 30,000 ครั้ง ผลลัพธ์ค่า p จะถูกกระจายดังนี้:
ค่าเฉลี่ยของค่า p ทั้งหมดอยู่ที่ประมาณ 0.55, 5 เปอร์เซนต์ที่ 0.0577 แม้การกระจายจะปรากฏขึ้นทางด้านขวา
ฉันได้อ่านทุกอย่างที่ทำได้ แต่ฉันไม่พบสิ่งบ่งชี้ว่าพฤติกรรมนี้เป็นเรื่องปกติ - ในทางกลับกันมันเป็นเพียงข้อมูลจำลองดังนั้นฉันจึงไม่เห็นแหล่งที่มาสำหรับอคติใด ๆ มีการปรับเปลี่ยนที่ฉันพลาดหรือไม่? ขนาดตัวอย่างเล็กเกินไปหรือไม่ หรือบางทีมันไม่ควรจะกระจายอย่างสม่ำเสมอและค่า p ถูกตีความแตกต่างกันอย่างไร
หรือฉันควรทำซ้ำล้านครั้งนี้หาควอนไทล์ 0.05 และใช้มันเป็นทางลัดที่สำคัญเมื่อฉันใช้สิ่งนี้กับข้อมูลจริง
ขอบคุณ!
ปรับปรุง:
Michael M แนะนำให้แก้ไขค่าส่วนต่างของ 0 และ 1 ตอนนี้ค่า p ให้การกระจายที่ดีกว่ามาก แต่น่าเสียดายที่มันไม่เหมือนกันหรือรูปทรงอื่นที่ฉันจำได้:
การเพิ่มรหัส R จริง: (การตั้งค่า 2, ระยะขอบคงที่)
samples=c(rep(1,500),rep(2,500))
alleles=c(rep(0,500),rep(1,500))
p=NULL
for(i in 1:30000){
alleles=sample(alleles)
p[i]=fisher.test(samples,alleles)$p.value
}
hist(p,breaks=50,col="grey",xlab="p-values",main="")
การแก้ไขครั้งสุดท้าย:
เมื่อเสียงชี้ไปที่ความคิดเห็นพื้นที่ก็ดูบิดเบี้ยวเนื่องจากการใช้คำพูด ฉันกำลังแนบ QQ-plots สำหรับการตั้งค่า 1 (ฟรีมาร์จิ้น) และการตั้งค่า 2 (ระยะขอบคงที่) แผนการที่คล้ายกันนี้มีให้เห็นในการจำลองของ Glen ด้านล่างและผลลัพธ์เหล่านี้ในความเป็นจริงดูเหมือนจะค่อนข้างสม่ำเสมอ ขอบคุณสำหรับความช่วยเหลือ!