การกระจายแบบไม่สม่ำเสมอของค่า p เมื่อจำลองการทดสอบทวินามภายใต้สมมติฐานว่าง


17

ฉันได้ยินมาว่าภายใต้สมมติฐานว่างการกระจาย p-value ควรเหมือนกัน อย่างไรก็ตามการจำลองการทดสอบแบบทวินามใน MATLAB กลับมีการแจกแจงที่แตกต่างกันมากจากชุดที่มีค่าเฉลี่ยมากกว่า 0.5 (0.518 ในกรณีนี้): ป้อนคำอธิบายรูปภาพที่นี่

coin = [0 1];
success_vec = nan(20000,1);

for i = 1:20000
    success = 0;
    for j = 1:200
        success = success + coin(randperm(2,1));
    end
    success_vec(i) = success;
end

    p_vec = binocdf(success_vec,200,0.5);
    hist(p_vec);

พยายามเปลี่ยนวิธีการที่ฉันสร้างตัวเลขสุ่มไม่ได้ช่วย ฉันขอขอบคุณคำอธิบายที่นี่จริงๆ


6
n/2+1

Matlab ของ "การทดสอบแบบทวินาม" ทำอะไรได้บ้าง?
whuber

2
ดูเหมือนว่านี่คือการทดสอบทวินามของผู้โพสต์binocdfเป็นเพียง CDF ของ binomial uk.mathworks.com/help/stats/binocdf.html
conjugateprior

คำตอบ:


20

pH0

ในขณะที่เจมส์สแตนลีย์กล่าวถึงความคิดเห็นการกระจายของสถิติการทดสอบจะไม่ต่อเนื่องดังนั้นผลลัพธ์จึงไม่สามารถนำมาใช้ได้ คุณอาจไม่มีข้อผิดพลาดเลยในรหัสของคุณ (แม้ว่าฉันจะไม่แสดงการกระจายแบบไม่ต่อเนื่องกับฮิสโตแกรมฉันก็จะเอนตัวไปที่การแสดง cdf หรือ pmf หรือดีกว่า)

F(x)=x

ป้อนคำอธิบายรูปภาพที่นี่

เป็นไปได้ทีเดียวที่จะคำนวณการกระจายตัวนี้แน่นอนแทนที่จะจำลอง - แต่ฉันได้ติดตามผู้นำของคุณและทำการจำลอง (แม้ว่าจะใหญ่กว่าที่คุณมี)

n

α


ขอบคุณ Glen และ @ JamesStanley! ฉันพยายามเข้าใจว่าการกระจายตัวแบบ p-value ไม่เหมือนกันจริง ๆ และอะไรคือผลที่ตามมาของการทดสอบสมมติฐาน - แต่สำหรับฉันเดาว่าฉันจะดำดิ่งลงสู่วิกิพีเดีย :)
TanZor

3
α

@ TanZor คุณสามารถดูได้ด้วยวิธีนี้ว่ามีการแจกแจงแบบสม่ำเสมอใน [0, 1] แต่เนื่องจากการกระจายแบบทวินามนั้นไม่ต่อเนื่องการกระจายแบบนี้จึงไม่ได้แยกกันอย่างสม่ำเสมอ สังเกตว่าความสูงของแท่งใน pmf นั้นแปรผันตามระยะทางระหว่างแท่งข้างเคียงหรือไม่ซึ่งเหมือนกับการสังเกตว่าการกระโดดใช้F(x) ถึง x.
A. Donda

A.Donda, Glen_b - ขอบคุณ! คุณช่วยได้มาก
TanZor
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.