ไม่มีอะไรที่เหมือนกับการตอบคำถามที่เก่ามาก แต่นี่จะไป ....
p-values เกือบทดสอบสมมติฐานที่ถูกต้อง นี่เป็นตัวอย่างที่ดัดแปลงมาเล็กน้อยจากหนังสือทฤษฎีความน่าจะเป็นของเจย์นส์ปี 2003 (การทดลองซ้ำ: ความน่าจะเป็นและความถี่) สมมติว่าเรามีสมมติฐานว่างเปล่าที่เราต้องการทดสอบ เรามีข้อมูลที่ดีและข้อมูลก่อนที่ฉัน สมมติว่ามีบางสมมติฐานที่ไม่ระบุHว่าเราจะทดสอบH 0กับ อัตราส่วนอัตราต่อรองหลังสำหรับH AเทียบกับH 0จะถูกกำหนดโดย:H0DผมHAH0HAH0
P(HA|DI)P(H0|DI)=P(HA|I)P(H0|I)×P(D|HAI)P(D|H0I)
ตอนนี้คำแรกบนด้านขวามือเป็นอิสระจากข้อมูลดังนั้นข้อมูลสามารถมีอิทธิพลต่อผลลัพธ์ผ่านเทอมที่สองเท่านั้น ทีนี้เราสามารถประดิษฐ์สมมติฐานทางเลือกขึ้นมาได้เสมอว่าP ( D | H A I ) = 1 - สมมติฐาน "สมบูรณ์แบบ" ดังนั้นเราสามารถใช้1HAP(D|HAI)=1เป็นการวัดว่าข้อมูลสามารถรองรับสมมติฐานทางเลือกใด ๆ เหนือโมฆะได้ดีเพียงใด ไม่มีสมมติฐานทางเลือกว่าข้อมูลสามารถรองรับH0 ได้มากกว่า11P(D|H0I)H0 ) นอกจากนี้เรายังสามารถ จำกัด คลาสของทางเลือกและการเปลี่ยนแปลงก็คือ1จะถูกแทนที่ด้วยโอกาสสูงสุด (รวมถึงค่าคงที่ปกติ) ภายในชั้นเรียนนั้น ถ้าP(D|H0I)เริ่มมีขนาดเล็กเกินไปเราจะเริ่มสงสัยว่าโมฆะเพราะจำนวนทางเลือกระหว่างH0และHAเพิ่มขึ้น (รวมถึงบางอย่างที่มีความน่าจะเป็นก่อนหน้านี้เล็กน้อย) แต่นี่เกือบจะเป็นสิ่งที่ทำกับค่า p แต่มีข้อยกเว้นหนึ่งข้อ: เราไม่คำนวณความน่าจะเป็นสำหรับt(1P(D|H0I)1P(D|H0I)H0HAสำหรับบางสถิติ t ( D )และบางพื้นที่ "ไม่ดี" ของสถิติ เราคำนวณความน่าจะเป็น D - ข้อมูลที่เราจริงมีมากกว่าส่วนย่อยบางส่วนของมัน,เสื้อ( D )t(D)>t0t(D)Dt(D)
D≡{x1,…,xN}xi∼Normal(μ,σ2)IH0:μ=μ0. จากนั้นเรามีหลังจากการคำนวณเล็กน้อย:
P(D|H0I)=(2πσ2)−N2exp(−N[s2+(x¯¯¯−μ0)2]2σ2)
x¯¯¯=1N∑Ni=1xis2=1N∑Ni=1(xi−x¯¯¯)2P(D|H0I)μ0=x¯¯¯
P(D|HAI)=(2πσ2)−N2exp(−Ns22σ2)
เราจึงหาอัตราส่วนของสองตัวนี้แล้วเราจะได้:
P(D|HAI)P(D|H0I)=(2πσ2)−N2exp(−Ns22σ2)(2πσ2)−N2exp(−Ns2+N(x¯¯¯−μ0)22σ2)=exp(z22)
z=N−−√x¯¯¯−μ0σ|z|x¯¯¯
x¯¯¯X¯¯¯¯∼Normal(μ,σ2N)X¯¯¯¯x¯¯¯|X¯¯¯¯−μ0||X¯¯¯¯−μ0|≥|x¯¯¯−μ0|
p-value=P(|X¯¯¯¯−μ0|≥|x¯¯¯−μ0||H0)
=1−P[−N−−√|x¯¯¯−μ0|σ≤N−−√X¯¯¯¯−μ0σ≤N−−√|x¯¯¯−μ0|σ|H0]
=1−P(−|z|≤Z≤|z||H0)=2[1−Φ(|z|)]
|z|
แม้ว่าพวกเขาจะเป็นทั้งสองสิ่งง่าย ๆ ที่จะทำในตัวอย่างนี้พวกเขาไม่ได้ง่ายเสมอไปในกรณีที่ซับซ้อนมากขึ้น ในบางกรณีอาจเป็นการง่ายกว่าในการเลือกสถิติที่เหมาะสมในการใช้และคำนวณการกระจายตัวตัวอย่าง ในคนอื่น ๆ อาจเป็นการง่ายกว่าที่จะกำหนดคลาสของทางเลือกและขยายให้กว้างกว่าคลาสนั้น
ตัวอย่างง่ายๆนี้อธิบายถึงการทดสอบตามค่า p จำนวนมากเนื่องจากการทดสอบสมมติฐานจำนวนมากมีความหลากหลาย "ประมาณปกติ" มันให้คำตอบโดยประมาณสำหรับปัญหาเหรียญของคุณด้วย (โดยใช้การประมาณแบบปกติกับทวินาม) นอกจากนี้ยังแสดงให้เห็นว่าค่า p ในกรณีนี้จะไม่ทำให้คุณหลงทางอย่างน้อยก็ในแง่ของการทดสอบสมมติฐานเดียว ในกรณีนี้เราสามารถพูดได้ว่าค่า p เป็นตัวชี้วัดของหลักฐานเทียบกับสมมติฐานว่าง
0.193.870.05196.830.12.330.052.78