p-value subtlety: มากขึ้นเท่ากันและมากกว่า


11

ในขณะที่ฉันกำลังอ่านหนังสือสถิติทั้งหมดของ Wassermann ฉันสังเกตเห็นความละเอียดอ่อนในคำจำกัดความของค่า p ซึ่งฉันไม่สามารถเข้าใจได้ อย่างไม่เป็นทางการ Wassermann กำหนดค่า p เป็น

[.. ] ความน่าจะเป็น (ต่ำกว่า ) ของการสังเกตค่าสถิติการทดสอบเหมือนกับหรือมากกว่าความเป็นจริงมากกว่าที่สังเกตH0

เน้นการเพิ่ม เหมือนกันมากขึ้นอย่างเป็นทางการ (ทฤษฎีบท 10.12):

สมมติว่าการทดสอบขนาดเป็นของแบบฟอร์มα

ปฏิเสธถ้าหากว่าc_H0T(Xn)cα

จากนั้น

p-value=supθΘ0Pθ0[T(Xn)T(xn)]

ที่xnเป็นค่าสังเกตของXn n ถ้าΘ0={θ0}ดังนั้น

p-value=Pθ0[T(Xn)T(xn)]

นอกจากนี้ Wassermann ยังกำหนดค่า p-value ของการทดสอบ \ chi ^ 2ของ Pearson χ2(และการทดสอบอื่น ๆ แบบอะนาล็อก) เป็น:

p-value=P[χk12>T].

ส่วนที่ฉันต้องการขอการชี้แจงคือเครื่องหมายที่มากกว่า ( ) ในเครื่องหมายแรกและเครื่องหมาย ( > ) ที่มากขึ้นในคำจำกัดความที่สอง ทำไมเราไม่เขียนTซึ่งจะตรงกับคำพูดแรกของ " เหมือนหรือมากกว่าสุด"

นี่สะดวกสบายมากไหมที่เราจะคำนวณค่า p เป็น ? ผมสังเกตเห็นว่า R ยังใช้คำนิยามกับเข้าสู่ระบบเช่นใน1F(T)>chisq.test


5
คุณทราบหรือไม่ว่าค่า p-value เหมือนกันสำหรับทั้งสองคำจำกัดความหากสถิติการทดสอบนั้นต่อเนื่อง?
mark999

3
มันไม่สำคัญสำหรับการแจกแจงแบบต่อเนื่อง แต่ความจริงข้อนี้ไม่ควรล่อใจให้คุณลืมความแตกต่างระหว่างและเพราะมันสำคัญทางคณิตศาสตร์ นอกจากนี้ยังมีความสำคัญในการใช้งานเพราะเนื่องจาก "discreteness ของชีวิตจริง" เราอาจในความเป็นจริงการเผชิญหน้า P-ค่าของว่า\<α
Horst Grünbusch

คำตอบ:


11

"เป็นมากหรือรุนแรง" ถูกต้อง

ถ้าหากการแจกแจงนั้นมีความน่าจะเป็นที่จะได้รับสถิติการทดสอบนั้นเป็นบวกความน่าจะเป็นนั้น (และอะไรก็ตามที่สุดขั้วเท่ากันเช่นค่าที่สอดคล้องกันในหางอีกข้าง) ควรรวมอยู่ในค่า p-value

ของหลักสูตรที่มีสถิติอย่างต่อเนื่องน่าจะเป็นของความเท่าเทียมกันแน่นอนที่เป็น 0 มันทำให้ไม่แตกต่างกันถ้าเราบอกว่าหรือ\>


4

จุดแรกของคือพื้นที่สมมติฐานถูกปิดทอพอโลยีภายในพื้นที่พารามิเตอร์ทั้งหมด หากคุณมีการยืนยันเกี่ยวกับลำดับการรวมพารามิเตอร์ที่เป็นของสมมติฐานเพราะคุณจะรู้ว่าขีด จำกัด นั้นไม่ได้เป็นของทางเลือกโดยทันที

ตอนนี้พิจารณาการแจกแจงความน่าจะเป็นพวกมัน (ปกติ) ขวาอย่างต่อเนื่อง นั่นหมายความว่าการแมปพื้นที่ว่างของสมมติฐานปิดกับช่วงจะถูกปิดอีกครั้ง นั่นเป็นเหตุผลที่ช่วงเวลาความเชื่อมั่นถูกปิดโดยการประชุม[0,1]

สิ่งนี้ช่วยเพิ่มคณิตศาสตร์ ลองนึกภาพคุณจะสร้างช่วงความมั่นใจสำหรับพารามิเตอร์ตำแหน่งของการแจกแจงความน่าจะเป็นแบบอสมมาตร ตรงนั้นคุณต้องแลกเปลี่ยนความยาวกับหางส่วนบนสำหรับความยาวถึงหางล่าง ความน่าจะเป็นทั้งในหางควรรวมถึง\จะมี CI เป็นข้อมูลที่เป็นไปได้ที่คุณจะต้องตัดความยาว CI ของดังกล่าวว่าน่าจะเป็นความคุ้มครองของมันยังคง1- นี่เป็นชุดปิด คุณสามารถหาคำตอบที่ดีที่สุดโดยอัลกอริธึมวนซ้ำเช่นทฤษฎีบทจุดคงที่ของ Banach หากเป็นชุดเปิดคุณไม่สามารถทำเช่นนี้ได้α1α

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.