ช่วงความเชื่อมั่นและความไม่แน่นอนของค่า P สำหรับการทดสอบการเปลี่ยนรูป


12

ฉันกำลังเรียนรู้การทดสอบแบบสุ่มในขณะนี้ มีคำถามอยู่สองข้อในใจของฉัน:

  1. ใช่มันง่ายและใช้งานง่ายวิธีคำนวณค่า p ด้วยการทดสอบการสุ่ม (ซึ่งฉันคิดว่าเหมือนกับการทดสอบการเรียงสับเปลี่ยน?) อย่างไรก็ตามเราจะสร้างช่วงความมั่นใจได้ 95% ในขณะที่เราทำการทดสอบแบบพาราเมตริกได้อย่างไร

  2. เมื่อฉันอ่านเอกสารจาก University of Washington เกี่ยวกับการทดสอบการเรียงสับเปลี่ยนมีประโยคหนึ่งในหน้า 13 ที่บอกว่า:

    1000 พีชคณิต .... ความไม่แน่นอนที่อยู่ใกล้ p = 0.05 เป็นเรื่องเกี่ยวกับ \%±1%

    ฉันสงสัยว่าเราจะมีความไม่แน่นอนนี้ได้อย่างไร

คำตอบ:


12

อย่างไรก็ตามเราจะสร้างช่วงความมั่นใจได้ 95% ในขณะที่เราทำการทดสอบแบบพาราเมตริกได้อย่างไร

ต่อไปนี้เป็นวิธีหนึ่งที่คุณสามารถสร้างช่วงเวลาจากการทดสอบ resampling แม้ว่ามันจะไม่ได้เสมอจัดสรรคิดว่ามันเป็นช่วงความเชื่อมั่น^สำหรับตัวอย่างที่เฉพาะเจาะจงทำการทดสอบความแตกต่างระหว่างสองตัวอย่าง พิจารณาเลื่อนตัวอย่างที่สองโดย (ซึ่งอาจเป็นบวกหรือลบ) จากนั้นชุดของค่าซึ่งจะนำไปสู่การไม่ปฏิเสธโดยการทดสอบที่ระดับสามารถใช้เป็นช่วงความเชื่อมั่นในนามในนามสำหรับความแตกต่างในค่าเฉลี่ยδδα1α

ผู้เขียนบางคน (เช่น [1], p364 et seq , [2]) เรียกช่วงเวลาที่สร้างด้วยวิธีนี้ (ค่าพารามิเตอร์ที่ไม่ได้ปฏิเสธโดยการทดสอบ) ช่วงเวลาความสอดคล้อง - ซึ่งเป็นชื่อที่ดีกว่าช่วงความมั่นใจสำหรับมัน (แม้ว่า หลายคนไม่สนใจความแตกต่างตัวอย่างเช่นฉันเชื่อว่า Cox & Hinkley เรียกช่วงความเชื่อมั่นเหล่านี้) เพราะวิธีการไม่จำเป็นต้องให้ช่วงเวลาที่มีความครอบคลุมที่ต้องการ (ในหลาย ๆ สถานการณ์เป็นไปได้ที่จะเห็นว่าควร) ชื่อบ่งบอกบางอย่างเกี่ยวกับสิ่งที่ช่วงเวลาบอกคุณ (ช่วงเวลาของค่าที่สอดคล้องกับข้อมูล)

Gelman รวมถึงการอภิปรายว่าทำไมบางครั้งมันก็อาจจะเป็นปัญหาที่จะต้องพิจารณาอย่างกว้างขวางช่วงความเชื่อมั่นให้พวกเขาที่นี่

ไม่ใช่เรื่องยากที่จะสำรวจความครอบคลุมภายใต้สมมติฐานเฉพาะ (ผ่านการจำลอง) และไม่มีผู้คนที่เรียกช่วงเวลา bootstrap "ช่วงความเชื่อมั่น" (แม้บางครั้งพวกเขาจะเห็นว่าไม่มีอะไรเหมือนการรายงานข่าวที่อ้างสิทธิ์)

รายละเอียดเพิ่มเติมเกี่ยวกับวิธีการทำในกรณีตัวอย่างที่แตกต่างกันสองวิธีกล่าวถึงใน [3] ซึ่งพวกเขาเรียกว่าช่วงความมั่นใจในการสุ่มและการเรียกร้องเกิดขึ้นเมื่อพวกเขาแน่นอน พยายามประเมิน)

ด้วยการเรียงสับเปลี่ยน 1,000 ครั้ง .... ความไม่แน่นอนใกล้ p = 0.05 จะอยู่ที่± 1%

ฉันสงสัยว่าเราจะมีความไม่แน่นอนนี้ได้อย่างไร

ค่า p โดยประมาณเป็นสัดส่วนแบบทวินาม ดังนั้นจึงมีข้อผิดพลาดเดียวกันมาตรฐานตามสัดส่วนทวินามอื่น ๆ{n}}p(1p)n

ดังนั้นถ้าและ , ข้อผิดพลาดมาตรฐานของสัดส่วนการสังเกตเป็นเรื่องเกี่ยวกับ0.0069 CI จะ [อีกทางเลือกหนึ่งเป็นเรื่องเกี่ยวกับข้อผิดพลาดมาตรฐานแต่ละด้านซึ่งจะสอดคล้องกับช่วงความเชื่อมั่นพื้นฐาน p-value ของบิตมากกว่า ]p=0.05n=10000.006990%±1.13%±1%1.4585%

อย่างน้อยก็ในแง่ที่คุณสามารถพูดเกี่ยวกับความไม่แน่นอนว่า "ประมาณ 1%"

-

[1] Kempthorne และ Folks (1971)
น่าจะเป็นสถิติและการวิเคราะห์ข้อมูล ,
Iowa State University Press

[2] LaMotte LR และVolaufová J, (1999),
"ช่วงเวลาการทำนายผ่านช่วงเวลาที่
สอดคล้องกัน ", วารสารสมาคมสถิติแห่งรอยัล ชุด D (The Statistics) , Vol. 48, ลำดับที่ 3, หน้า 419-424

[3] เอิร์นส์, แมรี่แลนด์ (2004),
"วิธีการเปลี่ยนลำดับ: พื้นฐานสำหรับการอนุมานที่แน่นอน", วิทยาศาสตร์สถิติ , ฉบับที่ 19, ฉบับที่ 4, 676–685

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.