ในขณะที่ได้รับช่วงความเชื่อมั่นอย่างเป็นทางการของการประเมินฉันลงเอยด้วยสูตรที่คล้ายกับวิธีคำนวณค่า
ดังนั้นคำถาม: พวกเขาเทียบเท่าอย่างเป็นทางการ? Ie กำลังปฏิเสธสมมติฐานมีค่าวิกฤตเทียบเท่ากับไม่ได้อยู่ในช่วงความเชื่อมั่นที่มีค่าวิกฤต ?α 0 α
ในขณะที่ได้รับช่วงความเชื่อมั่นอย่างเป็นทางการของการประเมินฉันลงเอยด้วยสูตรที่คล้ายกับวิธีคำนวณค่า
ดังนั้นคำถาม: พวกเขาเทียบเท่าอย่างเป็นทางการ? Ie กำลังปฏิเสธสมมติฐานมีค่าวิกฤตเทียบเท่ากับไม่ได้อยู่ในช่วงความเชื่อมั่นที่มีค่าวิกฤต ?α 0 α
คำตอบ:
ใช่และไม่.
สิ่งที่คุณสังเกตเห็นคือเมื่อการทดสอบและช่วงความมั่นใจขึ้นอยู่กับสถิติเดียวกันมีความเท่าเทียมกันระหว่างพวกเขา: เราสามารถตีความเป็นค่าที่เล็กที่สุดของซึ่งค่า null ของพารามิเตอร์ จะรวมอยู่ในช่วงความเชื่อมั่นα 1 - α
ให้เป็นพารามิเตอร์ที่ไม่รู้จักในพื้นที่พารามิเตอร์และปล่อยให้ตัวอย่างเป็นสำนึกของตัวแปรสุ่มX_n) เพื่อความง่ายให้กำหนดช่วงความมั่นใจเป็นช่วงเวลาแบบสุ่มเพื่อให้ครอบคลุมความน่าจะเป็น (คุณสามารถพิจารณาช่วงเวลาทั่วไปที่คล้ายกันมากขึ้นโดยที่ความน่าจะเป็นของความครอบคลุมอาจถูกล้อมรอบด้วยหรือประมาณเท่ากับการให้เหตุผลมีความคล้ายคลึงกัน)Θ ⊆ R x = ( x 1 , ... , x n ) ∈ X n ⊆ R n X = ( X 1 , ... , X n ) ฉันα ( X ) P θ ( θ ∈ ฉันα ( X ) ) = 1 - α 1 - α
พิจารณาการทดสอบสองด้านของจุด null สมมติฐานกับทางเลือก\ ให้แสดงถึงค่า p ของการทดสอบ สำหรับการใด ๆ ,ถูกปฏิเสธในระดับถ้า\ระดับ rejection regionคือชุดซึ่งนำไปสู่การปฏิเสธ : H 1 ( θ 0 ) : θ λ ( θ 0 , x ) อัลฟ่า∈ ( 0 , 1 ) H 0 ( θ 0 ) อัลฟ่าλ ( θ 0 , x ) ≤ อัลฟ่าอัลฟ่าx H 0 ( θ 0 ) R
ตอนนี้พิจารณาครอบครัวของทั้งสองด้านการทดสอบกับ P-ค่าสำหรับ\สำหรับครอบครัวเราสามารถกำหนดเขตการปฏิเสธคว่ำθ ∈ Θ Q α ( x ) = { θ ∈ Θ : λ ( θ , x ) ≤ α }
สำหรับการแก้ไข ,จะถูกปฏิเสธหากซึ่งจะเกิดขึ้นถ้าหาก , นั่นคือ หากการทดสอบจะขึ้นอยู่กับสถิติทดสอบกับที่ระบุไว้อย่างสมบูรณ์กระจาย null ต่อเนื่องอย่างแน่นอนแล้วภายใต้theta_0) จากนั้น เนื่องจากสมการนี้มีไว้สำหรับH 0 ( θ 0 ) x ∈ R α ( ) P θ 0 ( X ∈ R α ( θ 0 ) ) , Q α ( x ) θ 0 α Q Cθ 0 ∈ Q α ( x ) x ∈ R α ( θ 0 ) ⇔ θ 0 ∈ Q α ( x ) λ ( θ 0 , X ) ∼ U ( 0 , 1 ) H 0 ( θ 0
ภาพประกอบได้รับด้านล่างแสดงให้เห็นถึงการปฏิเสธภูมิภาคและช่วงความเชื่อมั่นที่สอดคล้องกับที่ -test สำหรับค่าเฉลี่ยปกติสำหรับวิธีการที่แตกต่างกัน nullและตัวอย่างวิธีการที่แตกต่างกันกับ 1 ถูกปฏิเสธหากอยู่ในภูมิภาคสีเทาอ่อน แสดงเป็นสีเทาเข้มคือบริเวณที่ปฏิเสธและช่วงความมั่นใจ0.120,1.120)
(สิ่งนี้ส่วนใหญ่นำมาจากวิทยานิพนธ์ระดับปริญญาเอกของฉัน )
ข้างต้นฉันอธิบายวิธีมาตรฐานในการสร้างช่วงความมั่นใจ ในวิธีการนี้เราใช้สถิติที่เกี่ยวข้องกับพารามิเตอร์ที่ไม่รู้จักเพื่อสร้างช่วงเวลา นอกจากนี้ยังมีช่วงเวลาตามขั้นตอนวิธีการลดซึ่งพยายามที่จะลดความยาวของสภาพช่วงเวลากับค่าของXโดยปกติช่วงเวลาดังกล่าวไม่สอดคล้องกับการทดสอบ
ปรากฏการณ์นี้เกี่ยวข้องกับปัญหาที่เกี่ยวข้องกับช่วงเวลาดังกล่าวที่ไม่ซ้อนกันซึ่งหมายความว่าช่วงเวลา 94% อาจสั้นกว่าช่วงเวลา 95% สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ดูหัวข้อ 2.5 ของเอกสารล่าสุดของฉัน (เพื่อแสดงใน Bernoulli)
ในบางปัญหาช่วงความมั่นใจมาตรฐานไม่ได้ขึ้นอยู่กับสถิติเดียวกับการทดสอบมาตรฐาน (ตามที่ Michael Fay อธิบายไว้ในบทความนี้ ) ในกรณีเหล่านั้นช่วงความมั่นใจและการทดสอบอาจไม่ให้ผลลัพธ์ที่เหมือนกัน ตัวอย่างเช่นอาจถูกปฏิเสธโดยการทดสอบแม้ว่า 0 จะรวมอยู่ในช่วงความมั่นใจ สิ่งนี้ไม่ขัดแย้งกับ "ใช่" ด้านบนเนื่องจากมีการใช้สถิติที่แตกต่าง
ตามที่ระบุโดยf coppensในความคิดเห็นบางครั้งช่วงเวลาและการทดสอบมีเป้าหมายที่ค่อนข้างขัดแย้งกัน เราต้องการช่วงเวลาสั้น ๆ และการทดสอบที่มีกำลังแรงสูง แต่ช่วงเวลาที่สั้นที่สุดนั้นไม่สอดคล้องกับการทดสอบด้วยกำลังสูงสุดเสมอไป สำหรับตัวอย่างบางส่วนของนี้ดูบทความนี้ (กระจายปกติหลายตัวแปร) หรือนี้ (กระจายชี้แจง) หรือมาตรา 4 แห่งวิทยานิพนธ์ของฉัน
หลายปีที่ผ่านมาฉันโพสต์คำถามที่นี่เกี่ยวกับว่ามีการทดสอบช่วงเวลาเทียบเท่าในสถิติ Bayesian หรือไม่ คำตอบสั้น ๆ คือการใช้การทดสอบสมมติฐานแบบเบย์มาตรฐานคำตอบคือ "ไม่" ด้วยการปรับแก้ปัญหาการทดสอบเล็กน้อยคำตอบอาจเป็น "ใช่" (ความพยายามของฉันในการตอบคำถามของฉันกลายเป็นกระดาษในที่สุด!)
เมื่อดูที่พารามิเตอร์เดียวอาจเป็นไปได้ว่าการทดสอบเกี่ยวกับค่าของพารามิเตอร์และช่วงความเชื่อมั่น "ไม่ตรงกัน" ขึ้นอยู่กับวิธีการสร้าง โดยเฉพาะอย่างยิ่งการทดสอบสมมติฐานคือระดับ -test ถ้ามันปฏิเสธสมมติฐานว่างในสัดส่วนของเวลาที่สมมติฐานว่างเป็นจริง ด้วยเหตุผลนั้นเราสามารถใช้การประมาณค่าพารามิเตอร์ของโมเดล (เช่นความแปรปรวน) ที่ใช้ได้เฉพาะภายใต้สมมติฐานว่าง หากมีใครพยายามสร้าง CI โดยการคว่ำการทดสอบนี้ความคุ้มครองอาจไม่ถูกต้องภายใต้สมมติฐานทางเลือก ด้วยเหตุผลนั้นเรามักจะสร้างช่วงความเชื่อมั่นที่แตกต่างกันเพื่อให้การคุ้มครองนั้นอยู่ภายใต้ทางเลือกอื่นซึ่งจะนำไปสู่การไม่ตรงกัน (มักจะเล็กมาก)