เราสามารถปฏิเสธสมมติฐานว่างที่มีช่วงความมั่นใจที่เกิดจากการสุ่มตัวอย่างมากกว่าสมมติฐานว่างได้หรือไม่?


9

ฉันได้รับการสอนว่าเราสามารถสร้างการประมาณค่าพารามิเตอร์ในรูปแบบของช่วงความมั่นใจหลังจากการสุ่มตัวอย่างจากประชากร ตัวอย่างเช่นช่วงความเชื่อมั่น 95% ที่ไม่มีการละเมิดสมมติฐานควรมีอัตราความสำเร็จ 95% ของการบรรจุสิ่งที่พารามิเตอร์จริงที่เราประเมินอยู่ในประชากร

กล่าวคือ

  1. สร้างการประมาณจุดจากตัวอย่าง
  2. สร้างช่วงของค่าที่ในทางทฤษฎีมีโอกาส 95% ในการเก็บค่าจริงที่เราพยายามประเมิน

อย่างไรก็ตามเมื่อหัวข้อได้เปลี่ยนเป็นการทดสอบสมมติฐานขั้นตอนต่าง ๆ ได้อธิบายไว้ดังต่อไปนี้:

  1. สมมติว่าพารามิเตอร์บางตัวเป็นสมมติฐานว่าง
  2. สร้างการแจกแจงความน่าจะเป็นของความน่าจะเป็นที่จะได้รับการประเมินจุดต่าง ๆ เนื่องจากสมมติฐานว่างนี้เป็นจริง
  3. ปฏิเสธสมมติฐานว่างถ้าจุดประเมินที่เราได้รับนั้นจะเกิดขึ้นน้อยกว่า 5% ของเวลาถ้าสมมุติฐานว่างเป็นจริง

คำถามของฉันคือ:

จำเป็นหรือไม่ที่จะต้องสร้างช่วงความเชื่อมั่นของเราโดยใช้สมมติฐานว่างเพื่อปฏิเสธค่าว่าง? ทำไมไม่เพียงแค่ทำขั้นตอนแรกและรับค่าประมาณของพารามิเตอร์จริง (ไม่ได้ใช้ค่าที่เราตั้งสมมติฐานไว้ในการคำนวณช่วงความเชื่อมั่น) แล้วปฏิเสธสมมติฐานว่างถ้ามันไม่ได้อยู่ในช่วงนี้?

ดูเหมือนว่าจะมีเหตุผลเทียบเท่ากับฉันอย่างสังหรณ์ใจ แต่ฉันกลัวว่าฉันขาดอะไรบางอย่างที่เป็นพื้นฐานเพราะอาจมีเหตุผลที่สอนวิธีนี้


ฉันขอโทษที่ไม่แน่ใจ Martijn ฉันจะแก้ไขโพสต์ของฉันในไม่ช้าเพื่อให้ชัดเจนสำหรับผู้ที่ค้นหาคำถามเดียวกันในอนาคต สิ่งที่ฉันหมายถึงคือเราสามารถคำนวณการประมาณค่าพารามิเตอร์จากตัวอย่างหรือเราสามารถคำนวณช่วงของการประมาณค่าที่เราจะถือว่าสนับสนุนสมมติฐานว่างโดยใช้สมมติฐานว่าง ฉันไม่เข้าใจว่าทำไมจึงจำเป็นต้องใช้ null เพื่อดูว่าการประมาณจุดของเราอยู่ในช่วงเวลานี้หรือไม่แทนที่จะใช้การประมาณค่าพารามิเตอร์ของเราและตรวจสอบเพื่อดูว่า null อยู่ภายในขอบเขตของการประมาณค่าพารามิเตอร์หรือไม่ ฉันหวังว่ามันสมเหตุสมผล!
Nikli

การทดลองทางความคิดที่น่าสนใจคือถ้ามีคนพยายามขายลูกเต๋าน้ำหนักให้คุณ พวกเขากลิ้งพวกเขาแล้วระบุว่าพวกเขามีน้ำหนักในทิศทางที่คุณสังเกต (เช่น 6 มาถึง 20% ของเวลา) พวกเขามีน้ำหนัก (มีตัวอย่างการขว้างพอ) โดยเท่าไหร่และมันจะคุ้มค่าที่จะทำการทดสอบโยนลูกเต๋าของคุณเอง? ผู้ขายและผู้ซื้อมีเป้าหมายที่แตกต่างกัน ...
ฟิลิป Oakley

คำตอบ:


5

ปัญหาที่ง่ายโดยวิธีการเช่นจะได้รับจากการทดสอบค่าเฉลี่ยของประชากรปกติที่มีความแปรปรวนที่รู้จักกัน 1 จากนั้นหมุน - ปริมาณที่มีการกระจายตัวไม่ขึ้นอยู่กับพารามิเตอร์จะได้รับจากn) ค่าวิกฤตตอบสนองในกรณีที่สมมาตรนี้และ 2σ2=1Y¯μN(0,1/n)zα/2Φ(zα/2)=α/2Φ(zα/2)=1α/2

ดังนั้น ดังนั้น เป็นช่วงความเชื่อมั่นระดับ1-

1α=Pr{(X¯μ)/(1/n)(zα/2,zα/2)}=Pr{zα/2(X¯μ)nzα/2}=Pr{zα/2(μX¯)nzα/2}=Pr{zα/2/nμX¯zα/2/n}=Pr{X¯zα/2/nμX¯+zα/2/n}=Pr{(X¯zα/2/n,X¯+zα/2/n)μ}
(X¯zα/2/n,X¯+zα/2/n)
1α

ในเวลาเดียวกันเหตุการณ์ในบรรทัดแรกของจอแสดงผลก็เป็นเหตุการณ์ที่สมมติฐานที่ไม่ได้ถูกปฏิเสธสำหรับนี้ เนื่องจากส่วนที่เหลือมีเพียงการปฏิรูปที่เทียบเท่ากัน ci จึงมีทั้งหมดซึ่งไม่ได้รับการปฏิเสธและไม่มีการอ้างอิงถึง "ภายใต้ค่า null"μμ

นี่คือพล็อตที่คล้ายคลึงกับการสร้างภาพ +1 ของ Martijn โดยมีจุดประสงค์เพื่อแสดงสิ่งที่เป็นที่รู้จักกันในชื่อความเป็นคู่ระหว่างช่วงความมั่นใจและการทดสอบ หมายถึงช่วงความเชื่อมั่นที่อยู่ในบางและภูมิภาคได้รับการยอมรับที่เป็นสมมติฐานบาง\Cx¯A(μ0)μ=μ0

ป้อนคำอธิบายรูปภาพที่นี่


10

ใช่คุณสามารถแทนที่การทดสอบสมมติฐาน (เปรียบเทียบตัวอย่างกับการกระจายตัวของผลลัพธ์ทดสอบ) โดยการเปรียบเทียบกับช่วงความมั่นใจที่คำนวณจากตัวอย่าง แต่ทางอ้อมช่วงความเชื่อมั่นนั้นเป็นการทดสอบสมมติฐานอยู่แล้วเช่น:

  • คุณอาจเห็นช่วงความเชื่อมั่นที่ถูกสร้างขึ้นเป็นช่วงของค่าซึ่งการทดสอบสมมติฐานระดับระดับจะประสบความสำเร็จαและอยู่นอกช่วงที่การทดสอบสมมติฐานระดับระดับจะล้มเหลวα

ผลที่ตามมาของการทำช่วงดังกล่าวก็คือช่วงที่ไม่เพียงเศษส่วนของเวลาα

ตัวอย่าง

ฉันใช้รูปภาพจากคำตอบของคำถามด้านล่าง: ช่วงเวลาความเชื่อมั่น: วิธีจัดการกับP(L(X)θ,U(X)θ)=1α

มันเป็นรูปแบบของกราฟจากClopper เพียร์สัน ลองจินตนาการถึงกรณีของ 100 การทดลอง Bernoulli ที่น่าจะเป็นของความสำเร็จคือและเราสังเกตจำนวนรวมของความสำเร็จXθX

ความน่าจะเป็นแบบ fiducial

โปรดทราบว่า:

  • ในแนวตั้งคุณจะเห็นการทดสอบสมมติฐาน เช่นสำหรับค่าที่ตั้งสมมติฐานคุณจะปฏิเสธสมมติฐานถ้าค่าวัดได้นั้นสูงกว่าหรือต่ำกว่าเส้นประสีแดงหรือสีเขียวθX

  • ในทิศทางแนวนอนคุณจะเห็นช่วงความมั่นใจ Clopper-Pearson หากการสังเกต X ใด ๆ ที่คุณใช้ช่วงความมั่นใจเหล่านี้คุณจะผิดเพียง 5% ของเวลา

    (เพราะคุณจะสังเกต X เช่นนั้นซึ่งคุณใช้ช่วงเวลา 'ผิดปกติ' 5% ของเวลา)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.