ความแตกต่างระหว่างช่วงความมั่นใจและการทดสอบสมมติฐานคืออะไร


28

ฉันได้อ่านเกี่ยวกับการถกเถียงเกี่ยวกับการทดสอบสมมติฐาน กับนักวิจารณ์บางคนเสนอว่าไม่ควรใช้การทดสอบสมมติฐาน นักวิจารณ์บางคนแนะนำว่าควรใช้ช่วงความมั่นใจแทน

  • ความแตกต่างระหว่างช่วงความมั่นใจและการทดสอบสมมติฐานคืออะไร คำอธิบายที่มีการอ้างอิงและตัวอย่างจะได้รับการชื่นชม

5
ฉันคิดว่าคุณต้องการถามว่าทำไมการรายงานผลการทดสอบสมมติฐานโดยแสดงช่วงความเชื่อมั่นดีกว่าการบอกว่ามีบางสิ่งยืนยันหรือปฏิเสธในระดับค่า p

3
คุณควรพิจารณาตรวจสอบคำถามอื่น ๆ ของคุณตามคำตอบ
Andy W

คำตอบ:


19

คุณสามารถใช้ช่วงความมั่นใจ (CI) สำหรับการทดสอบสมมติฐาน ในกรณีทั่วไปถ้า CI สำหรับเอฟเฟกต์ไม่ครอบคลุม 0 คุณสามารถปฏิเสธสมมติฐานว่างได้ แต่สามารถใช้ CI ได้มากขึ้นในขณะที่การรายงานว่าผ่านไปแล้วนั้นเป็นขีด จำกัด ของประโยชน์ของการทดสอบหรือไม่

เหตุผลที่คุณแนะนำให้ใช้ CI แทนที่จะเป็นแค่การทดสอบ t-test ก็เพราะว่าคุณสามารถทำได้มากกว่าแค่การทดสอบสมมติฐาน คุณสามารถสร้างแถลงการณ์เกี่ยวกับช่วงของเอฟเฟกต์ที่คุณเชื่อว่าน่าจะเป็น (สิ่งที่อยู่ใน CI) คุณไม่สามารถทำได้ด้วยการทดสอบ t คุณยังสามารถใช้มันเพื่อสร้างข้อความเกี่ยวกับ null ซึ่งคุณไม่สามารถทำได้ด้วยการทดสอบ t หากการทดสอบ t ไม่ปฏิเสธโมฆะคุณก็บอกว่าคุณไม่สามารถปฏิเสธโมฆะได้ซึ่งไม่ได้พูดมาก แต่ถ้าคุณมีช่วงความมั่นใจแคบ ๆ รอบ ๆ โมฆะคุณสามารถแนะนำว่าค่า Null หรือค่าที่ใกล้เคียงนั้นน่าจะเป็นค่าจริงและแนะนำผลของการรักษาหรือตัวแปรอิสระเล็กเกินไปที่จะมีความหมาย ( หรือว่าการทดสอบของคุณไม่ได้

เพิ่มในภายหลัง: ฉันควรได้กล่าวว่าในขณะที่คุณสามารถใช้ CI เช่นการทดสอบไม่ใช่หนึ่ง เป็นค่าประมาณของช่วงที่คุณคิดว่าค่าพารามิเตอร์อยู่ คุณสามารถทำการทดสอบแบบอนุมานได้ แต่คุณทำได้ดีกว่ามากไม่เคยพูดถึงมันแบบนั้น

ไหนดีกว่ากัน

A)ผลกระทบคือ 0.6, t (29) = 2.8, p <0.05 นี้มีผลกระทบอย่างมีนัยสำคัญทางสถิติคือ ... (บาง ensues การอภิปรายเกี่ยวกับนัยสำคัญทางสถิตินี้โดยไม่มีการเอ่ยถึงหรือแม้กระทั่งความสามารถที่แข็งแกร่งเพื่อหารือเกี่ยวกับความหมายในทางปฏิบัติของความสำคัญของการค้นพบใด ๆ ... ภายใต้กรอบ Neyman เพียร์สันขนาดของเสื้อและค่าpนั้นค่อนข้างไร้ความหมายและสิ่งที่คุณสามารถพูดคุยได้ก็คือไม่ว่าจะมีเอฟเฟกต์เกิดขึ้นหรือไม่พบคุณไม่สามารถพูดคุยเกี่ยวกับมันได้

หรือ

B)การใช้ช่วงความมั่นใจ 95% ฉันประเมินว่าเอฟเฟกต์จะอยู่ระหว่าง 0.2 ถึง 1.0 (การสนทนาบางอย่างทำให้เกิดการพูดคุยเกี่ยวกับผลกระทบที่เกิดขึ้นจริงของผลประโยชน์ไม่ว่าจะเป็นค่าที่เป็นไปได้หรือไม่นั้นเป็นสิ่งที่มีความหมายเฉพาะใด ๆ และการใช้คำที่มีความหมาย การอภิปรายว่านี่เป็นการค้นพบที่ดีหรือไม่หรือคุณสามารถบรรลุข้อสรุปเบื้องต้นได้มากขึ้นเท่านั้น)

หากคุณเข้าเรียนวิชาสถิติขั้นพื้นฐานคุณอาจเริ่มต้นไปที่ A. และอาจมีบางกรณีที่วิธีรายงานผลดีกว่า แต่สำหรับงานส่วนใหญ่ B นั้นเหนือกว่าและไกลกว่า การประมาณช่วงไม่ใช่การทดสอบ


อีกหนึ่งความเห็นของ @john: อันดับแรกบางครั้งคำถามสำคัญคือ CI ครอบคลุม 1 ไม่ใช่ 0 (เช่นการถดถอยโลจิสติก)
Peter Flom - Reinstate Monica

พวกมันคือ 1 หรือมันคือ 0? (นี่ดูสว่างมากสำหรับฉันดังนั้นฉันเดาฉันต้องเรียนรู้ค่าที่ถูกต้องที่จะระวัง!)
@John

ความสัมพันธ์ระหว่าง 95% CI และสมมติฐานการทดสอบแบบสองด้านกับ alfa = 0.05 คืออะไร พวกเขาเหมือนกันหรือไม่ถ้าไม่ได้อย่างไร
love-stats

love-stats เมื่อใช้เหมือนกันพวกมันเหมือนกัน
John

Adhesh Josh, สมมติฐานว่างอาจเป็นค่าคงที่ใด ๆ ที่ระบุไว้ล่วงหน้า นั่นเป็นอีกคุณสมบัติของ CI ที่ตรงไปที่ NHST มันใช้งานง่ายมากเมื่อคุณต้องการทดสอบกับค่าสมมุติฐานที่ไม่ใช่ 0
John

7

x1,x2,,xnμN(μ,1)μ=mH0:μ=m0.05.v=(x1+x2++xn)/nA(m)vA(m)vμ=mN(m,1)μmvA(m)mv0μ=0

vμmμ=m0.05.mμ=m0.0210.98


โปรดอ่านสิ่งนี้เนื่องจากค่า p ไม่สามารถตีความได้ว่าเป็นระดับการทดสอบที่เล็กที่สุดเพื่อปฏิเสธ null "มันแสดงให้เห็นแล้วว่าการตีความค่า p ในการทดลองเดี่ยว (หรือต่อเนื่อง) ไม่ได้รับอนุญาตในบริบทการทดสอบสมมติฐาน Neyman - Pearson การคำนวณค่า ap ขึ้นอยู่กับความจริงของสมมติฐานว่างเท่านั้นค่า p ไม่ได้วัด จำนวนหลักฐานสนับสนุน HA มันเป็นตัวชี้วัดของหลักฐานอุปนัยต่อ H0 " 'ที่มา: ftp.stat.duke.edu/WorkingPapers/03-26.pdf
sree22

@ sree22 คุณสามารถขยายในเรื่องนี้หรือแนะนำ rewording? ฉันพยายามที่จะให้คำจำกัดความของ p-value ในบริบทนี้ไม่ใช่การตีความ
DavidR

3

'นักเรียน' แย้งกันในช่วงความมั่นใจโดยมีเหตุผลว่าพวกเขาสามารถแสดงให้เห็นว่าเอฟเฟกต์ใดมีความสำคัญมากกว่าและที่สำคัญกว่านี้

ตัวอย่างเช่นหากคุณพบสองเอฟเฟกต์ที่ช่วงแรกมีช่วงความมั่นใจสำหรับผลกระทบทางการเงินจาก£ 5 ถึง£ 6 ในขณะที่วินาทีนั้นมีช่วงความเชื่อมั่นตั้งแต่ 200 ถึง 2800 ปอนด์ อันแรกมีความสำคัญทางสถิติมากกว่า แต่ข้อที่สองน่าจะสำคัญกว่า

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.