ช่วงความมั่นใจแคบ ๆ เกี่ยวกับผลกระทบที่ไม่สำคัญสามารถแสดงหลักฐานว่าเป็นโมฆะ


9

เห็นได้ชัดว่าผิดพลาดที่จะคิดว่าความล้มเหลวในการปฏิเสธโมฆะก็หมายความว่าเป็นโมฆะ แต่ในกรณีที่เป็นโมฆะไม่ได้ปฏิเสธและช่วงความเชื่อมั่นที่สอดคล้องกัน (CI) เป็นที่แคบและแน่นิ่ง 0 นี้ไม่ได้ให้หลักฐานสำหรับโมฆะ?

ฉันเป็นคนหนึ่งในใจสองคน: ใช่ในทางปฏิบัติสิ่งนี้จะแสดงหลักฐานว่าผลกระทบมีมากหรือน้อยกว่า 0 อย่างไรก็ตามในกรอบการทดสอบสมมุติฐานที่เข้มงวด ดังนั้นความหมายของ CI คืออะไรเมื่อการประเมินจุดของมันไม่สำคัญ? มันยังใช้ไม่ได้สำหรับการอนุมานหรือสามารถนำมาใช้ในตัวอย่างก่อนหน้านี้เพื่อหาปริมาณหลักฐานสำหรับโมฆะ?

สนับสนุนคำตอบที่มีการอ้างอิงเชิงวิชาการ


คุณอาจจะสนใจในการทดสอบความเท่าเทียมกันและคำถามเกี่ยวกับเว็บไซต์ที่ให้รายละเอียด ดูวิธีทดสอบสมมติฐานที่ไม่มีความแตกต่างของกลุ่มได้อย่างไร ตัวอย่างหนึ่ง
Andy W

1
หากคุณหมายถึงหลักฐานที่ชี้ว่าเป็นโมฆะเมื่อเทียบกับทางเลือกอื่น ... จากนั้นไม่ จำนวนทางเลือกที่ไม่สิ้นสุดนับไม่ถ้วนระหว่างค่าที่สังเกตได้น้อยมากและค่า Null จะยังคงมีแนวโน้มมากกว่าค่า Null หากคุณหมายถึงอย่างอื่นบางทีในบางสถานการณ์
Glen_b -Reinstate Monica

ใช่แล้วมันจะเป็นเรื่องของการทดสอบที่เทียบเท่าคำที่ฉันยังไม่เคยได้ยิน
ATJ

คำตอบ:


6

ในระยะสั้น: ใช่

ดังที่ Andy W เขียนไว้การสรุปว่าพารามิเตอร์เท่ากับค่าที่ระบุ (ในกรณีของคุณขนาดผลกระทบเท่ากับศูนย์) เป็นเรื่องของการทดสอบความเท่าเทียมกัน

ในกรณีของคุณช่วงเวลาความเชื่อมั่นที่แคบลงนี้ในความเป็นจริงอาจบ่งบอกว่าผลกระทบนั้นเป็นศูนย์จริงซึ่งหมายความว่าสมมติฐานว่างของความเท่าเทียมอาจถูกปฏิเสธ นัยสำคัญที่เทียบเท่าที่1αระดับมักจะแสดงโดยสามัญ 12α- ช่วงความมั่นใจที่ตั้งอยู่อย่างสมบูรณ์ภายในช่วงเวลาที่เท่าเทียมกันที่กำหนดไว้ล่วงหน้า ช่วงเวลาที่เท่าเทียมกันนี้คำนึงถึงว่าคุณสามารถเพิกเฉยต่อความเบี่ยงเบนเล็ก ๆ ได้จริงนั่นคือขนาดเอฟเฟกต์ทั้งหมดภายในช่วงเวลาที่เท่าเทียมกันนี้จะถูกพิจารณาว่าเทียบเท่ากันจริง (การทดสอบทางสถิติของความเท่าเทียมกันเป็นไปไม่ได้)

โปรดดูสเตฟานเวลค์เรื่อง "การทดสอบสมมติฐานทางสถิติของความเท่าเทียมและความไม่เสื่อม" สำหรับการอ่านเพิ่มเติมซึ่งเป็นหนังสือที่ครอบคลุมที่สุดในเรื่องนี้


2

สมมุติฐานว่างเปล่าเป็นตัวอย่างของความหมายของ"แบบจำลองทั้งหมดผิด แต่บางส่วนก็มีประโยชน์" พวกมันอาจมีประโยชน์มากที่สุดหากไม่ได้ถูกนำมาใช้อย่างแท้จริงและไม่อยู่ในบริบท - นั่นคือสิ่งสำคัญที่ต้องจำจุดประสงค์ของการ epistemic ของค่า Null หากสามารถปลอมแปลงได้ซึ่งเป็นวัตถุประสงค์ที่ตั้งใจไว้ทางเลือกนั้นมีประโยชน์มากขึ้นโดยการเปรียบเทียบแม้ว่าจะยังไม่มีความรู้ หากคุณปฏิเสธโมฆะคุณกำลังบอกว่าผลกระทบอาจไม่เป็นศูนย์ (หรืออะไรก็ตาม - สมมติฐานว่างสามารถระบุค่าอื่น ๆ สำหรับการปลอมแปลงได้เช่นกัน) ... แล้วมันจะเป็นอย่างไร?

ขนาดผลกระทบที่คุณคำนวณคือการประมาณจุดที่ดีที่สุดของพารามิเตอร์ประชากร โดยทั่วไปแล้วโอกาสที่ควรจะดีเท่า ๆ กันคือการประเมินค่าสูงไปหรือต่ำไป แต่โอกาสที่มันจะเป็นศูนย์บูลส์ตานั้นมีน้อยมากเนื่องจากความคิดเห็นของ @ Glen_b บ่งบอกถึง ถ้ามีโชคชะตาที่แปลกประหลาด (หรือจากการก่อสร้าง - ไม่ทางใดก็ทางหนึ่งฉันคิดว่าเรากำลังพูดถึงสมมุติฐาน?) การประเมินของคุณตรงไปตรงมา0.0¯นี่ยังไม่เป็นหลักฐานมากนักว่าพารามิเตอร์นั้นไม่แตกต่างกันในช่วงความเชื่อมั่น ความหมายของช่วงความเชื่อมั่นจะไม่เปลี่ยนแปลงตามความสำคัญของการทดสอบสมมติฐานใด ๆ ยกเว้นมากเท่าที่จะเปลี่ยนตำแหน่งและความกว้างในลักษณะที่เกี่ยวข้อง

ในกรณีที่คุณไม่คุ้นเคยกับการคาดการณ์ขนาดลักษณะพิเศษของตัวอย่างจากประชากร (จำลอง) ที่สมมติฐานว่างเป็นจริง (หรือในกรณีที่คุณยังไม่เห็นมันและอยู่ที่นี่เพื่อความบันเทิงทางสถิติเล็กน้อย ) ตรวจสอบการเต้นรำของเจฟฟ์คัมมิงpค่า ในกรณีที่ช่วงความมั่นใจนั้นไม่แคบพอสำหรับรสนิยมของคุณฉันพยายามจำลองของตัวเองใน R โดยใช้ตัวอย่างที่สร้างแบบสุ่มเพียงแค่ขี้อายn=1M แต่ละจาก N(0,1). ฉันลืมที่จะตั้งค่าเมล็ดพันธุ์ แต่ตั้งค่าx=c()แล้ววิ่งx=append(x,replicate(500,cor(rnorm(999999),rnorm(999999))))หลายต่อหลายครั้งที่ฉันใส่ใจก่อนที่จะจบคำตอบนี้ซึ่งทำให้ฉันตัวอย่าง 6,000 ตัวอย่างในที่สุด นี่คือฮิสโตแกรมและพล็อตความหนาแน่นที่ใช้hist(x,n=length(x)/100)และplot(density(x))ตามลำดับ:

    

อย่างที่คาดไว้มีหลักฐานว่ามีผลกระทบที่ไม่ใช่ศูนย์ที่หลากหลายจากกลุ่มตัวอย่างแบบสุ่มของประชากรที่มีผลเป็นศูนย์อย่างแท้จริงและการประมาณการเหล่านี้กระจายโดยทั่วไปมากหรือน้อยรอบพารามิเตอร์จริง ( skew(x)= -.005, kurtosis(x)= 2.85) ลองนึกภาพคุณเท่านั้นที่รู้คุณค่าของการประมาณของคุณจากตัวอย่างn=1Mไม่ใช่พารามิเตอร์ที่แท้จริง: ทำไมคุณคาดหวังว่าพารามิเตอร์จะใกล้เคียงกับศูนย์มากกว่าที่คุณคาดการณ์ไว้แทนที่จะเป็นต่อไป ช่วงความมั่นใจของคุณอาจมีค่าเป็นโมฆะ แต่ค่า null นั้นไม่น่าเชื่อถือมากกว่าค่าของระยะทางเทียบเท่าจากขนาดเอฟเฟกต์ตัวอย่างในทิศทางตรงกันข้ามและค่าอื่น ๆ อาจมีความน่าเชื่อถือมากกว่านั้นโดยเฉพาะอย่างยิ่งจุดประเมินของคุณ!

หากในทางปฏิบัติคุณต้องการแสดงให้เห็นว่าเอฟเฟกต์มีค่ามากกว่าหรือน้อยกว่านั้นคุณต้องกำหนดว่าคุณจะเพิกเฉยต่อความสนใจมากหรือน้อยเพียงใด ด้วยตัวอย่างขนาดใหญ่เหล่านี้ที่ฉันจำลองขึ้นมาการประมาณขนาดที่ใหญ่ที่สุดที่ฉันสร้างขึ้นคือ|r|=.004. ด้วยตัวอย่างที่สมจริงมากขึ้นn=999ที่ใหญ่ที่สุดที่ฉันเจอในหมู่ 1M ตัวอย่างคือ |r|=.14. ส่วนที่เหลือจะกระจายตามปกติดังนั้นสิ่งเหล่านี้ไม่น่าเป็นไปได้ แต่ประเด็นก็คือพวกมันไม่น่าเชื่อ

CI น่าจะมีประโยชน์สำหรับการอนุมานมากกว่า NHST โดยทั่วไป ไม่เพียง แต่แสดงให้เห็นว่าความคิดที่ไม่ดีอาจเป็นไปได้ที่จะสมมติว่าพารามิเตอร์นั้นมีขนาดเล็กมาก มันแสดงให้เห็นถึงความคิดที่ดีว่าพารามิเตอร์คืออะไร เรายังคงสามารถตัดสินใจได้ว่าสิ่งนี้จะเล็กน้อยหรือไม่ แต่ยังสามารถรับรู้ได้ว่ามันไม่สำคัญเพียงใด สำหรับการสนับสนุนต่อไปของช่วงความเชื่อมั่นให้ดูคัมมิง(2014 , 2013)

การอ้างอิง
- คัมมิง, กรัม (2013) ทำความเข้าใจเกี่ยวกับสถิติใหม่: ขนาดผลช่วงความเชื่อมั่นและ meta-analysis เลดจ์
- คัมมิง, กรัม (2014) สถิติใหม่: ทำไมและอย่างไร วิทยาศาสตร์จิตวิทยา, 25 (7), 7–29 แปลจากhttp://pss.sagepub.com/content/25/1/7.full.pdf+html


ขอบคุณฉันคุ้นเคยอย่างมากกับงานของคัมมิง ฉันคิดว่าคำถามของฉันมีมากขึ้นตามแนวของ "ถ้าจุด ES ประมาณนั้นไม่มีนัยสำคัญแล้ว CIs สามารถใช้สำหรับการอนุมานได้หรือไม่ (หรือพวกเขา 'โมฆะ' คือไร้ประโยชน์ตามการประมาณจุด)"
ATJ

1
@ATJ: ไม่ใช่การประมาณจุดหรือ (1α) ช่วงความมั่นใจสำหรับพารามิเตอร์กลายเป็น "ไร้ประโยชน์" เมื่อไม่แตกต่างจากศูนย์อย่างมีนัยสำคัญ (ที่ระดับ α) หรือมีค่าศูนย์ตามลำดับ
Scortchi - Reinstate Monica

@ATJ: ดังที่ฉันพูดความหมาย [/ ยูทิลิตี้] ของ CI ไม่เปลี่ยนแปลงตามความสำคัญของ NHST ใด ๆ CI อาจมีประโยชน์มากกว่าสำหรับการอนุมานมากกว่า NHST โดยทั่วไป ... แสดงถึงความคิดที่ดีว่าพารามิเตอร์คืออะไร เช่นฉันเพิ่งวิ่งcor.test(rnorm(9999999),rnorm(9999999))และได้ CI{0.00063,0.00060}. ดังนั้นฉันสรุปว่าเมื่อฉันเรียกใช้อีกครั้งฉันมี 95% น่าจะได้รับการประมาณการใหม่ภายในช่วงนั้น รันอีกครั้งประมาณการของฉันคือr=0.00029; การอนุมานจาก CI ของฉันถูกต้อง! โมฆะที่จะเกิดขึ้นจากการก่อสร้าง แต่มีหลักฐานของฉันจะสนับสนุนการประมาณการของฉันแทน ...
นิค Stauner
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.