ความแตกต่างระหว่างการทดสอบแบบทางเดียวและแบบสองด้านใช่หรือไม่


13

ในขณะที่เรียนหลักสูตรสถิติของฉันฉันพยายามเข้าใจความแตกต่างระหว่างการทดสอบสมมติฐานแบบหนึ่งด้านและสองด้าน ทำไมการทดสอบแบบด้านเดียวจึงปฏิเสธค่า null ในขณะที่แบบทดสอบแบบสองด้านไม่ได้

ตัวอย่าง:

ความแตกต่างระหว่างการทดสอบสมมติฐานแบบหนึ่งด้านและสองด้าน


โปรดทราบว่าคุณปฏิเสธในระดับนัยสำคัญที่ระบุเท่านั้น คุณยังสามารถปฏิเสธสมมติฐานทั้งสองโดยเพิ่มระดับนัยสำคัญเป็น 10% คุณจะไม่ปฏิเสธทั้งสองอย่างหากคุณลดระดับนัยสำคัญเป็น 1%
ความน่าจะเป็นทางการ

คำตอบ:


11

การทดสอบการทดสอบสองแบบสำหรับความแตกต่างในทิศทางใดทิศทางหนึ่ง ดังนั้นค่า P จะเป็นพื้นที่ภายใต้การแจกแจง t ทางด้านขวาของ t = 1.92 บวกพื้นที่ภายใต้การกระจายทางด้านซ้ายของ t = -1.92 นั่นคือพื้นที่สองเท่าของการทดสอบแบบด้านเดียวและค่า P มีขนาดใหญ่เป็นสองเท่า

หากคุณใช้การทดสอบแบบ tailed หนึ่งครั้งคุณจะได้รับพลังงาน แต่ในค่าใช้จ่ายที่เป็นไปได้ที่จะต้องละเว้นความแตกต่างที่อยู่ในทิศทางตรงกันข้ามกับสมมติฐานนั้นก่อนที่จะได้รับข้อมูล หากคุณได้รับข้อมูลก่อนที่จะทำเป็นทางการและบันทึกสมมติฐานคุณควรใช้การทดสอบสองแบบ ในทำนองเดียวกันหากคุณสนใจผลกระทบในทิศทางใดทิศทางหนึ่งคุณต้องใช้การทดสอบสองแบบ ในความเป็นจริงคุณอาจต้องการใช้การทดสอบแบบสองด้านเป็นแนวทางเริ่มต้นของคุณและใช้การทดสอบแบบด้านเดียวในกรณีที่ผิดปกติซึ่งมีเอฟเฟกต์สามารถอยู่ในทิศทางเดียวเท่านั้น


ขอบคุณสำหรับความคิดเห็นของคุณไมเคิล นี่คือสิ่งที่ฉันไม่เข้าใจ: พื้นที่ใต้เส้นโค้งจะใหญ่เป็นสองเท่าสำหรับการทดสอบแบบสองด้านได้อย่างไร ไม่ควร P เหมือนกันในทั้งสองกรณีเนื่องจาก alpha = 0.05
Lu Ci

อัลฟาในคำถามของคุณเป็นเพียงทางลัดของคุณสำหรับการตัดสินใจเกี่ยวกับความหมายของ p (ปฏิเสธโมฆะหรือไม่) ดังนั้นมันจึงไม่มีผลต่อค่าของ p คืออะไร
John

บิตจู้จี้จุกจิก แต่ความคิดที่คุณต้องเลือกสมมติฐานก่อนที่จะเห็นข้อมูลไม่จำเป็น คุณสามารถทำการทดสอบสองด้านได้สองแบบ คุณจะปฏิเสธทิศทางที่ข้อมูลไม่ได้รับความนิยม ดังนั้นจึงเหมาะสมที่จะไปกับการทดสอบด้านเดียวซึ่งเป็นที่ชื่นชอบโดยข้อมูล
ความน่าจะเป็นทางการที่

1
@probabilityislogic- ฉันเห็นด้วยอย่างสิ้นเชิงยกเว้นเมื่อใครต้องการค่าอัลฟาเพื่อสะท้อนให้เห็นถึงอัตราข้อผิดพลาดบวกเท็จในระยะยาวที่เกิดขึ้นจริง (เช่นหนึ่งต้องการใช้วิธี Neyman-Pearson) หากคุณใช้การทดสอบด้านเดียวและตัดสินใจเกี่ยวกับทิศทางของการเปลี่ยนแปลงเพื่อทดสอบตามผลของการสังเกตจากนั้นคุณจะได้รับผลบวกที่ผิดพลาดเป็นสองเท่าของระดับอัลฟาของคุณ
Michael Lew

มันเป็นเพียงอัตราข้อผิดพลาดระยะยาวสำหรับคนที่ไม่สนใจข้อมูลก่อนหน้า นี่ไม่ใช่วิธีที่ดีในการบรรลุประสิทธิภาพที่ดีในระยะยาว อัตราความผิดพลาดที่ได้รับจากความสำคัญมากกว่าชุดข้อมูลทั้งหมดที่เราจะได้สังเกตเห็นครั้งเดียว
ความน่าจะเป็นทางการที่

5

พื้นที่ใต้เส้นโค้งไม่ใหญ่เป็นสองเท่าสำหรับการทดสอบแบบสองด้าน: สำหรับการทดสอบแบบสองด้านที่มีความสำคัญ p = .05 คุณกำลังทดสอบความถี่ที่ข้อมูลที่สังเกตได้สามารถดึงได้จากการกระจายแบบโมฆะตอนบนหรือล่าง 2.5% ( ทั้งหมด. 05 ด้วยการทดสอบแบบ 1 ด้านคุณจะทำการทดสอบความถี่ที่ข้อมูลจะมาจากส่วนท้าย 5% ของส่วนท้าย (หนึ่งที่ระบุไว้ล่วงหน้า)

คำตอบสำหรับคำถามของคุณส่วนหนึ่งเป็นแบบฝึกหัด: นักวิจัยส่วนใหญ่มองการทดลองที่รายงานการทดสอบแบบ 1 ด้านซึ่งไม่น่าจะทำซ้ำ (เช่นพวกเขาคิดว่านักวิจัยเลือกสิ่งนี้

อย่างไรก็ตามมีกรณีการใช้ที่ถูกต้อง หากคุณรู้ว่าผลลัพธ์ใด ๆ ในทิศทางตรงกันข้ามนั้นเป็นไปไม่ได้ภายใต้ทฤษฎีที่กำลังทดสอบดังนั้นจากความคิดเห็นก่อนหน้านี้ที่ระบุไว้คุณสามารถระบุล่วงหน้าได้และทำการทดสอบแบบ 1 ด้าน คนส่วนใหญ่อีกครั้งจะยังคงดูอย่างรอบคอบ


1

เหตุผลของความแตกต่างคือ "ซ่อน" ในสถิติทดสอบที่ใช้สำหรับการทดสอบแต่ละครั้ง โปรดทราบว่าสำหรับการทดสอบสมมติฐานคุณเลือกสถิติ (เช่นฟังก์ชันของข้อมูล) เพื่อทดสอบ เรียกสิ่งนี้สถิติ(D) นอกจากนี้คุณยังต้องใช้พื้นที่การปฏิเสธเช่นนั้นหากสถิติอยู่ในภูมิภาคเราจะปฏิเสธค่าว่าง ขณะนี้ระดับนัยสำคัญจะถูกคำนวณตามความน่าจะเป็นที่สถิติอยู่ในภูมิภาคการปฏิเสธเมื่อค่า Null เป็นจริงR RS(D)RR

ตอนนี้สำหรับการทดสอบสองด้านสถิติการทดสอบคือกับภูมิภาคปฏิเสธโดยที่ถูกเลือกเพื่อให้ได้ความสำคัญซึ่งเป็น 5% ในกรณีของคุณ สำหรับการทดสอบด้านเดียวสถิติทดสอบและภูมิภาคปฏิเสธเป็นสำหรับเหมาะสมได้รับการแต่งตั้ง{1} ตอนนี้เรามักจะมี{0}) ดังนั้นเพื่อที่จะประสบความสำเร็จอย่างมีนัยสำคัญเช่นเดียวกันเราจะต้องมี{1}| t | > t 0 t 0 α S ( D ) = t t > t 1 t 1 P r ( | t | > t 0 | H 0 ) P r ( t > t 0 | H 0 ) t 0t 1S(D)=|t||t|>t0t0αS(D)=tt>t1t1Pr(|t|>t0|H0)Pr(t>t0|H0)t0t1

สิ่งนี้นำไปสู่คำถาม: เหตุใดจึงต้องใช้สถิติการทดสอบที่แตกต่างกัน เหตุผลก็คือทางเลือกนั้นแตกต่างกันดังนั้นพลังของสถิติการทดสอบแต่ละแบบจึงแตกต่างกัน พลังของการทดสอบแต่ละครั้งจะลดลง (หากเราใช้ความสำคัญเดียวกัน) หากเราใช้สถิติการทดสอบและภูมิภาคการปฏิเสธจากการทดสอบอื่น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.