ในขณะที่เรียนหลักสูตรสถิติของฉันฉันพยายามเข้าใจความแตกต่างระหว่างการทดสอบสมมติฐานแบบหนึ่งด้านและสองด้าน ทำไมการทดสอบแบบด้านเดียวจึงปฏิเสธค่า null ในขณะที่แบบทดสอบแบบสองด้านไม่ได้
ตัวอย่าง:
ในขณะที่เรียนหลักสูตรสถิติของฉันฉันพยายามเข้าใจความแตกต่างระหว่างการทดสอบสมมติฐานแบบหนึ่งด้านและสองด้าน ทำไมการทดสอบแบบด้านเดียวจึงปฏิเสธค่า null ในขณะที่แบบทดสอบแบบสองด้านไม่ได้
ตัวอย่าง:
คำตอบ:
การทดสอบการทดสอบสองแบบสำหรับความแตกต่างในทิศทางใดทิศทางหนึ่ง ดังนั้นค่า P จะเป็นพื้นที่ภายใต้การแจกแจง t ทางด้านขวาของ t = 1.92 บวกพื้นที่ภายใต้การกระจายทางด้านซ้ายของ t = -1.92 นั่นคือพื้นที่สองเท่าของการทดสอบแบบด้านเดียวและค่า P มีขนาดใหญ่เป็นสองเท่า
หากคุณใช้การทดสอบแบบ tailed หนึ่งครั้งคุณจะได้รับพลังงาน แต่ในค่าใช้จ่ายที่เป็นไปได้ที่จะต้องละเว้นความแตกต่างที่อยู่ในทิศทางตรงกันข้ามกับสมมติฐานนั้นก่อนที่จะได้รับข้อมูล หากคุณได้รับข้อมูลก่อนที่จะทำเป็นทางการและบันทึกสมมติฐานคุณควรใช้การทดสอบสองแบบ ในทำนองเดียวกันหากคุณสนใจผลกระทบในทิศทางใดทิศทางหนึ่งคุณต้องใช้การทดสอบสองแบบ ในความเป็นจริงคุณอาจต้องการใช้การทดสอบแบบสองด้านเป็นแนวทางเริ่มต้นของคุณและใช้การทดสอบแบบด้านเดียวในกรณีที่ผิดปกติซึ่งมีเอฟเฟกต์สามารถอยู่ในทิศทางเดียวเท่านั้น
พื้นที่ใต้เส้นโค้งไม่ใหญ่เป็นสองเท่าสำหรับการทดสอบแบบสองด้าน: สำหรับการทดสอบแบบสองด้านที่มีความสำคัญ p = .05 คุณกำลังทดสอบความถี่ที่ข้อมูลที่สังเกตได้สามารถดึงได้จากการกระจายแบบโมฆะตอนบนหรือล่าง 2.5% ( ทั้งหมด. 05 ด้วยการทดสอบแบบ 1 ด้านคุณจะทำการทดสอบความถี่ที่ข้อมูลจะมาจากส่วนท้าย 5% ของส่วนท้าย (หนึ่งที่ระบุไว้ล่วงหน้า)
คำตอบสำหรับคำถามของคุณส่วนหนึ่งเป็นแบบฝึกหัด: นักวิจัยส่วนใหญ่มองการทดลองที่รายงานการทดสอบแบบ 1 ด้านซึ่งไม่น่าจะทำซ้ำ (เช่นพวกเขาคิดว่านักวิจัยเลือกสิ่งนี้
อย่างไรก็ตามมีกรณีการใช้ที่ถูกต้อง หากคุณรู้ว่าผลลัพธ์ใด ๆ ในทิศทางตรงกันข้ามนั้นเป็นไปไม่ได้ภายใต้ทฤษฎีที่กำลังทดสอบดังนั้นจากความคิดเห็นก่อนหน้านี้ที่ระบุไว้คุณสามารถระบุล่วงหน้าได้และทำการทดสอบแบบ 1 ด้าน คนส่วนใหญ่อีกครั้งจะยังคงดูอย่างรอบคอบ
เหตุผลของความแตกต่างคือ "ซ่อน" ในสถิติทดสอบที่ใช้สำหรับการทดสอบแต่ละครั้ง โปรดทราบว่าสำหรับการทดสอบสมมติฐานคุณเลือกสถิติ (เช่นฟังก์ชันของข้อมูล) เพื่อทดสอบ เรียกสิ่งนี้สถิติ(D) นอกจากนี้คุณยังต้องใช้พื้นที่การปฏิเสธเช่นนั้นหากสถิติอยู่ในภูมิภาคเราจะปฏิเสธค่าว่าง ขณะนี้ระดับนัยสำคัญจะถูกคำนวณตามความน่าจะเป็นที่สถิติอยู่ในภูมิภาคการปฏิเสธเมื่อค่า Null เป็นจริงR R
ตอนนี้สำหรับการทดสอบสองด้านสถิติการทดสอบคือกับภูมิภาคปฏิเสธโดยที่ถูกเลือกเพื่อให้ได้ความสำคัญซึ่งเป็น 5% ในกรณีของคุณ สำหรับการทดสอบด้านเดียวสถิติทดสอบและภูมิภาคปฏิเสธเป็นสำหรับเหมาะสมได้รับการแต่งตั้ง{1} ตอนนี้เรามักจะมี{0}) ดังนั้นเพื่อที่จะประสบความสำเร็จอย่างมีนัยสำคัญเช่นเดียวกันเราจะต้องมี{1}| t | > t 0 t 0 α S ( D ) = t t > t 1 t 1 P r ( | t | > t 0 | H 0 ) ≥ P r ( t > t 0 | H 0 ) t 0 ≥ t 1
สิ่งนี้นำไปสู่คำถาม: เหตุใดจึงต้องใช้สถิติการทดสอบที่แตกต่างกัน เหตุผลก็คือทางเลือกนั้นแตกต่างกันดังนั้นพลังของสถิติการทดสอบแต่ละแบบจึงแตกต่างกัน พลังของการทดสอบแต่ละครั้งจะลดลง (หากเราใช้ความสำคัญเดียวกัน) หากเราใช้สถิติการทดสอบและภูมิภาคการปฏิเสธจากการทดสอบอื่น