การทดสอบการเปลี่ยนรูป: เกณฑ์การเลือกสถิติการทดสอบ

ฉันใช้การทดสอบการเปลี่ยนแปลงอย่างสม่ำเสมอและชอบความเรียบง่ายของมัน ฉันได้เรียนรู้มากที่สุดจากหนังสือ "วิธีการ Resampling" โดย Good ซึ่งผู้แต่งดูเหมือนว่าจะมีความคิดสร้างสรรค์ในการเลือกสถิติการทดสอบของเขาตลอดตัวอย่าง นอกจากนี้โพสต์นี้ให้ความประทับใจว่ามีอิสระอย่างมากในการเลือกสถิติทดสอบ

ฉันทำไม่น่าแปลกใจหากมีความต้องการทฤษฎีสถิติทดสอบควรปฏิบัติตาม หรือเราสามารถใช้สถิติใดก็ได้ตราบใดที่มันสมเหตุสมผลและมีอัตราความผิดพลาด Type I / II ที่ดี?

ตัวอย่างเช่นเมื่อมีการใช้การทดสอบการเปลี่ยนรูปแทน t-test เนื่องจากประชากรที่ไม่ปกติฉันได้เห็นหลายครั้งที่การทดสอบการเปลี่ยนแปลงทาง p-value ยังคงได้รับจากสถิติ t แม้ว่าไม่จำเป็นต้องผิด แต่ดูเหมือนเป็นทางเลือกแปลก ๆ ที่ให้กำเนิดการกระจายตัวของนักเรียน

hypothesis-testing permutation-test

— LGBI
แหล่งที่มา

สถิติ t-สมเหตุสมผลมากในฐานะสถิติทดสอบ หลายคนพบว่าใช้งานง่าย ถ้าฉันอ้างอิงค่าสถิติของ 0.5 หรือ 5.5 มันจะบอกคุณบางอย่างว่ามีข้อผิดพลาดมาตรฐานแตกต่างจากค่าเฉลี่ยอย่างไร

ความยากลำบาก - อย่างน้อยกับการไม่เป็นมาตรฐานปานกลาง - ไม่มากนักเมื่อใช้สถิติเหมือนกับการใช้การแจกแจงแบบ tสำหรับการแจกแจงภายใต้ค่า null สถิติค่อนข้างสมเหตุสมผล

แน่นอนถ้าคุณคาดหวังว่าหางที่หนักกว่าปกติอย่างมากสถิติที่แข็งแกร่งจะทำได้ดีกว่า แต่สถิติของ t- ไม่ไวสูงมากต่อการเบี่ยงเบนเล็กน้อยจากภาวะปกติ (ตัวอย่างเช่นมันจะน้อยกว่าค่าสถิติแปรปรวนอัตราส่วน)

ถ้าคุณต้องการใช้แค่ตัวเศษของสถิติมันยอดเยี่ยมมากมันทำให้รู้สึกว่าเป็นสถิติที่เปลี่ยนแปลงได้อย่างสมบูรณ์แบบหากคุณสนใจวิธีที่ต่างกัน หากคุณสนใจที่จะทราบถึงการเปลี่ยนแปลงสถานที่โดยทั่วไปมันจะเปิดโอกาสให้คุณได้มากมาย

คุณถูกต้องที่จะคิดว่ามีอิสระมากมายในการเลือกสถิติและปรับให้เข้ากับสถานการณ์เฉพาะ - ทางเลือกใดที่คุณต้องการให้มีอำนาจหรือปัญหาที่เป็นไปได้ที่คุณต้องการให้มีประสิทธิภาพ (การปนเปื้อนเช่นสามารถ พลังงานกระแทก)

แทบไม่มีข้อ จำกัด คุณสามารถเลือกเกือบทุกอย่างรวมถึงสถิติการทดสอบที่ไร้ประโยชน์ มีข้อควรพิจารณาบางประการที่คุณควรคำนึงถึงเมื่อเลือกการทดสอบแน่นอน แต่คุณไม่ต้องสนใจ

ที่กล่าวว่ามีเกณฑ์บางอย่างที่สามารถนำไปใช้ในสถานการณ์ต่าง ๆ

ตัวอย่างเช่นหากคุณสนใจสมมติฐานชนิดใดประเภทหนึ่งเป็นพิเศษคุณสามารถใช้สถิติที่สะท้อนถึงตัวอย่างเช่นหากคุณต้องการทดสอบความแตกต่างของค่าเฉลี่ยของประชากรมันมักจะทำให้รู้สึกถึงสถิติการทดสอบของคุณ เกี่ยวข้องกับความแตกต่างในค่าเฉลี่ยตัวอย่าง

หากคุณรู้บางอย่างเกี่ยวกับการกระจายชนิดที่คุณอาจมี - หางหนาหรือเอียงหรือมีน้ำหนักเบา แต่มีการปนเปื้อนหรือ bimodal ในระดับหนึ่ง ... คุณสามารถกำหนดสถิติการทดสอบที่ทำได้ดีในสถานการณ์เช่นนี้ ตัวอย่างเช่นการเลือกสถิติที่ควรทำงานได้ดีในสถานการณ์ที่คาดการณ์ไว้ แต่มีความทนทานต่อการปนเปื้อน

การจำลองเป็นวิธีหนึ่งในการตรวจสอบอำนาจภายใต้สถานการณ์ต่าง ๆ

— Glen_b -Reinstate Monica
แหล่งที่มา