การทดสอบ Signed-Rank Test ของ Wilcoxon จะดีกว่าแบบทดสอบ t-Test หรือ Sign Test อย่างไร


10

หลังจากการสนทนาบางส่วน (ด้านล่าง) ตอนนี้ฉันมีภาพที่ชัดเจนของคำถามที่มุ่งเน้นดังนั้นนี่คือคำถามที่ได้รับการแก้ไขแม้ว่าความคิดเห็นบางส่วนอาจดูเหมือนไม่เกี่ยวข้องกับคำถามเดิม

ดูเหมือนว่าการทดสอบแบบ t- มาบรรจบกันอย่างรวดเร็วสำหรับการแจกแจงแบบสมมาตรซึ่งการทดสอบแบบลงนามจะถือว่าสมมาตรและสำหรับการกระจายแบบสมมาตรนั้นไม่แตกต่างกันระหว่างค่าเฉลี่ย / pseudomedians / ค่ามัธยฐาน ถ้าเป็นเช่นนั้นภายใต้สถานการณ์ใดนักสถิติที่ไม่มีประสบการณ์ค่อนข้างจะพบว่าการทดสอบแบบมีลายเซ็นมีประโยชน์เมื่อเขา / เธอมีทั้งแบบทดสอบ t-test และทดสอบแบบลงชื่อ? หากหนึ่งในนักเรียนของฉัน (เช่นสังคมศาสตร์) กำลังพยายามทดสอบว่าการรักษาหนึ่งทำได้ดีกว่าอีกหรือไม่ (โดยการวัดที่ค่อนข้างง่ายตีความเช่นความคิดของความแตกต่าง "เฉลี่ย") ฉันกำลังดิ้นรนเพื่อหาสถานที่สำหรับการเซ็นชื่อ - การทดสอบยศแม้ว่าโดยทั่วไปแล้วดูเหมือนว่าจะได้รับการสอนและการทดสอบการลงชื่อก็ไม่สนใจในมหาวิทยาลัยของฉัน


1
Justme: แน่นอนว่าฉันไม่ได้คิดอย่างนั้น
JonB

1
มันขึ้นอยู่กับที่มีภูมิปัญญาดั้งเดิมที่คุณกำลังมองหาที่; ประสบการณ์ของฉันมันแตกต่างจากของคุณมาก แน่นอนว่ามันเป็นเรื่องง่ายที่จะหาแหล่งข้อมูลที่ระบุอย่างชัดเจนว่าสมมาตรของคะแนนความแตกต่างนั้นอยู่ภายใต้ค่าว่าง (และมันสำคัญ) แต่โปรดทราบว่าสิ่งนี้อยู่ภายใต้ค่า null - ดังนั้นการหาการขาดความสมมาตรในคะแนนที่แตกต่างในตัวอย่างจึงไม่จำเป็นต้องเกี่ยวข้อง - คุณไม่จำเป็นต้องมีความสมมาตรภายใต้ทางเลือกอื่น หากคุณมีความมั่นใจสูงว่าหากโมฆะเป็นจริงสมมาตรจะคงอยู่ - และในหลาย ๆ กรณีเป็นข้อสันนิษฐานที่น่าเชื่อถือสูง - ... ctd
Glen_b

1
ctd ... จากนั้นไม่มีปัญหา ปัญหาคือหากคุณไม่ได้เตรียมที่จะคิดไว้ล่วงหน้าคุณไม่ทราบว่าการปฏิเสธเกิดจากความล้มเหลวในการสันนิษฐานหรือไม่ สิ่งที่ชัดเจนที่ต้องทำก็คือไม่คิดเอาเอง
Glen_b -Reinstate Monica

2
ดูความคิดเห็นที่สองของคุณก่อน: (ด้านบนของสิ่งที่คุณพูดถึงแล้ว) โปรดทราบว่า 1. สมมติฐานปกติไม่หมดการทดสอบพาราเมตริก 2. การทดสอบระดับที่ได้รับการรับรองไม่ใช่การทดสอบของคนกลาง แต่จากสถิติ / pseudomedians ของ Hodges-Lehmann ตัวอย่างหนึ่ง (แม้ว่าคุณจะเพิ่มสมมติฐานของสมมาตรให้กับทางเลือกอื่น) มันก็จะทดสอบหาคน ๆ หนึ่งด้วย สำหรับวิธีอื่น ๆ อีกมากมาย) ในทำนองเดียวกันการทดสอบผลรวมอันดับไม่ใช่การทดสอบของค่ามัธยฐาน คุณพูดถูกว่าระดับการทดสอบยศเซ็นชื่อนั้นค่อนข้างอ่อนไหวต่อความไม่สมมาตร
Glen_b -Reinstate Monica

2
ในความคิดเห็นก่อนหน้าของคุณ: 1 สมมาตรไม่ได้ถูกมองว่าเป็นส่วนหนึ่งของ null แต่เป็นส่วนหนึ่งของสมมติฐานที่คุณต้องการเพื่อให้การเปลี่ยนลำดับสามารถแลกเปลี่ยนภายใต้ null ได้ 2. ดังที่ได้กล่าวไปแล้วจริง ๆ แล้วไม่ใช่การทดสอบของคนกลาง แต่เป็นของเทียมหลอกและสิ่งนี้ถือเป็นจริงแม้ภายใต้ทางเลือกที่ไม่สมมาตร มันเป็นความจริงที่การตีความบางครั้งง่ายกว่าถ้าคุณทำข้อ จำกัด ที่เข้มงวด แต่ข้อ จำกัด ที่จำเป็นเพื่อให้การทดสอบที่สมเหตุสมผลสำหรับผู้ใช้ไม่จำเป็นต้องเข้มงวดเท่าการสมมติว่าสมมาตรภายใต้ทางเลือก
Glen_b -Reinstate Monica

คำตอบ:


3

พิจารณาการกระจายตัวของความแตกต่างของคู่ที่ค่อนข้างหนักกว่าปกติ แต่ไม่มากโดยเฉพาะ "ยอด" ดังนั้นบ่อยครั้งที่การทดสอบระดับที่มีลายเซ็นจะมีประสิทธิภาพมากกว่าแบบทดสอบ t แต่ก็มีประสิทธิภาพมากกว่าแบบทดสอบเครื่องหมาย

ยกตัวอย่างเช่นที่การกระจายโลจิสติกส์, asymptotic ญาติประสิทธิภาพของการทดสอบยศที่ลงนามเมื่อเทียบกับ t-test คือ 1.097 ดังนั้นการทดสอบยศที่ลงนามควรมีประสิทธิภาพมากกว่า t (อย่างน้อยในกลุ่มตัวอย่างขนาดใหญ่) แต่ประสิทธิภาพเชิงสัมพัทธ์ asymptotic ของการทดสอบเครื่องหมายเทียบกับ t-test คือ 0.822 ดังนั้นการทดสอบเครื่องหมายจะมีประสิทธิภาพน้อยกว่า t (อีกครั้งอย่างน้อยในกลุ่มตัวอย่างขนาดใหญ่)

ในขณะที่เราย้ายไปยังการแจกแจงแบบเทลด์ที่หนักกว่า (ในขณะที่ยังคงหลีกเลี่ยงค่าสูงสุดที่มากเกินไป), t จะมีแนวโน้มที่จะทำงานค่อนข้างแย่ลงในขณะที่การทดสอบการลงชื่อควรปรับปรุงบ้าง ผลกระทบจากระยะขอบที่มาก (เช่นต้องใช้ขนาดตัวอย่างที่เล็กกว่ามากเพื่อตรวจจับผลกระทบ) จะมีชั้นเรียนขนาดใหญ่ของการแจกแจงซึ่งการทดสอบการจัดอันดับที่ดีที่สุดในสามแบบทดสอบ

นี่คือตัวอย่างหนึ่ง - การกระจายกำลังไฟฟ้าถูกจำลองที่ n = 100 สำหรับการทดสอบสามครั้งสำหรับระดับนัยสำคัญ 5% อำนาจสำหรับการทดสอบทำเครื่องหมายเป็นสีดำสำหรับตำแหน่ง Wilcoxon ที่ลงนามเป็นสีแดงและการทดสอบเครื่องหมายถูกทำเครื่องหมายเป็นสีเขียว ระดับความสำคัญที่มีอยู่ของการทดสอบเครื่องหมายไม่รวมถึงโดยเฉพาะอย่างยิ่งใกล้ 5% ดังนั้นในกรณีนั้นการทดสอบแบบสุ่มถูกนำมาใช้เพื่อเข้าใกล้ระดับความสำคัญที่เหมาะสม แกน x คือพารามิเตอร์ซึ่งแสดงถึงการเปลี่ยนแปลงจากเคสว่าง (การทดสอบมีทั้งสองด้านดังนั้นกราฟพลังงานที่แท้จริงจะสมมาตรประมาณ 0) t δเสื้อ3เสื้อδ

พล็อตของเส้นโค้งกำลังไฟฟ้าสำหรับ t, Wilcoxon ลงนามการจัดอันดับและการทดสอบการลงชื่อด้วย n = 100 และระดับนัยสำคัญ 5% สำหรับ t3

ดังที่เราเห็นในพล็อตการทดสอบยศที่ลงลายมือชื่อมีอำนาจมากกว่าการทดสอบเครื่องหมายซึ่งในทางกลับกันจะมีพลังมากกว่าการทดสอบที


ขอบคุณมากสำหรับ @Glen_b นี้! ฉันยังคงดิ้นรนที่จะทำงานในที่ที่เหมาะกับหลักสูตรของเราเมื่อเรามีนักเรียนที่แม้แต่แนวคิดเรื่องอำนาจอยู่นอกเหนือขอบเขตของการศึกษาของพวกเขาและทำไมเราจึงสอน Wilcoxon เป็นทางเลือกหลักสำหรับคู่ แต่นี่เป็นแรงจูงใจที่มีประโยชน์ ขอบคุณ!
justme

บังเอิญหลังจากพิจารณาว่าคุณลักษณะการกระจายตัวมีผลต่อความแปรปรวนแบบซีโมติคของค่ามัธยฐาน (และด้วยเหตุนี้พลังของการทดสอบเครื่องหมาย) ตัวอย่างหนึ่งเกิดขึ้นกับฉันเมื่อตำแหน่งสัมพัทธ์ของการทดสอบ t และเครื่องหมายกลับด้าน ด้วยเหตุนี้ฉันคิดว่ามีความเป็นไปได้ที่ดีในการสร้างกรณีที่การทดสอบยศที่เซ็นชื่ออาจทำได้ดีกว่าการทดสอบอื่นอีกสองแบบ ฉันจะเล่นกับมันมากขึ้นเมื่อฉันสามารถและอาจจะเขียนอะไรบางอย่างลงไป
Glen_b -Reinstate Monica

เท่าที่หลักสูตรของคุณดำเนินไปเป็นที่แน่ชัดว่ามีบางกรณีที่ตำแหน่งที่เซ็นชื่อมีประสิทธิภาพสูงกว่าการทดสอบอื่น ๆ ทั้งสอง (ตามที่ระบุไว้ในคำตอบของฉัน - การแจกแจงที่ค่อนข้างหนักกว่าปกติ แต่ไม่แหลมโดยเฉพาะ) t ดีกว่าปกติหรือเบากว่าและการทดสอบเครื่องหมายดีกว่าเมื่อการกระจายมีจุดสูงสุด (ซึ่งมักจะมีหางที่หนักมาก แต่ไม่จำเป็นต้อง) [ระวังอย่างไรให้สับสนความคิดเหล่านี้กับการเปลี่ยนแปลงในการแพร่กระจายซึ่งไม่ได้เปลี่ยนคุณสมบัติญาติของพวกเขา] ... ฉันแน่ใจว่าคุณสามารถบีบประโยคดังกล่าวไม่กี่ใน
Glen_b

ขอบคุณมาก @Glen_b! ปัญหาคือฉันไม่ได้สอนหลักสูตรเพียงแค่สนับสนุนมัน! หลักสูตรในแผนกส่วนใหญ่ดูเหมือนจะ: (i) ใช้การทดสอบสมมติฐานของภาวะปกติ (ฆ่าฉันตอนนี้) และจากนั้น (ii) ใช้ Wilcoxon หรือ t-Test ดังนั้นรายละเอียดที่ละเอียดยิ่งขึ้นเกี่ยวกับไหล่ของการกระจาย ฯลฯ จะไม่แตะต้องแม้แต่น้อยและไม่มีอำนาจไม่ว่าจะเป็นไปตามสมมติฐาน (ในลักษณะขยะเล็กน้อย) แต่ความคิดของคุณมีประโยชน์มากสำหรับฉันอย่างน้อยที่สุด!
justme

โพสต์ที่ยอดเยี่ยม @Glen_b! ดังนั้นในการเลือกจากการทดสอบทั้งสองฉันสามารถสรุปได้ว่าเราควรคำนวณพลังงานก่อนเสมอหรือไม่? แทนที่จะทำตามสมมติฐานที่ใช้การทดสอบการเข้าสู่ระบบเสมอหากการกระจายความแตกต่างไม่ปกติ ขอบคุณ!
Lumos
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.