จะเลือกระหว่างการทดสอบการลงชื่อกับการทดสอบการจัดอันดับของวิลคอกซันได้อย่างไร


11

ฉันพยายามเลือกหนึ่งจากการทดสอบทั้งสองนี้เพื่อวิเคราะห์ข้อมูลที่จับคู่ ไม่มีใครรู้กฎของหัวแม่มือเกี่ยวกับที่จะเลือกโดยทั่วไป?


คำตอบของ Silverfish ตรงนั้นมีอยู่ (เพิ่ง) คำถามนั้นค่อนข้างทั่วไปฉันสงสัยว่าเราจะสามารถอดทนกับคำถามที่เฉพาะเจาะจงกว่านี้ได้ไหม
Glen_b -Reinstate Monica

Sheldon - การทดสอบระดับที่ได้รับการรับรองมีข้อสันนิษฐานเกี่ยวกับความสมมาตรของความแตกต่างที่การทดสอบเครื่องหมายไม่ได้ ในทางตรงกันข้ามถ้ามีความสมมาตรและหางไม่หนักมากอันดับที่ลงนามควรมีพลังมากกว่า
Glen_b -Reinstate Monica

ฉันเห็นด้วย. ในกรณีของฉันการทดสอบผลรวมอันดับมีค่า p ที่ใหญ่ที่สุดการทดสอบเครื่องหมายเป็นสื่อกลางอันดับการลงนามนั้นเล็กที่สุด ดังนั้นจึงมีพลังมากขึ้น
เชลดอน

@Sheldon ไม่นั่นไม่ใช่วิธีที่คุณตัดสินใจว่าการทดสอบมีพลังมากขึ้น - ค่า p ต่ำกว่าสำหรับตัวอย่างหนึ่งอาจเป็นเพราะความหลากหลายของตัวอย่างนั้นในขณะที่พลังงานนั้นเกี่ยวกับพฤติกรรมของตัวอย่างสุ่มทั้งหมดที่ดึงมาจากสิ่งเดียวกัน ประชากร. ฉันควรเขียนคำตอบที่ขยายความคิดเห็นก่อนหน้านี้ให้ดีขึ้นอธิบายว่าการมีพลังอำนาจมากขึ้นและอธิบายสถานการณ์บางอย่างที่แต่ละคนอาจทำได้ดีกว่า
Glen_b -Reinstate Monica

3
@Glen_b ฉันจะบอกว่าปัจจุบันการพิจารณาที่สำคัญที่สุดคือสิ่งที่จะเป็นประโยชน์มากที่สุดสำหรับผู้อ่านในอนาคต ฉันคิดว่าใครก็ตามที่ค้นหาการทดสอบการลงชื่อและการทดสอบ Wilcoxon และค้นหาหัวข้อนี้จะได้รับประโยชน์มากขึ้นจากการอ่านคำตอบเฉพาะของคุณที่นี่มากกว่าการถูกเปลี่ยนเส้นทางไปที่ mega-thread ที่พวกเขามีแนวโน้มที่จะหลงทางและไม่เคยพบคำตอบใด ๆ
อะมีบา

คำตอบ:


9

ฉันพยายามเลือกหนึ่งจากการทดสอบทั้งสองนี้เพื่อวิเคราะห์ข้อมูลที่จับคู่ ไม่มีใครรู้กฎของหัวแม่มือเกี่ยวกับที่จะเลือกโดยทั่วไป?

การจัดอันดับการทดสอบที่ลงนามมีข้อสันนิษฐานเกี่ยวกับความสมมาตรของความแตกต่างภายใต้ค่า nullที่การทดสอบเครื่องหมายไม่จำเป็น (ข้อสันนิษฐานนั้นมีความจำเป็นเพื่อให้การเรียงสับเปลี่ยนของสัญญาณที่ติดอยู่กับอันดับที่ไม่ได้ลงนามมีความเป็นไปได้เท่าเทียมกัน)

ในทางตรงกันข้ามถ้ามีความสมมาตรในประชากรและหางไม่หนักมากอันดับที่ลงนามควรมีพลังมากกว่า

[สิ่งนี้ไม่ควรถูกนำมาใช้เป็นคำแนะนำในการเลือกระหว่างพวกเขาบนพื้นฐานของตัวอย่าง ; โดยทั่วไปแล้วจะนำไปสู่การทดสอบคุณสมบัติที่แตกต่างจากการทดสอบเล็กน้อย (การทดสอบอาจจะลำเอียง, ระดับนัยสำคัญที่เกิดขึ้นจริงไม่ได้เป็นสิ่งที่พวกเขาจะปรากฏอีกต่อไป, ค่า p- คำนวณไม่ได้แสดงค่า p- จริงและอื่น ๆ ) แต่ถ้าเป็นไปได้ควรประเมินคุณลักษณะตามความรู้ภายนอกกับตัวอย่างที่จะนำมาใช้ทดสอบ - ไม่ว่าจะโดยความรู้ในสาขาวิชาความคุ้นเคยกับชุดข้อมูลอื่น ๆ เช่นชุดนี้การแยกตัวอย่าง, ... ]

ในกรณีของฉันการทดสอบผลรวมอันดับมีค่า p ที่ใหญ่ที่สุดการทดสอบเครื่องหมายเป็นสื่อกลางอันดับการลงนามนั้นเล็กที่สุด ดังนั้นจึงมีพลังมากขึ้น

นั่นไม่ใช่วิธีที่คุณตัดสินใจว่าการทดสอบจะมีพลังมากขึ้น - ค่า p ต่ำกว่าในตัวอย่างหนึ่งอาจเป็นเพราะความหลากหลายของตัวอย่างนั้นในขณะที่พลังงานนั้นเกี่ยวกับพฤติกรรมของตัวอย่างสุ่มทั้งหมดที่ดึงมาจากประชากรเดียวกัน

H0

ในทำนองเดียวกันเราสามารถคำนวณอัตราการปฏิเสธสำหรับลำดับของประชากรที่มีตำแหน่งต่างกัน * ของความแตกต่างของคู่และรับกราฟกำลังทั้งหมด จากนั้น "พลังงานที่สูงกว่า" จะสอดคล้องกับกราฟพลังงานทั้งหมด (หรือเกือบทั้งหมดของมันโดยสังเกตว่าทั้งสองควรอยู่ในระดับความสำคัญเดียวกัน) สำหรับการทดสอบหนึ่งที่วางเหนืออีก

* คุณอาจใช้มันเป็นค่ามัธยฐานสำหรับการสนทนาปัจจุบัน - ในขณะที่ตัวประมาณสำหรับการจัดอันดับการทดสอบคือค่ามัธยฐานของค่าเฉลี่ยของความแตกต่างของคู่ที่เป็นแบบคู่, ภายใต้สมมติฐานสมมาตร ข้อแตกต่าง


นี่เป็นคำถามที่เกี่ยวข้องวิธีการเลือกระหว่าง t-test หรือไม่พาราทดสอบเช่น Wilcoxon ในตัวอย่างขนาดเล็ก หนึ่งในคำตอบรวมถึงการอภิปราย (สั้น ๆ ) ของปัญหาปัจจุบัน


ขอบคุณสำหรับคำชี้แจงของคุณ ฉันคิดว่าข้อความนำกลับบ้านที่สำคัญที่สุดคือข้อสันนิษฐานเกี่ยวกับความสมมาตรของความแตกต่างสำหรับการทดสอบอันดับที่ลงชื่อซึ่งถูกละเมิดในกรณีของฉัน ฉันรู้สึกว่านอกเหนือจากการตรวจสอบว่าเกณฑ์สมมาตรเป็นที่น่าพอใจไม่มีวิธีใดที่จะบอกว่าการทดสอบใดผิด ค่อนข้างฟังดูสมเหตุสมผลที่จะบอกว่าอันไหนเหมาะสมกว่า
เชลดอน

1
@Sheldon หากคุณไม่มั่นใจว่าเงื่อนไขการทดสอบใกล้เคียงกับความจริงโดยทั่วไปคุณไม่ควรถือว่าพวกเขาเป็นเช่นนั้น อาจกล่าวได้ว่าการทดสอบเครื่องหมายอาจเป็นแนวคิดที่ดีกว่า ฉันหวังว่าจะเพิ่มข้อมูลเพิ่มเติมลงในคำตอบของฉันเมื่อฉันมีโอกาส
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.