ฉันกำลังเปรียบเทียบประสิทธิภาพของอัลกอริทึมหลายชุดในชุดข้อมูลหลายชุด ตั้งแต่ผู้การวัดประสิทธิภาพการทำงานไม่ได้รับประกันว่าจะกระจายตามปกติผมเลือกทดสอบฟรีดแมนกับโพสต์-hoc ทดสอบ Nemenyi ขึ้นอยู่กับDemšar (2006)
จากนั้นฉันก็พบกระดาษอื่นที่นอกเหนือจากการแนะนำวิธีอื่น ๆ เช่นการทดสอบ Quade ด้วยการทดสอบหลังการทำ Shaffer ที่ตามมาพวกเขาใช้การทดสอบ Nemenyi ต่างกัน
ฉันจะใช้การทดสอบ Nemenyi หลังการทดสอบอย่างถูกต้องได้อย่างไร
1. การใช้สถิติช่วง Studentized
ในบทความของDemšarมันบอกว่าจะปฏิเสธสมมติฐานว่าง (ไม่มีความแตกต่างของประสิทธิภาพของสองอัลกอริธึม) ถ้าค่าเฉลี่ยความแตกต่างอันดับมากกว่าระยะทางวิกฤติซีดี
"โดยที่ค่าวิกฤตqαขึ้นอยู่กับสถิติของช่วง Studentized หารด้วย "
หลังจากขุดค้นพบว่าคุณสามารถค้นหา "ค่าวิกฤต" สำหรับบางตัวเช่นในตารางสำหรับสำหรับองศาอิสระที่ไม่มีที่สิ้นสุด (ที่ด้านล่างของแต่ละตาราง)
2. หรือใช้การแจกแจงแบบปกติ?
เมื่อฉันคิดว่าฉันรู้ว่าต้องทำอะไรฉันพบกระดาษอีกฉบับที่ทำให้ฉันสับสนอีกครั้งเพราะพวกเขาใช้การแจกแจงแบบปกติเท่านั้น Demšarระบุสิ่งที่คล้ายกันในหน้า 12:
สถิติการทดสอบสำหรับการเปรียบเทียบคลาส i-th และ j-th โดยใช้วิธีการเหล่านี้คือ ค่า Z จะใช้ในการ Fi อันดับความน่าจะเป็นที่สอดคล้องกันจากตารางของการกระจายปกติแล้วจะถูกเมื่อเทียบกับที่เหมาะสม\การทดสอบแตกต่างกันในวิธีที่พวกเขาปรับค่าของเพื่อชดเชยการเปรียบเทียบหลาย ๆ
ในย่อหน้านี้เขากำลังพูดถึงการเปรียบเทียบอัลกอริธึมทั้งหมดกับอัลกอริธึมการควบคุม แต่คำพูด "แตกต่างกันไปในวิธีที่พวกเขาปรับ ... เพื่อชดเชยการเปรียบเทียบหลาย ๆ " แนะนำว่านี่ควรจะทดสอบ Nemenyi ด้วย
ดังนั้นสิ่งที่ดูเหมือนว่าตรรกะให้ฉันเป็นในการคำนวณP -value อยู่บนพื้นฐานของสถิติทดสอบซึ่งกระจายตามปกติและถูกต้องที่หนึ่งโดยการหารผ่าน 2
อย่างไรก็ตามมันให้ผลต่างต่างกันอย่างสิ้นเชิงในการปฏิเสธสมมติฐานว่าง และตอนนี้ฉันติดอยู่และไม่รู้วิธีการสมัคร ฉันเอนตัวไปทางข้างหนึ่งโดยใช้การแจกแจงแบบปกติเพราะมันง่ายกว่าและสมเหตุสมผลกว่าสำหรับฉัน ฉันไม่จำเป็นต้องค้นหาค่าในตารางและฉันไม่ผูกพันกับค่าความสำคัญบางอย่าง
จากนั้นอีกครั้งฉันไม่เคยทำงานกับสถิติช่วงของนักเรียนและฉันไม่เข้าใจ