ฉันรู้ว่าไม่ใช่พารามิเตอร์อาศัยค่ามัธยฐานแทนค่าเฉลี่ย
การทดสอบแบบไม่มีพารามิเตอร์ใด ๆ แทบจะไม่ได้ "พึ่งพา" ค่ามัธยฐานในแง่นี้ ฉันนึกถึงคู่รักได้เพียงคนเดียว ... และคนเดียวที่ฉันคาดหวังว่าคุณจะเคยได้ยินมาก่อนคือการทดสอบเครื่องหมาย
เพื่อเปรียบเทียบ ... บางสิ่งบางอย่าง
ถ้าพวกเขาพึ่งพาคนสื่อคงเป็นไปได้ว่ามันจะเป็นการเปรียบเทียบคนกลาง แต่ถึงกระนั้นก็มีหลายแหล่งที่พยายามบอกคุณ - การทดสอบเช่นการทดสอบระดับเซ็นชื่อหรือวิลคอกซัน - แมนน์ - วิทนีย์หรือครัสคาล - วอลลิสไม่ใช่การทดสอบสื่อเลย หากคุณทำการตั้งสมมติฐานเพิ่มเติมคุณสามารถพิจารณา Wilcoxon-Mann-Whitney และ Kruskal-Wallis เป็นการทดสอบของค่ามัธยฐาน แต่ภายใต้สมมติฐานเดียวกัน (ตราบใดที่มีวิธีการแจกแจง) คุณสามารถพิจารณาพวกเขาอย่างเท่าเทียมกันว่าเป็นการทดสอบความหมาย .
การประมาณค่าตำแหน่งจริงที่เกี่ยวข้องกับการทดสอบการจัดอันดับแบบลงชื่อเป็นค่ามัธยฐานของค่าเฉลี่ยของจำนวนคู่ภายในตัวอย่างหนึ่งค่าสำหรับ Wilcoxon-Mann-Whitney .
ฉันยังเชื่อว่ามันต้องอาศัย "องศาอิสระ" แทนค่าเบี่ยงเบนมาตรฐาน ถูกต้องฉันถ้าฉันผิด
การทดสอบแบบไม่อิงพารามิเตอร์ส่วนใหญ่ไม่มี 'องศาอิสระ' ถึงแม้ว่าการกระจายของการเปลี่ยนแปลงหลายอย่างกับขนาดตัวอย่างและคุณอาจคิดว่ามันค่อนข้างคล้ายกับองศาอิสระในแง่ที่ว่าตารางเปลี่ยนตามขนาดตัวอย่าง แน่นอนว่าตัวอย่างที่เก็บรักษาคุณสมบัติของพวกเขาและมีองศาอิสระในแง่นั้น แต่องศาอิสระในการกระจายของสถิติการทดสอบไม่ได้เป็นสิ่งที่เรากังวล มันอาจเกิดขึ้นได้ว่าคุณมีอะไรที่เหมือนองศาอิสระ - ตัวอย่างเช่นคุณอาจโต้แย้งว่า Kruskal-Wallis มีองศาอิสระโดยพื้นฐานแล้วมีความรู้สึกแบบเดียวกับที่ไคสแควร์ แต่มักจะไม่มอง วิธีนั้น (ตัวอย่างเช่นถ้ามีคนพูดถึงองศาอิสระของ Kruskal-Wallis พวกเขาจะหมายถึง df
คุณสามารถพบการสนทนาที่ดีขององศาอิสระที่นี่ /
ฉันได้ทำการวิจัยที่ดีพอสมควรหรือฉันคิดว่าพยายามเข้าใจแนวคิดว่าผลงานอยู่เบื้องหลังความหมายของผลการทดสอบจริง ๆ และ / หรือจะทำอย่างไรกับผลการทดสอบ อย่างไรก็ตามดูเหมือนว่าจะไม่มีใครกล้าเข้าไปในพื้นที่นั้น
ฉันไม่แน่ใจว่าคุณหมายถึงอะไร
ฉันสามารถแนะนำหนังสือบางเล่มเช่นสถิติ Nonparametric เชิงปฏิบัติของ Conover และถ้าคุณได้หนังสือของ Neave และ Worthington ( การทดสอบการแจกแจงแบบไม่มีค่าใช้จ่าย ) แต่มีหนังสืออื่น ๆ อีกมากมายเช่น Marascuilo & McSweeney, Hollander & Wolfe หรือหนังสือของ Daniel ฉันขอแนะนำให้คุณอ่านอย่างน้อย 3 หรือ 4 ของสิ่งที่พูดกับคุณดีที่สุดโดยเฉพาะอย่างยิ่งที่อธิบายสิ่งต่าง ๆ ให้มากที่สุดเท่าที่จะเป็นไปได้ (นี่หมายถึงอย่างน้อยอ่านหนังสือ 6 หรือ 7 เล่มเพื่อหา 3 ชุด)
เพื่อความเรียบง่ายลองใช้การทดสอบ Mann Whitney U ซึ่งฉันสังเกตเห็นว่าเป็นที่นิยมมาก
มันเป็นสิ่งที่ทำให้ฉันสับสนเกี่ยวกับคำพูดของคุณ "ไม่มีใครดูเหมือนจะเคยเข้ามาในพื้นที่นั้น" - หลายคนที่ใช้การทดสอบเหล่านี้จะ 'เข้าสู่พื้นที่' ที่คุณกำลังพูดถึง
- และยังใช้ในทางที่ผิดและใช้มากเกินไป
ฉันจะบอกว่าการทดสอบแบบไม่ใช้พารามิเตอร์มักใช้งานไม่ได้เลยหากมีสิ่งใด (รวมถึง Wilcoxon-Mann-Whitney) - โดยเฉพาะอย่างยิ่งการทดสอบการเปลี่ยนรูป / การสุ่มแม้ว่าฉันจะไม่ได้โต้แย้งว่าพวกเขาถูกใช้งานผิดก็ตาม มากขึ้นดังนั้น)
สมมติว่าฉันทำการทดสอบที่ไม่ใช่พารามิเตอร์กับข้อมูลของฉันและฉันได้รับผลลัพธ์กลับมา:
[snip]
ฉันคุ้นเคยกับวิธีการอื่น ๆ แต่ที่นี่ต่างกันอย่างไร
คุณหมายถึงวิธีอื่นใด คุณต้องการให้ฉันเปรียบเทียบสิ่งนี้กับอะไร
แก้ไข: คุณพูดถึงการถดถอยในภายหลัง ฉันคิดว่าคุณคุ้นเคยกับ t-test สองตัวอย่าง (เนื่องจากเป็นกรณีพิเศษของการถดถอย)
ภายใต้สมมติฐานสำหรับ t-test สองตัวอย่างทั่วไปสมมติฐานว่างมีว่าทั้งสองประชากรมีความเหมือนกันเทียบกับทางเลือกที่หนึ่งในการแจกแจงเปลี่ยนไป หากคุณดูสมมติฐานสองชุดแรกสำหรับวิลคอกซัน - แมนน์ - วิทนีย์ด้านล่างสิ่งพื้นฐานที่ถูกทดสอบมีความเหมือนกันเกือบทั้งหมด เป็นเพียงการทดสอบ t-based นั้นขึ้นอยู่กับการสมมติว่ากลุ่มตัวอย่างมาจากการแจกแจงปกติที่เหมือนกัน (นอกเหนือจากการเปลี่ยนตำแหน่งที่เป็นไปได้) หากสมมติฐานว่างเป็นจริงและสมมติฐานประกอบเป็นจริงสถิติทดสอบมีการแจกแจงแบบ t หากสมมติฐานทางเลือกเป็นจริงจากนั้นสถิติการทดสอบมีแนวโน้มที่จะรับค่าที่ไม่สอดคล้องกับสมมติฐานว่าง แต่ดูสอดคล้องกับทางเลือก - เรามุ่งเน้นไปที่สิ่งผิดปกติมากที่สุด
สถานการณ์คล้ายกันมากกับ Wilcoxon-Mann-Whitney แต่มันวัดการเบี่ยงเบนจากโมฆะค่อนข้างแตกต่างกัน ในความเป็นจริงเมื่อข้อสันนิษฐานของการทดสอบ t เป็นจริง * มันเกือบจะดีเท่ากับการทดสอบที่ดีที่สุดเท่าที่จะเป็นไปได้ (ซึ่งก็คือ t-test)
* (ซึ่งในทางปฏิบัติไม่เคยมีมาก่อนแม้ว่าจะไม่ใช่ปัญหามากเท่าที่ฟัง)
แน่นอนว่าเป็นไปได้ที่จะพิจารณา Wilcoxon-Mann-Whitney ว่าเป็น "t-test" ที่มีประสิทธิภาพในการจัดอันดับของข้อมูล - แม้ว่าจะไม่มีการแจกแจงแบบที สถิติเป็นฟังก์ชั่นแบบโมโนโทนิกของ t-statistic สองตัวอย่างที่คำนวณบนอันดับของข้อมูลดังนั้นมันจึงทำให้คำสั่งเดียวกัน ** บนพื้นที่ตัวอย่าง (นั่นคือ "t-test" บนแถว - ดำเนินการอย่างเหมาะสม - จะสร้างค่า p เดียวกันกับ Wilcoxon-Mann-Whitney) ดังนั้นมันจึงปฏิเสธกรณีเดียวกันทั้งหมด
** (สั่งอย่างเคร่งครัดบางส่วน แต่เรามาจากกัน)
[คุณคิดว่าเพียงแค่ใช้อันดับจะทิ้งข้อมูลจำนวนมาก แต่เมื่อข้อมูลถูกดึงมาจากประชากรปกติที่มีความแปรปรวนเดียวกันข้อมูลเกือบทั้งหมดเกี่ยวกับการเปลี่ยนตำแหน่งจะอยู่ในรูปแบบของอันดับ ค่าข้อมูลจริง (มีเงื่อนไขในการจัดอันดับ) เพิ่มข้อมูลเพิ่มเติมเล็กน้อยให้ หากคุณไปหนักกว่าปกติมันไม่นานก่อนที่การทดสอบ Wilcoxon-Mann-Whitney จะมีพลังที่ดีกว่ารวมถึงการรักษาระดับนัยสำคัญที่ระบุไว้ดังนั้นข้อมูล 'พิเศษ' เหนืออันดับจะกลายเป็นไม่ใช่เรื่องแปลก แต่ในบางเรื่อง ความรู้สึกทำให้เข้าใจผิด อย่างไรก็ตาม tailedness หนักใกล้สมมาตรเป็นสถานการณ์ที่หายาก สิ่งที่คุณเห็นในทางปฏิบัติบ่อยครั้งคือความเบ้]
แนวคิดพื้นฐานค่อนข้างคล้ายกันค่า p มีการตีความเหมือนกัน (ความน่าจะเป็นของผลลัพธ์หรือมากเกินกว่านี้หากสมมติฐานว่างเป็นจริง) - ลงไปที่การแปลตำแหน่งกะถ้าคุณทำ สมมติฐานที่จำเป็น (ดูการอภิปรายของสมมติฐานที่อยู่ใกล้กับจุดสิ้นสุดของโพสต์นี้)
ถ้าฉันทำแบบจำลองเดียวกับในแปลงข้างต้นสำหรับการทดสอบแบบทีพล็อตจะดูคล้ายกันมาก - สเกลบนแกน x และแกน y จะดูแตกต่างกัน แต่ลักษณะพื้นฐานจะคล้ายกัน
เราควรต้องการให้ค่า p ต่ำกว่า. 05 หรือไม่
คุณไม่ควร "ต้องการ" อะไรที่นั่น แนวคิดคือการค้นหาว่ากลุ่มตัวอย่างมีความแตกต่าง (ในแง่สถานที่) มากกว่าที่จะสามารถอธิบายได้โดยบังเอิญไม่ใช่เพื่อ 'ต้องการ' ผลลัพธ์ที่เฉพาะเจาะจง
ถ้าผมบอกว่า "คุณสามารถไปดูสิ่งที่สีรถราชาคือโปรด?" ถ้าฉันต้องการการประเมินที่เป็นกลางของมันฉันไม่ต้องการให้คุณจะไป "ชายฉันจริงๆ, หวังว่ามันจะเป็นสีฟ้า! มันก็มีจะเป็น สีน้ำเงิน". ดีที่สุดที่จะเห็นว่าสถานการณ์คืออะไรแทนที่จะเข้าร่วมกับ 'ฉันต้องการให้มันเป็นบางสิ่งบางอย่าง'
หากระดับนัยสำคัญที่คุณเลือกคือ 0.05 คุณจะปฏิเสธสมมติฐานว่างเมื่อค่า p ต่ำกว่า 0.05 แต่ความล้มเหลวในการปฏิเสธเมื่อคุณมีตัวอย่างขนาดใหญ่พอที่จะตรวจจับเอฟเฟกต์ที่เกี่ยวข้องอย่างน้อยก็น่าสนใจเพราะมันบอกว่าความแตกต่างใด ๆ ที่มีอยู่นั้นเล็ก
หมายเลข "แมนน์วิตเลย์" หมายถึงอะไร
แมนน์-วิทนีย์สถิติ
มันมีความหมายจริง ๆ เท่านั้นเมื่อเปรียบเทียบกับการกระจายของค่าที่สามารถทำได้เมื่อสมมติฐานว่างเป็นจริง (ดูแผนภาพด้านบน) และขึ้นอยู่กับคำจำกัดความเฉพาะใด ๆ ของโปรแกรมที่อาจใช้
มีประโยชน์สำหรับมันหรือไม่?
โดยปกติแล้วคุณไม่สนใจค่าที่แน่นอนเช่นนี้ แต่มันอยู่ในการแจกแจงแบบโมฆะ (ไม่ว่าจะเป็นค่าทั่วไปมากหรือน้อยที่คุณควรเห็นเมื่อสมมติฐานว่างเป็นจริงหรือว่ามันสุดขั้วมากขึ้น)
P( X< Y)
ข้อมูลนี้ที่นี่เพิ่งตรวจสอบหรือไม่ตรวจสอบว่ามีแหล่งข้อมูลเฉพาะที่ฉันควรหรือไม่ควรใช้หรือไม่
การทดสอบนี้ไม่ได้พูดอะไรเกี่ยวกับ "แหล่งข้อมูลเฉพาะที่ฉันควรหรือไม่ควรใช้"
ดูการอภิปรายของฉันเกี่ยวกับสองวิธีในการดูสมมุติ WMW ด้านล่าง
ฉันมีประสบการณ์พอสมควรกับการถดถอยและพื้นฐาน แต่ฉันอยากรู้เกี่ยวกับสิ่งที่ไม่ใช่พารามิเตอร์ "พิเศษ" นี้
ไม่มีอะไรพิเศษเป็นพิเศษเกี่ยวกับการทดสอบแบบไม่มีพารามิเตอร์ (ฉันว่าการทดสอบแบบ 'มาตรฐาน' นั้นมีหลายวิธีที่ง่ายกว่าการทดสอบแบบพารามิเตอร์ทั่วไป) - ตราบใดที่คุณเข้าใจการทดสอบสมมติฐานจริง ๆ
อย่างไรก็ตามนั่นอาจเป็นหัวข้อสำหรับคำถามอื่น
มีสองวิธีหลักในการดูการทดสอบสมมติฐาน Wilcoxon-Mann-Whitney
i) หนึ่งคือการพูดว่า "ฉันสนใจสถานที่เปลี่ยน - นั่นคือภายใต้สมมติฐานว่าง, ประชากรสองคนมีการกระจาย (ต่อเนื่อง) เดียวกัน , เทียบกับทางเลือกที่หนึ่งคือ 'เลื่อน' ขึ้นหรือลงเทียบกับ อื่น ๆ"
Wilcoxon-Mann-Whitney ทำงานได้ดีมากหากคุณใช้สมมติฐานนี้ (ซึ่งทางเลือกของคุณเป็นเพียงการเปลี่ยนตำแหน่ง)
ในกรณีนี้ Wilcoxon-Mann-Whitney จริง ๆ แล้วเป็นการทดสอบสำหรับคนกลาง ... แต่เท่า ๆ กันมันเป็นการทดสอบหาค่าเฉลี่ยหรือที่จริงแล้วสถิติตำแหน่งที่มีความแตกต่างอื่น ๆ สิ่งอื่น ๆ ) เนื่องจากทั้งหมดได้รับผลกระทบในลักษณะเดียวกันโดยการเปลี่ยนตำแหน่ง
สิ่งที่ดีเกี่ยวกับเรื่องนี้คือมันสามารถตีความได้ง่าย - และมันง่ายที่จะสร้างช่วงความมั่นใจสำหรับการเปลี่ยนตำแหน่งนี้
อย่างไรก็ตามการทดสอบ Wilcoxon-Mann-Whitney นั้นมีความไวต่อความแตกต่างอื่น ๆ นอกเหนือจากการเปลี่ยนตำแหน่ง
1212