การทดสอบแบบไม่อิงพารามิเตอร์ทำอะไรได้บ้างและคุณทำอะไรกับผลลัพธ์


22

ฉันรู้สึกว่านี่อาจถูกถามที่อื่น แต่ไม่จริงกับประเภทของคำอธิบายพื้นฐานที่ฉันต้องการ ฉันรู้ว่าไม่ใช่พารามิเตอร์อาศัยค่ามัธยฐานแทนค่าเฉลี่ยเพื่อเปรียบเทียบ ... บางสิ่งบางอย่าง ฉันเชื่อว่ามันต้องอาศัย "องศาอิสระ" (?) แทนที่จะเบี่ยงเบนมาตรฐาน ถูกต้องฉันถ้าฉันผิด

ฉันได้ทำการวิจัยที่ดีพอสมควรหรืออย่างนั้นฉันก็คิดว่าพยายามเข้าใจแนวคิดว่าผลงานอยู่เบื้องหลังความหมายของผลการทดสอบจริง ๆ และ / หรือจะทำอย่างไรกับผลการทดสอบ อย่างไรก็ตามดูเหมือนว่าจะไม่มีใครกล้าเข้าไปในพื้นที่นั้น

เพื่อความเรียบง่ายลองมากับ Mann-Whitney U-test ซึ่งฉันสังเกตเห็นว่ามันค่อนข้างเป็นที่นิยม หากคุณต้องการอธิบายการทดสอบอื่น ๆ ด้วยเช่นกันแม้ว่าฉันจะรู้สึกว่าเมื่อฉันเข้าใจแล้วฉันก็สามารถเข้าใจการทดสอบอื่น ๆ ในลักษณะที่คล้ายคลึงกับการทดสอบ t แบบต่างๆเป็นต้น

สมมติว่าฉันทำการทดสอบที่ไม่ใช่พารามิเตอร์กับข้อมูลของฉันและฉันได้รับผลลัพธ์กลับมา:

2 Sample Mann-Whitney - Customer Type       

Test Information        
H0: Median Difference = 0       
Ha: Median Difference ≠ 0       

Size of Customer    Large   Small
Count                    45    55
Median                    2     2

Mann-Whitney Statistic: 2162.00 
p-value (2-sided, adjusted for ties):   0.4156  

ฉันคุ้นเคยกับวิธีการอื่น ๆ แต่ที่นี่ต่างกันอย่างไร เราควรต้องการให้ค่า p ต่ำกว่า. 05 หรือไม่ สถิติ "Mann-Whitney" หมายถึงอะไร มีประโยชน์สำหรับมันหรือไม่? ข้อมูลนี้ที่นี่เพิ่งยืนยันหรือไม่ตรวจสอบว่ามีแหล่งข้อมูลเฉพาะที่ฉันควรหรือไม่ควรใช้หรือไม่

ฉันมีประสบการณ์จำนวนพอสมควรเกี่ยวกับการถดถอยและพื้นฐาน แต่ฉันอยากรู้เกี่ยวกับสิ่งที่ไม่ใช่ "พิเศษ" นี้ซึ่งฉันรู้ว่าจะมีข้อบกพร่องของตัวเอง

แค่คิดว่าฉันเป็นนักเรียนระดับประถมห้าและดูว่าคุณสามารถอธิบายให้ฉันได้ไหม


4
ใช่ฉันอ่านมาหลายครั้งแล้ว บางครั้งศัพท์แสงที่ใช้ในวิกิพีเดียอาจดูล้นหลามและถึงแม้ว่ามันจะมีคำอธิบายที่ถูกต้อง แต่ก็ไม่จำเป็นต้องมีคำอธิบายที่ชัดเจนสำหรับคนที่เริ่มพยายามเรียนรู้พื้นที่ ไม่แน่ใจว่าใครเป็นผู้ลงคะแนนต่ำ แต่ฉันต้องการคำอธิบายพื้นฐานที่ชัดเจนและชัดเจนทุกคนสามารถเข้าใจได้ ใช่ฉันพยายามอย่างหนักเพื่อหาคนที่เชื่อหรือไม่ ไม่จำเป็นต้องลงคะแนนฉันทันทีและเชื่อมโยงฉันกับวิกิพีเดีย ทุกคนเคยสังเกตว่าครูบางคนดีกว่าคนอื่น ๆ อย่างไร ฉันกำลังมองหา "ครู" ที่ดีสำหรับแนวคิดที่ฉันติดอยู่
Taal

1
ย้ายไปยังข้อความสถิติพื้นฐานแบบไม่มีพารามิเตอร์ที่ดีเช่น Sprent และ Smeeton, Hollander และ Wolfe, Conover หรือค้นหาข้อความเกริ่นนำที่มี Mann-Whitney
Nick Cox

1
จากการดูคำถามของคุณและคำถามอื่น ๆ ที่คุณถามเมื่อเร็ว ๆ นี้การใช้อินเทอร์เน็ตเพียงอย่างเดียวไม่ได้ผลดีสำหรับคุณเนื่องจากคุณสับสนอย่างมาก นั่นเป็นเหตุผลที่ @Peter Flom และฉันกำลังแนะนำหนังสือ ฉันไม่ได้รับคำแนะนำอื่น ๆ ในการสำรอง ฉันขอแนะนำ - ด้วยความจริงใจและเพื่อประโยชน์สูงสุดของคุณ - พยายามเขียนคำถามที่กระชับและพูดน้อยกว่าให้มากขึ้น สไตล์พูดนอกเรื่องของคุณไม่ได้ช่วยให้คำถามของคุณชัดเจน
Nick Cox

1
อินเทอร์เน็ตเพียงอย่างเดียวทำงานได้ดีกว่าหนังสือหรือชั้นเรียนใด ๆ เพื่อให้ฉันซื่อสัตย์ - และนั่นก็เป็นหัวข้อใด ๆ ฉันขอโทษที่เขียนคำถาม "ช่างพูด"
Taal

3
ไม่ดูเหมือนว่าจะไม่ทำงานเช่นเดียวกับหนังสือที่ดี การถอดความสตีเฟ่นเซนน์เป็นเรื่องแปลกที่สถิติเป็นวิทยาศาสตร์เพียงอย่างเดียวที่ผู้คนต้องการให้เข้าใจได้ตั้งแต่แรก
Frank Harrell

คำตอบ:


41

ฉันรู้ว่าไม่ใช่พารามิเตอร์อาศัยค่ามัธยฐานแทนค่าเฉลี่ย

การทดสอบแบบไม่มีพารามิเตอร์ใด ๆ แทบจะไม่ได้ "พึ่งพา" ค่ามัธยฐานในแง่นี้ ฉันนึกถึงคู่รักได้เพียงคนเดียว ... และคนเดียวที่ฉันคาดหวังว่าคุณจะเคยได้ยินมาก่อนคือการทดสอบเครื่องหมาย

เพื่อเปรียบเทียบ ... บางสิ่งบางอย่าง

ถ้าพวกเขาพึ่งพาคนสื่อคงเป็นไปได้ว่ามันจะเป็นการเปรียบเทียบคนกลาง แต่ถึงกระนั้นก็มีหลายแหล่งที่พยายามบอกคุณ - การทดสอบเช่นการทดสอบระดับเซ็นชื่อหรือวิลคอกซัน - แมนน์ - วิทนีย์หรือครัสคาล - วอลลิสไม่ใช่การทดสอบสื่อเลย หากคุณทำการตั้งสมมติฐานเพิ่มเติมคุณสามารถพิจารณา Wilcoxon-Mann-Whitney และ Kruskal-Wallis เป็นการทดสอบของค่ามัธยฐาน แต่ภายใต้สมมติฐานเดียวกัน (ตราบใดที่มีวิธีการแจกแจง) คุณสามารถพิจารณาพวกเขาอย่างเท่าเทียมกันว่าเป็นการทดสอบความหมาย .

การประมาณค่าตำแหน่งจริงที่เกี่ยวข้องกับการทดสอบการจัดอันดับแบบลงชื่อเป็นค่ามัธยฐานของค่าเฉลี่ยของจำนวนคู่ภายในตัวอย่างหนึ่งค่าสำหรับ Wilcoxon-Mann-Whitney .

ฉันยังเชื่อว่ามันต้องอาศัย "องศาอิสระ" แทนค่าเบี่ยงเบนมาตรฐาน ถูกต้องฉันถ้าฉันผิด

การทดสอบแบบไม่อิงพารามิเตอร์ส่วนใหญ่ไม่มี 'องศาอิสระ' ถึงแม้ว่าการกระจายของการเปลี่ยนแปลงหลายอย่างกับขนาดตัวอย่างและคุณอาจคิดว่ามันค่อนข้างคล้ายกับองศาอิสระในแง่ที่ว่าตารางเปลี่ยนตามขนาดตัวอย่าง แน่นอนว่าตัวอย่างที่เก็บรักษาคุณสมบัติของพวกเขาและมีองศาอิสระในแง่นั้น แต่องศาอิสระในการกระจายของสถิติการทดสอบไม่ได้เป็นสิ่งที่เรากังวล มันอาจเกิดขึ้นได้ว่าคุณมีอะไรที่เหมือนองศาอิสระ - ตัวอย่างเช่นคุณอาจโต้แย้งว่า Kruskal-Wallis มีองศาอิสระโดยพื้นฐานแล้วมีความรู้สึกแบบเดียวกับที่ไคสแควร์ แต่มักจะไม่มอง วิธีนั้น (ตัวอย่างเช่นถ้ามีคนพูดถึงองศาอิสระของ Kruskal-Wallis พวกเขาจะหมายถึง df

คุณสามารถพบการสนทนาที่ดีขององศาอิสระที่นี่ /

ฉันได้ทำการวิจัยที่ดีพอสมควรหรือฉันคิดว่าพยายามเข้าใจแนวคิดว่าผลงานอยู่เบื้องหลังความหมายของผลการทดสอบจริง ๆ และ / หรือจะทำอย่างไรกับผลการทดสอบ อย่างไรก็ตามดูเหมือนว่าจะไม่มีใครกล้าเข้าไปในพื้นที่นั้น

ฉันไม่แน่ใจว่าคุณหมายถึงอะไร

ฉันสามารถแนะนำหนังสือบางเล่มเช่นสถิติ Nonparametric เชิงปฏิบัติของ Conover และถ้าคุณได้หนังสือของ Neave และ Worthington ( การทดสอบการแจกแจงแบบไม่มีค่าใช้จ่าย ) แต่มีหนังสืออื่น ๆ อีกมากมายเช่น Marascuilo & McSweeney, Hollander & Wolfe หรือหนังสือของ Daniel ฉันขอแนะนำให้คุณอ่านอย่างน้อย 3 หรือ 4 ของสิ่งที่พูดกับคุณดีที่สุดโดยเฉพาะอย่างยิ่งที่อธิบายสิ่งต่าง ๆ ให้มากที่สุดเท่าที่จะเป็นไปได้ (นี่หมายถึงอย่างน้อยอ่านหนังสือ 6 หรือ 7 เล่มเพื่อหา 3 ชุด)

เพื่อความเรียบง่ายลองใช้การทดสอบ Mann Whitney U ซึ่งฉันสังเกตเห็นว่าเป็นที่นิยมมาก

มันเป็นสิ่งที่ทำให้ฉันสับสนเกี่ยวกับคำพูดของคุณ "ไม่มีใครดูเหมือนจะเคยเข้ามาในพื้นที่นั้น" - หลายคนที่ใช้การทดสอบเหล่านี้จะ 'เข้าสู่พื้นที่' ที่คุณกำลังพูดถึง

- และยังใช้ในทางที่ผิดและใช้มากเกินไป

ฉันจะบอกว่าการทดสอบแบบไม่ใช้พารามิเตอร์มักใช้งานไม่ได้เลยหากมีสิ่งใด (รวมถึง Wilcoxon-Mann-Whitney) - โดยเฉพาะอย่างยิ่งการทดสอบการเปลี่ยนรูป / การสุ่มแม้ว่าฉันจะไม่ได้โต้แย้งว่าพวกเขาถูกใช้งานผิดก็ตาม มากขึ้นดังนั้น)

สมมติว่าฉันทำการทดสอบที่ไม่ใช่พารามิเตอร์กับข้อมูลของฉันและฉันได้รับผลลัพธ์กลับมา:

[snip]

ฉันคุ้นเคยกับวิธีการอื่น ๆ แต่ที่นี่ต่างกันอย่างไร

คุณหมายถึงวิธีอื่นใด คุณต้องการให้ฉันเปรียบเทียบสิ่งนี้กับอะไร

แก้ไข: คุณพูดถึงการถดถอยในภายหลัง ฉันคิดว่าคุณคุ้นเคยกับ t-test สองตัวอย่าง (เนื่องจากเป็นกรณีพิเศษของการถดถอย)

ภายใต้สมมติฐานสำหรับ t-test สองตัวอย่างทั่วไปสมมติฐานว่างมีว่าทั้งสองประชากรมีความเหมือนกันเทียบกับทางเลือกที่หนึ่งในการแจกแจงเปลี่ยนไป หากคุณดูสมมติฐานสองชุดแรกสำหรับวิลคอกซัน - แมนน์ - วิทนีย์ด้านล่างสิ่งพื้นฐานที่ถูกทดสอบมีความเหมือนกันเกือบทั้งหมด เป็นเพียงการทดสอบ t-based นั้นขึ้นอยู่กับการสมมติว่ากลุ่มตัวอย่างมาจากการแจกแจงปกติที่เหมือนกัน (นอกเหนือจากการเปลี่ยนตำแหน่งที่เป็นไปได้) หากสมมติฐานว่างเป็นจริงและสมมติฐานประกอบเป็นจริงสถิติทดสอบมีการแจกแจงแบบ t หากสมมติฐานทางเลือกเป็นจริงจากนั้นสถิติการทดสอบมีแนวโน้มที่จะรับค่าที่ไม่สอดคล้องกับสมมติฐานว่าง แต่ดูสอดคล้องกับทางเลือก - เรามุ่งเน้นไปที่สิ่งผิดปกติมากที่สุด

สถานการณ์คล้ายกันมากกับ Wilcoxon-Mann-Whitney แต่มันวัดการเบี่ยงเบนจากโมฆะค่อนข้างแตกต่างกัน ในความเป็นจริงเมื่อข้อสันนิษฐานของการทดสอบ t เป็นจริง * มันเกือบจะดีเท่ากับการทดสอบที่ดีที่สุดเท่าที่จะเป็นไปได้ (ซึ่งก็คือ t-test)

* (ซึ่งในทางปฏิบัติไม่เคยมีมาก่อนแม้ว่าจะไม่ใช่ปัญหามากเท่าที่ฟัง)

wmw ภายใต้ null และทางเลือก

แน่นอนว่าเป็นไปได้ที่จะพิจารณา Wilcoxon-Mann-Whitney ว่าเป็น "t-test" ที่มีประสิทธิภาพในการจัดอันดับของข้อมูล - แม้ว่าจะไม่มีการแจกแจงแบบที สถิติเป็นฟังก์ชั่นแบบโมโนโทนิกของ t-statistic สองตัวอย่างที่คำนวณบนอันดับของข้อมูลดังนั้นมันจึงทำให้คำสั่งเดียวกัน ** บนพื้นที่ตัวอย่าง (นั่นคือ "t-test" บนแถว - ดำเนินการอย่างเหมาะสม - จะสร้างค่า p เดียวกันกับ Wilcoxon-Mann-Whitney) ดังนั้นมันจึงปฏิเสธกรณีเดียวกันทั้งหมด

** (สั่งอย่างเคร่งครัดบางส่วน แต่เรามาจากกัน)

[คุณคิดว่าเพียงแค่ใช้อันดับจะทิ้งข้อมูลจำนวนมาก แต่เมื่อข้อมูลถูกดึงมาจากประชากรปกติที่มีความแปรปรวนเดียวกันข้อมูลเกือบทั้งหมดเกี่ยวกับการเปลี่ยนตำแหน่งจะอยู่ในรูปแบบของอันดับ ค่าข้อมูลจริง (มีเงื่อนไขในการจัดอันดับ) เพิ่มข้อมูลเพิ่มเติมเล็กน้อยให้ หากคุณไปหนักกว่าปกติมันไม่นานก่อนที่การทดสอบ Wilcoxon-Mann-Whitney จะมีพลังที่ดีกว่ารวมถึงการรักษาระดับนัยสำคัญที่ระบุไว้ดังนั้นข้อมูล 'พิเศษ' เหนืออันดับจะกลายเป็นไม่ใช่เรื่องแปลก แต่ในบางเรื่อง ความรู้สึกทำให้เข้าใจผิด อย่างไรก็ตาม tailedness หนักใกล้สมมาตรเป็นสถานการณ์ที่หายาก สิ่งที่คุณเห็นในทางปฏิบัติบ่อยครั้งคือความเบ้]

แนวคิดพื้นฐานค่อนข้างคล้ายกันค่า p มีการตีความเหมือนกัน (ความน่าจะเป็นของผลลัพธ์หรือมากเกินกว่านี้หากสมมติฐานว่างเป็นจริง) - ลงไปที่การแปลตำแหน่งกะถ้าคุณทำ สมมติฐานที่จำเป็น (ดูการอภิปรายของสมมติฐานที่อยู่ใกล้กับจุดสิ้นสุดของโพสต์นี้)

ถ้าฉันทำแบบจำลองเดียวกับในแปลงข้างต้นสำหรับการทดสอบแบบทีพล็อตจะดูคล้ายกันมาก - สเกลบนแกน x และแกน y จะดูแตกต่างกัน แต่ลักษณะพื้นฐานจะคล้ายกัน

เราควรต้องการให้ค่า p ต่ำกว่า. 05 หรือไม่

คุณไม่ควร "ต้องการ" อะไรที่นั่น แนวคิดคือการค้นหาว่ากลุ่มตัวอย่างมีความแตกต่าง (ในแง่สถานที่) มากกว่าที่จะสามารถอธิบายได้โดยบังเอิญไม่ใช่เพื่อ 'ต้องการ' ผลลัพธ์ที่เฉพาะเจาะจง

ถ้าผมบอกว่า "คุณสามารถไปดูสิ่งที่สีรถราชาคือโปรด?" ถ้าฉันต้องการการประเมินที่เป็นกลางของมันฉันไม่ต้องการให้คุณจะไป "ชายฉันจริงๆ, หวังว่ามันจะเป็นสีฟ้า! มันก็มีจะเป็น สีน้ำเงิน". ดีที่สุดที่จะเห็นว่าสถานการณ์คืออะไรแทนที่จะเข้าร่วมกับ 'ฉันต้องการให้มันเป็นบางสิ่งบางอย่าง'

หากระดับนัยสำคัญที่คุณเลือกคือ 0.05 คุณจะปฏิเสธสมมติฐานว่างเมื่อค่า p ต่ำกว่า 0.05 แต่ความล้มเหลวในการปฏิเสธเมื่อคุณมีตัวอย่างขนาดใหญ่พอที่จะตรวจจับเอฟเฟกต์ที่เกี่ยวข้องอย่างน้อยก็น่าสนใจเพราะมันบอกว่าความแตกต่างใด ๆ ที่มีอยู่นั้นเล็ก

หมายเลข "แมนน์วิตเลย์" หมายถึงอะไร

แมนน์-วิทนีย์สถิติ

มันมีความหมายจริง ๆ เท่านั้นเมื่อเปรียบเทียบกับการกระจายของค่าที่สามารถทำได้เมื่อสมมติฐานว่างเป็นจริง (ดูแผนภาพด้านบน) และขึ้นอยู่กับคำจำกัดความเฉพาะใด ๆ ของโปรแกรมที่อาจใช้

มีประโยชน์สำหรับมันหรือไม่?

โดยปกติแล้วคุณไม่สนใจค่าที่แน่นอนเช่นนี้ แต่มันอยู่ในการแจกแจงแบบโมฆะ (ไม่ว่าจะเป็นค่าทั่วไปมากหรือน้อยที่คุณควรเห็นเมื่อสมมติฐานว่างเป็นจริงหรือว่ามันสุดขั้วมากขึ้น)

P(X<Y)

ข้อมูลนี้ที่นี่เพิ่งตรวจสอบหรือไม่ตรวจสอบว่ามีแหล่งข้อมูลเฉพาะที่ฉันควรหรือไม่ควรใช้หรือไม่

การทดสอบนี้ไม่ได้พูดอะไรเกี่ยวกับ "แหล่งข้อมูลเฉพาะที่ฉันควรหรือไม่ควรใช้"

ดูการอภิปรายของฉันเกี่ยวกับสองวิธีในการดูสมมุติ WMW ด้านล่าง

ฉันมีประสบการณ์พอสมควรกับการถดถอยและพื้นฐาน แต่ฉันอยากรู้เกี่ยวกับสิ่งที่ไม่ใช่พารามิเตอร์ "พิเศษ" นี้

ไม่มีอะไรพิเศษเป็นพิเศษเกี่ยวกับการทดสอบแบบไม่มีพารามิเตอร์ (ฉันว่าการทดสอบแบบ 'มาตรฐาน' นั้นมีหลายวิธีที่ง่ายกว่าการทดสอบแบบพารามิเตอร์ทั่วไป) - ตราบใดที่คุณเข้าใจการทดสอบสมมติฐานจริง ๆ

อย่างไรก็ตามนั่นอาจเป็นหัวข้อสำหรับคำถามอื่น


มีสองวิธีหลักในการดูการทดสอบสมมติฐาน Wilcoxon-Mann-Whitney

i) หนึ่งคือการพูดว่า "ฉันสนใจสถานที่เปลี่ยน - นั่นคือภายใต้สมมติฐานว่าง, ประชากรสองคนมีการกระจาย (ต่อเนื่อง) เดียวกัน , เทียบกับทางเลือกที่หนึ่งคือ 'เลื่อน' ขึ้นหรือลงเทียบกับ อื่น ๆ"

Wilcoxon-Mann-Whitney ทำงานได้ดีมากหากคุณใช้สมมติฐานนี้ (ซึ่งทางเลือกของคุณเป็นเพียงการเปลี่ยนตำแหน่ง)

ในกรณีนี้ Wilcoxon-Mann-Whitney จริง ๆ แล้วเป็นการทดสอบสำหรับคนกลาง ... แต่เท่า ๆ กันมันเป็นการทดสอบหาค่าเฉลี่ยหรือที่จริงแล้วสถิติตำแหน่งที่มีความแตกต่างอื่น ๆ สิ่งอื่น ๆ ) เนื่องจากทั้งหมดได้รับผลกระทบในลักษณะเดียวกันโดยการเปลี่ยนตำแหน่ง

สิ่งที่ดีเกี่ยวกับเรื่องนี้คือมันสามารถตีความได้ง่าย - และมันง่ายที่จะสร้างช่วงความมั่นใจสำหรับการเปลี่ยนตำแหน่งนี้

การเปลี่ยนตำแหน่ง

อย่างไรก็ตามการทดสอบ Wilcoxon-Mann-Whitney นั้นมีความไวต่อความแตกต่างอื่น ๆ นอกเหนือจากการเปลี่ยนตำแหน่ง

1212

เปลี่ยนเป็น P (X <Y) จาก 1/2


ฉันวาดการแจกแจงโมฆะโดยประมาณ (อันที่เป็นสีแดงในกราฟ topmost ใหม่) ราวกับว่ามันต่อเนื่อง ... แต่การกระจายที่แท้จริงนั้นไม่ต่อเนื่อง ภาพนั้นรกไปกว่านั้น
Glen_b -Reinstate Monica

3
+1 คำตอบที่ดี หนึ่งในคำอธิบายที่ดีที่สุดและสามารถเข้าถึงได้มากที่สุดของการทดสอบ Wilcoxon-Mann-Whitney ที่ฉันรู้ ขอขอบคุณ.
COOLSerdash

"ในกรณีนี้จริง ๆ แล้วการทดสอบของวิลค็อกสัน - แมนน์ - วิทนีย์คือการทดสอบสำหรับคนกลาง ... แต่ก็เท่ากันสำหรับการทดสอบ" อย่างไรก็ตามการแจกแจงบางอย่างไม่มีวิธีการในขณะที่ค่ามัธยฐานของพวกเขานั้นชัดเจน
caracal

@caracal ในขณะที่เป็นจริง (มันเป็นจุดที่ฉันได้ทำหลายครั้งที่นี่) ถ้ามีคนทดสอบความเท่าเทียมกันของค่าเฉลี่ยของประชากรสันนิษฐานว่าพวกเขาแล้วถือว่าพวกเขาหมายความว่าประชากรมี จำกัด หากพวกเขาไม่พวกเขามีปัญหาได้ดีก่อนที่จะถึงจุดเลือกทดสอบ เมื่อพิจารณาตามที่มีสมมติฐานของค่าเฉลี่ยประชากร (และมี จำกัด ) หมายความว่าภายใต้สมมติฐานเดียวกันที่มักใช้ในการทดสอบของค่ามัธยฐาน (ทางเลือกการเปลี่ยนแปลง) WMW ยังเป็นวิธีทดสอบ
Glen_b -Reinstate Monica

17

สมมติว่าคุณกับฉันเป็นผู้ฝึกสอนทีมแทร็ค นักกีฬาของเรามาจากโรงเรียนเดียวกันอายุเท่ากันและเพศเดียวกัน (เช่นพวกเขามาจากประชากรเดียวกัน) แต่ฉันอ้างว่าได้ค้นพบระบบการฝึกอบรมใหม่ที่ปฏิวัติวงการซึ่งจะทำให้สมาชิกในทีมของฉันทำงานได้เร็วกว่ามาก ของคุณ ฉันจะทำให้คุณมั่นใจได้อย่างไรว่ามันใช้งานได้จริง?

เรามีการแข่งขัน

หลังจากนั้นฉันนั่งลงและคำนวณเวลาเฉลี่ยสำหรับสมาชิกในทีมของฉันและเวลาเฉลี่ยสำหรับสมาชิกของคุณ ฉันจะเรียกร้องชัยชนะถ้าเวลาเฉลี่ยสำหรับนักกีฬาของฉันไม่เพียงเร็วกว่าค่าเฉลี่ยสำหรับคุณ แต่ความแตกต่างนั้นใหญ่เมื่อเทียบกับ "กระจาย" หรือส่วนเบี่ยงเบนมาตรฐานของผลลัพธ์ของเรา


t


"แต่แมตต์" คุณบ่น "นี่ไม่ยุติธรรมเลยทีมของเราค่อนข้างคล้ายกัน แต่คุณ - เนื่องจากมีโอกาสบริสุทธิ์ - จบลงด้วยนักวิ่งที่เร็วที่สุดในเขตเขาไม่ได้อยู่ในลีกเดียวกันกับทุกคน อย่างอื่นเขาเป็นคนที่คลั่งไคล้ธรรมชาติเขาทำ 3 นาทีก่อนหมัดเด็ดตัวต่อไปที่เร็วที่สุดซึ่งจะช่วยลดเวลาเฉลี่ยของคุณลงได้มาก แต่คู่แข่งที่เหลือก็ค่อนข้างผสมกันลองดูที่คำสั่งเสร็จสิ้นแทน ใช้งานได้จริงผู้ที่ทำก่อนหน้านี้ส่วนใหญ่จะมาจากทีมของคุณ แต่ถ้ามันไม่ได้คำสั่งให้เสร็จก็ควรจะสุ่มให้สวยนี่ไม่ได้ทำให้น้ำหนักเกินกับซุปเปอร์สตาร์ของคุณ!


t

p

ttt


คุณตอบคำถามของฉันอย่างถูกต้องและฉันหมายถึงวิธีที่ฉันต้องการให้ตอบ เกลนขอบด้านคณิตศาสตร์มากขึ้นเช่นกันและการรวมกันของคำตอบทั้งสองนี้ทำให้ฉันคลิก ฉันไม่สามารถเอารางวัลออกไปจากเขาได้ - ฉันหมายความว่า ... เขากำลังวาดกราฟแม้จะมีความชัดเจนในการตอบสนองของคุณ ฉันรู้สึกว่าคุณเคยมีงานสอนบางอย่างในอดีต ฉันรู้ว่าอาจมีข้อสรุปทั่วไปในการตอบสนองที่นี่ แต่ฉันรู้ว่าฉันไม่จำเป็นต้องซื้อหนังสือและศึกษามันอย่างเข้มข้นเพื่อเริ่มต้นที่จะสามารถนำไปใช้ในทางปฏิบัติที่ไม่ใช่พารามิเตอร์ในระดับหนึ่ง
Taal

t

ประชดของทั้งหมดนี้คือฉันจะไม่ใช้มันเลยอาจจะเป็นเพียงแค่รบกวนฉันว่าฉันไม่สามารถได้รับคำตอบที่ตรงกับสิ่งที่มันเป็น คำตอบของเกล็นนั้นมากเกินกว่าที่ฉันคาดไว้และได้มา แต่เดิม - คำตอบที่ดีที่สุดที่ฉันรู้สึกว่าฉันไม่สามารถอธิบายได้เพราะคำอธิบายใด ๆ ที่จะพิสูจน์ได้ไม่เพียงพอ ชอบบอกใครสักคนว่าสีฟ้ามีลักษณะอย่างไร หากคุณได้อ่านใด ๆ ของสิ่ง whuber ก็เสียงเหมือนคุณอาจจะมีรสชาติคล้ายกัน ...
Taal


6

คุณขอให้แก้ไขถ้าผิด นี่คือความคิดเห็นบางส่วนภายใต้หัวข้อที่จะเสริมคำแนะนำในเชิงบวกของ @Peter Flom

  • "ไม่ใช่พารามิเตอร์อาศัยค่ามัธยฐานแทนค่าเฉลี่ย": บ่อยครั้งในทางปฏิบัติ แต่นั่นไม่ใช่คำจำกัดความ การทดสอบที่ไม่ใช่พารามิเตอร์หลายตัว (เช่นไคสแควร์) ไม่มีอะไรเกี่ยวข้องกับค่ามัธยฐาน

  • อาศัยองศาอิสระแทนส่วนเบี่ยงเบนมาตรฐาน มันสับสนมาก แนวคิดเรื่ององศาอิสระไม่มีทางเลือกอื่นสำหรับค่าเบี่ยงเบนมาตรฐาน องศาอิสระเป็นแนวคิดที่ใช้ข้ามสถิติ

  • "แหล่งข้อมูลเฉพาะที่ฉันควรหรือไม่ควรใช้": คำถามนี้ไม่มีอะไรเกี่ยวข้องกับการทดสอบความสำคัญที่คุณใช้ซึ่งเป็นเพียงความแตกต่างระหว่างชุดย่อยของข้อมูลและเป็นประโยคในแง่ของความแตกต่างระหว่างค่ามัธยฐาน


ฉันเชื่อว่าสิ่งที่คุณใช้ในการขอให้ฉัน "แก้ไขให้ถูกที่ผิด" ได้รับการตอบสนองที่ดีที่สุดจนถึง ฉันคิดว่าฉันต้องการสมมติฐานว่างสองสามข้อที่หักล้างหรือเรียนรู้โดยกระบวนการกำจัด คำตอบของคุณทำให้ฉันได้รับข้อมูลใหม่ที่ฉันเข้าใจ - ยังมีช่องโหว่ขนาดใหญ่ในการทำความเข้าใจในหัวข้อ แต่ฉันไม่สามารถคาดหวังความสมบูรณ์แบบได้ บางทีหลุมเหล่านั้นใหญ่กว่าที่ฉันคาดไว้ตั้งแต่แรกเมื่อเขียนคำถามนี้และ stackexchange อาจไม่เพียงพอไม่ว่าฉันจะสร้างคำถามแบบช่างพูดก็ตาม
Taal

4

คุณ "ต้องการ" สิ่งเดียวกันจากค่า p ที่นี่ที่คุณต้องการในการทดสอบอื่น ๆ

สถิติ U คือผลลัพธ์ของการคำนวณเช่นเดียวกับสถิติ t อัตราต่อรองสถิติ F หรือสิ่งที่คุณมี สามารถพบสูตรได้หลายแห่ง มันไม่ง่าย แต่ก็ไม่มีสถิติการทดสอบอื่น ๆ จนกว่าคุณจะชินกับมัน (เราจำได้ว่า 2 อยู่ในช่วงที่สำคัญเพราะเราเห็นพวกมันตลอดเวลา)

ส่วนที่เหลือของผลลัพธ์ในข้อความบล็อกของคุณควรมีความชัดเจน

สำหรับการแนะนำทั่วไปเพิ่มเติมเกี่ยวกับการทดสอบแบบไม่มีพารามิเตอร์ฉัน echo @NickCox .... ขอหนังสือดี ไม่ใช่พารามิเตอร์ก็หมายความว่า "ไม่มีพารามิเตอร์"; มีการทดสอบแบบไม่อิงพารามิเตอร์และสถิติสำหรับจุดประสงค์ที่หลากหลาย


ใช่เป็นหนังสือที่ดีจะช่วย; อย่างไรก็ตามดูเหมือนว่าไม่จำเป็นสำหรับทรัพยากรของวันนี้ (เช่น stackexchange), wikipedia (บางครั้ง), การแข่งขันในตลาด youtube (คุณรู้หรือไม่ว่าในแต่ละล้านครั้งที่มีคนเข้ามารับเงิน $ 4,000?) รวมถึงทรัพยากรอื่น ๆ โดยทั่วไปแล้วสไตล์การเรียนรู้ของฉันก็ล้มเหลวอย่างหนักในการเรียนรู้หนังสือแบบเรียบง่ายเช่นกัน
Taal

1
ฉันขอบคุณโพสต์ของคุณ แต่จริงๆแล้วมันย้ำส่วนใหญ่ของสิ่งที่ฉันรู้แล้วหรือคิดว่าน่าเสียดาย ดูเหมือนว่าจะมีรูปแบบบางอย่างที่เกือบทุกคำอธิบายที่ฉันหยุดที่จุดนี้ บางทีนี่อาจเป็นจุดที่ซับซ้อนเกินไปที่จะอธิบายหรือพยายามมากเกินไป - ฉันไม่แน่ใจ ไม่ว่าจะด้วยวิธีใดมันเป็นรูปแบบที่ฉันได้รับจากแหล่งข้อมูลทุกครั้งที่ฉันใช้เป็นประจำ บางทีฉันไม่ได้ตระหนักถึงคำตอบที่ซับซ้อนมาก จากนั้นอีกครั้งฉันก็เห็นคำตอบที่เข้มข้นใน SE
Taal

2
ก่อนอื่นคุณขอให้เราลดความซับซ้อนจากนั้นคุณบ่นว่าคำตอบของเรานั้นง่าย! ถ้าคุณต้องการที่จะเข้าใจสูตรสำหรับ U (หรืออย่างอื่น) ดูที่มัน ถ้าคุณต้องการบางสิ่งที่เรียบง่ายไม่ต้องถามถึงความซับซ้อน! รายการ Wikipedia เป็นรายการที่มีรายละเอียดยอดเยี่ยมพร้อมรายละเอียดทั้งหมด คุณไม่เข้าใจ ดังนั้น. คุณต้องการอะไร?
Peter Flom - Reinstate Monica

1
ฉันคิดว่าอยู่ระหว่าง ฉันยอมรับว่าฉันสื่อสารไม่เก่งที่สุดและฉันเข้าใจว่าคุณรู้สึกหงุดหงิดงั้นเหรอ เป็นลักษณะของฉันจริง ๆ แล้วฉันรู้มาก พูดตามตรงฉันคิดว่าฉันจะต้องคิดถึงสิ่งที่ฉันต้องการจริง ๆ - ราวกับว่าฉันกำลังพยายามสะกิดคำถามให้มากพอที่จะซ้อนทับกันในพื้นที่ที่ฉันไม่รู้หรือไม่รู้มาก่อน เกี่ยวกับ เป็นการยากที่จะถามเกี่ยวกับสิ่งที่คุณไม่เข้าใจโดยทั่วไป ฉันจะต้องกลับมาที่นี้ฉันคิดว่า
Taal

1

เพื่อเป็นการตอบสนองต่อคำถามที่เพิ่งปิดไปนี้จะกล่าวถึงข้างต้นเช่นกัน ด้านล่างเป็นคำพูดจากการทดสอบสถิติแจกฟรีแบบดั้งเดิมของแบรดลีย์(1968, หน้า 15–16) ซึ่งในขณะที่ความยาวเล็กน้อยเป็นคำอธิบายที่ชัดเจนทีเดียวผมเชื่อว่า

คำศัพท์ที่ไม่เกี่ยวกับพารามิเตอร์และการแจกแจงนั้นไม่ใช่คำพ้องความหมายและ norterm ให้คำอธิบายที่น่าพอใจอย่างสมบูรณ์เกี่ยวกับระดับของสถิติที่พวกเขาตั้งใจจะอ้างถึง ... การพูดการทดสอบที่ไม่ใช่พารามิเตอร์นั้นไม่มีสมมติฐานใด ๆ เกี่ยวกับค่าพารามิเตอร์ ในฟังก์ชันความหนาแน่นเชิงสถิติในขณะที่การทดสอบที่ไม่มีการแจกแจงนั้นเป็นสิ่งที่ไม่มีข้อสมมติฐานเกี่ยวกับรูปแบบที่แม่นยำของประชากรตัวอย่าง คำจำกัดความนั้นไม่ได้เกิดร่วมกันอย่างเฉพาะเจาะจงและการทดสอบสามารถเป็นได้ทั้งการแจกแจงแบบอิสระและแบบอิงพารามิเตอร์…เพื่อให้ชัดเจนเกี่ยวกับความหมายของการแจกแจงแบบอิสระนั้นจำเป็นต้องแยกความแตกต่างระหว่างการแจกแจงสามแบบ: (a) ประชากรตัวอย่าง (b) ของลักษณะการสังเกตที่ใช้จริงโดยการทดสอบ และ (c) สถิติการทดสอบ การแจกแจงจากการทดสอบนั้น "ฟรี" คือของ (a), ประชากรตัวอย่าง และอิสรภาพที่พวกเขาได้รับนั้นมักจะสัมพันธ์กัน ... อย่างไรก็ตามข้อสันนิษฐานนั้นไม่ได้อธิบายอย่างละเอียดว่าเป็นประชากรที่ระบุการกระจายอย่างสมบูรณ์ ... เหตุผล ... นั้นง่ายมาก: ขนาดไม่ได้ถูกนำมาใช้ในการทดสอบ [nonparametric] และไม่มีแอตทริบิวต์อื่น ๆ ที่เชื่อมโยงอย่างยิ่งกับประชากรของตัวแปร แทน และไม่มีแอตทริบิวต์อื่น ๆ ที่เชื่อมโยงอย่างยิ่งกับประชากรของตัวแปร แทน และไม่มีแอตทริบิวต์อื่น ๆ ที่เชื่อมโยงอย่างยิ่งกับประชากรของตัวแปร แทนตัวอย่าง - การเชื่อมโยงลักษณะพิเศษของการสังเกตการณ์ที่ได้รับ ... ให้ข้อมูลทางสถิติที่ใช้โดยสถิติการทดสอบ ... ดังนั้นในขณะที่การทดสอบทั้งแบบพารามิเตอร์และแบบไม่อิงพารามิเตอร์จำเป็นต้องให้แบบฟอร์มการแจกแจงที่เกี่ยวข้องกับการสังเกตเป็นที่รู้กันอย่างครบถ้วน โดยทั่วไปแล้วไม่ใช่โฆษณาที่กำลังจะมาถึงดังนั้นการกระจายของขนาดที่ต้องการจึงต้อง "สันนิษฐาน" หรืออนุมานบนพื้นฐานของข้อมูลโดยประมาณหรือไม่สมบูรณ์ ในกรณีที่ไม่ใช่พารามิเตอร์บนที่อื่น ๆ และการกระจายของลักษณะการสังเกตมักเป็นที่รู้จักอย่างแม่นยำจากข้อควรพิจารณาเบื้องต้นและไม่จำเป็นต้อง "สันนิษฐาน" ความแตกต่างนั้นไม่ใช่หนึ่งในข้อกำหนด แต่เป็นสิ่งที่ต้องการและแน่นอนว่าจะต้องปฏิบัติตามข้อกำหนด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.