ทำไมการทดสอบสมมติฐานขั้นพื้นฐานมุ่งเน้นไปที่ค่าเฉลี่ยและไม่ได้อยู่บนค่ามัธยฐาน?


32

ในหลักสูตรสถิติขั้นพื้นฐานระดับล่างนักเรียนจะได้รับการสอนการทดสอบสมมติฐานสำหรับค่าเฉลี่ยของประชากร
เหตุใดจึงให้ความสำคัญกับค่าเฉลี่ยและไม่ใช่ค่ามัธยฐาน? ฉันเดาว่ามันง่ายกว่าที่จะทดสอบค่าเฉลี่ยเนื่องจากทฤษฎีบทขีด จำกัด กลาง แต่ฉันชอบอ่านคำอธิบายที่มีการศึกษา


3
ค่าเฉลี่ยมีคุณสมบัติที่มีประโยชน์สำหรับความเป็นเอกลักษณ์การคำนวณและแคลคูลัส มันมักจะเกี่ยวข้องกับสถิติที่เพียงพอ
เฮนรี่

คำตอบ:


40

เพราะอลันทัวริงเกิดหลังจากโรนัลด์ฟิชเชอร์

ในสมัยก่อนก่อนคอมพิวเตอร์ทุกอย่างต้องทำด้วยมือหรืออย่างดีที่สุดกับสิ่งที่เราจะเรียกเครื่องคิดเลข การทดสอบสำหรับการเปรียบเทียบสามารถทำได้ด้วยวิธีนี้ - มันลำบาก แต่เป็นไปได้ การทดสอบควอไทล์ (เช่นค่ามัธยฐาน) จะเป็นไปไม่ได้ที่จะทำแบบนี้

ตัวอย่างเช่นการถดถอยแบบควอไทล์อาศัยการลดฟังก์ชั่นที่ค่อนข้างซับซ้อนซึ่งเป็นไปไม่ได้ด้วยมือ เป็นไปได้ด้วยการเขียนโปรแกรม ดูเช่นKoenkerหรือวิกิพีเดีย

Quantile ถดถอยมีสมมติฐานน้อยกว่า OLS ถดถอยและให้ข้อมูลเพิ่มเติม


6
ในเวลานั้นมีคอมพิวเตอร์อยู่ แต่หมายถึงบางสิ่งที่แตกต่างอย่างมากจากสิ่งที่เราหมายถึงตอนนี้
Maarten Buis

6
แน่นอน! คอมพิวเตอร์เป็นคนที่ทำการคำนวณ
Peter Flom - Reinstate Monica

2
@nafrtiti หลักสูตรมีการเปลี่ยนแปลง แต่ช้า มีแรงผลักดันมากมายที่จะเอาชนะได้และผู้คนนอกสถิติไม่คุ้นเคยกับแนวคิดใหม่ดังนั้นอาจปฏิเสธพวกเขา
Peter Flom - Reinstate Monica

3
@SunQingyao Sorting นั้นแพงกว่าการเพิ่มอีกมาก การเพิ่มคือ O (n) และเป็นหนึ่งในการดำเนินงานขั้นพื้นฐานที่สุดของฮาร์ดแวร์และต้องการการลงทะเบียนเพียงครั้งเดียว นอกจากนั้นสิ่งที่ฉันต้องรู้ก็คือจำนวนทั้งหมดและจำนวนของรายการที่มีข้อมูลมากขึ้นและคำนวณค่าเฉลี่ยใหม่ ในการคำนวณค่ามัธยฐานฉันต้องตั้งค่าทั้งหมด
JimmyJames

3
ด้วยการเลือกอย่างรวดเร็ว (และการใช้ค่ามัธยฐานของ 5 เพื่อเลือกเดือยถ้าหมุนไม่ดีแบบสุ่ม) คุณสามารถหาควอไทล์ใน O (N) ทำให้ช่องว่างระหว่างค่ามัธยฐานและค่าเฉลี่ยน้อยลง แน่นอนคุณต้องรู้ว่าวิธีการดังกล่าวมีอยู่ (ซึ่งไม่เป็นที่รู้จักแม้ในเวลา Turings)
Surt

22

ฉันต้องการเพิ่มเหตุผลข้อที่สามให้กับเหตุผลที่ถูกต้องของ Harrell และ Flom เหตุผลคือเราใช้ระยะทางแบบยุคลิด (หรือ L2) และไม่ใช่ระยะทางแบบแมนฮัตตัน (หรือ L1) เป็นตัววัดความใกล้ชิดหรือข้อผิดพลาดมาตรฐานของเรา หากมีจุดข้อมูลจำนวนหนึ่งและต้องการตัวเลขเดียว เพื่อประเมินความคิดที่ชัดเจนคือการหาจำนวนที่ลดจำนวนข้อผิดพลาดที่ทำให้เกิดความแตกต่างน้อยที่สุดระหว่างจำนวนที่เลือกและ ตัวเลขที่ประกอบเป็นข้อมูล ในสัญกรณ์คณิตศาสตร์สำหรับฟังก์ชันข้อผิดพลาดที่กำหนด E ต้องการค้นหาหากมีใครใช้สำหรับ E (x, y) L2 ปกติหรือระยะทางนั่นคือx1,xnθminθR(E(θ,x1,xn)=minθR(i=1i=nE(θ,xi))E(x,y)=(xy)2จากนั้นตัวขยายขนาดเล็กทั้งหมดคือค่าเฉลี่ย หากใครใช้ระยะทาง L1 หรือแมนฮัตตันตัวย่อเล็กสุดเหนือคือค่ามัธยฐาน ดังนั้นค่าเฉลี่ยคือตัวเลือกทางคณิตศาสตร์ตามธรรมชาติ - ถ้าใครใช้ระยะทาง L2!θRθR


6
ตั้งแต่ถูกนำมาใช้ในวงกว้างเพื่อแสดงถึงความคาดหวังของผมขอแนะนำให้เปลี่ยนกับกล่าวว่า{} E ErrEEErr
Richard Hardy

3
บางทีมันก็คุ้มค่าที่จะสังเกตว่านั้นสามารถหาอนุพันธ์ได้ที่ในขณะที่ไม่ใช่. ในความคิดของฉันนี่เป็นเหตุผลที่สำคัญ แต่เหตุผลสำคัญที่ทำให้ MSE แพร่หลายในเวทีสถิติทางคณิตศาสตร์มากกว่าแม่ x = 0 | x |x2x=0|x|
Just_to_Answer

1
@ Just_to_Answer - ฉันคิดว่านั่นเป็นอีกเหตุผลหนึ่งที่ ฉันคิดเกี่ยวกับเรื่องนี้หลายปี สำหรับฉันฉันได้ข้อสรุปว่าสิ่งที่คุณพูดนั้นเชื่อมโยงกับสาเหตุที่เรามักใช้ Euclidean ไม่ใช่ระยะทางแมนฮัตตัน :)
aginensky

19

บ่อยครั้งที่ค่าเฉลี่ยถูกเลือกมากกว่าค่ามัธยฐานไม่ใช่เพราะมันเป็นตัวแทนที่แข็งแกร่งกว่าหรือมีความหมาย แต่เป็นเพราะผู้คนสับสนกับตัวประมาณ อีกวิธีหนึ่งบางคนเลือกค่าเฉลี่ยประชากรเป็นปริมาณดอกเบี้ยเพราะด้วยการแจกแจงแบบปกติค่าเฉลี่ยตัวอย่างจะแม่นยำกว่าค่ามัธยฐานตัวอย่าง แต่พวกเขาควรคิดให้มากขึ้นเกี่ยวกับปริมาณดอกเบี้ยที่แท้จริง

แถบด้านข้างหนึ่ง: เรามีช่วงความเชื่อมั่นแบบไม่มีพารามิเตอร์สำหรับค่ามัธยฐานของประชากร แต่ไม่มีวิธีการแบบไม่มีพารามิเตอร์ (นอกเหนือจากวิธีการเชิงประจักษ์เชิงตัวเลขอย่างเข้มข้น) เพื่อให้ได้ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยประชากร ถ้าคุณต้องการพักแบบกระจายคุณอาจมีสมาธิอยู่กับค่ามัธยฐาน

โปรดทราบว่าทฤษฎีบทขีด จำกัด กลางนั้นมีประโยชน์น้อยกว่าที่คิดไว้ดังที่ได้กล่าวไว้ที่อื่นในเว็บไซต์นี้ สันนิษฐานว่าความแปรปรวนเป็นที่รู้จักอย่างมีประสิทธิภาพหรือการแจกแจงแบบสมมาตรและมีรูปร่างเช่นนั้นความแปรปรวนตัวอย่างเป็นตัวประมาณการแข่งขันของการกระจายตัว


2
ฉันเชื่อว่าเป็นไปได้ที่จะสร้างช่วงความเชื่อมั่นที่ไม่ใช่พารามิเตอร์สำหรับค่าเฉลี่ย - พูดผ่านการทดสอบการเปลี่ยนแปลง (สามารถทำได้ภายใต้สมมติฐานของความสมมาตรโดยไม่ต้องสมมติรูปแบบการทำงานเฉพาะใด ๆ ) นั่นเป็นสถานการณ์ที่ค่อนข้าง จำกัด แม้ว่ามันจะเป็นไปได้ภายใต้สมมติฐานอื่นที่ไม่ใช่สมมาตร หากคุณพร้อมที่จะจัดการกับความครอบคลุมโดยประมาณที่มาพร้อมกับการบูตสแตรปปิ้งคุณสามารถรับช่วงเวลาแบบไม่มีพารามิเตอร์ได้โดยไม่มีการตั้งสมมติฐานเช่นสมมาตร
Glen_b -Reinstate Monica

2
ถ้ามันถือว่าสมมาตรมันเป็นพารามิเตอร์ ไม่เคยเห็นสิ่งนี้ขยายไปสู่กรณีที่ไม่สมมาตร bootstrap (ตัวแปรทั้งหมดยกเว้นบางทีวิธีการ studentized) ไม่ถูกต้องอย่างมากภายใต้ความไม่สมดุลอย่างรุนแรง ดูstats.stackexchange.com/questions/186957
Frank Harrell

5
ความสมมาตรไม่ใช่พารามิเตอร์ จำกัด การทดสอบยศวิลคอกซันลงนามถือว่าสมมาตร (เพื่อให้มีการแลกเปลี่ยนสัญญาณ) ภายใต้ศูนย์ คุณจะเรียกว่าพารามิเตอร์
Glen_b -Reinstate Monica


2
ใน @Glen_b คำถามเกี่ยวกับความสมมาตร - เป็นคำถามที่ยอดเยี่ยม การทดสอบ Wilcoxon ที่ได้รับการจัดอันดับเป็นกรณีที่น่าสนใจเพราะไม่เหมือนกับการทดสอบตัวอย่าง WIlcoxon 2 ทำให้สมมติฐานที่สมมาตรหนัก ฉันเดาว่าคุณสามารถพูดได้ว่าคุณไม่ได้เป็นตัวแปรในขณะที่ยังคงต้องการสมมติฐานทั่วไปเช่นสมมาตร บางทีคำศัพท์ควรจะเป็น "nonparametric มีข้อ จำกัด "? ในทางตรงกันข้ามการทดสอบตัวอย่างที่ไม่ใช่พารามิเตอร์ 2 นั้นมีข้อ จำกัด เกี่ยวกับข้อผิดพลาดประเภท II ที่เหมาะสม (แต่ไม่ใช่ข้อผิดพลาดประเภท I)
Frank Harrell
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.