ความสัมพันธ์เชิงประจักษ์ระหว่างค่าเฉลี่ยมัธยฐานและโหมด


40

สำหรับการกระจายแบบ unimodal ที่มีความเบ้ปานกลางเรามีความสัมพันธ์เชิงประจักษ์ระหว่างค่าเฉลี่ยมัธยฐานและโหมด: ความสัมพันธ์นี้เป็นอย่างไร มา?

(Mean - Mode)3(Mean - Median)

คาร์ลเพียร์สันได้พล็อตความสัมพันธ์เหล่านี้หลายพันรายการก่อนก่อให้เกิดข้อสรุปนี้หรือมีเหตุผลที่สมเหตุสมผลในความสัมพันธ์นี้หรือไม่?

คำตอบ:


29

แสดงว่าค่าเฉลี่ย (ค่าเฉลี่ย),ค่ามัธยฐาน,ส่วนเบี่ยงเบนมาตรฐานและโหมดในที่สุดให้เป็นตัวอย่างการสำนึกของการแจกแจง unimodal แบบต่อเนื่องซึ่งมีอยู่สองช่วงแรกm σ M X FμmσMXF

เป็นที่รู้จักกันดีว่า

(1)|μm|σ

นี่คือแบบฝึกหัดตำราเรียนที่พบบ่อย:

|μm|=|E(Xm)|E|Xm|E|Xμ|=E(Xμ)2E(Xμ)2=σ
ตัวแรก ความเสมอภาคเกิดขึ้นจากคำจำกัดความของค่าเฉลี่ยที่สามเกิดขึ้นเนื่องจากค่ามัธยฐานเป็นตัวย่อขนาดที่ไม่ซ้ำกัน (ในบรรดาทั้งหมด) ของและอันที่สี่จากความไม่เท่าเทียมของเจนเซ่น (เช่นนิยามของฟังก์ชันนูน) ที่จริงแล้วความไม่เท่าเทียมนี้สามารถทำให้แน่นขึ้นได้ ในความเป็นจริงสำหรับใด ๆ ที่พอใจเงื่อนไขข้างต้นก็สามารถแสดงให้เห็นว่า [3]E | X - c | FcE|Xc|F

(2)|mμ|0.6σ

แม้ว่าโดยทั่วไปแล้วจะไม่เป็นความจริง ( Abadir, 2005 ) ว่าการแจกแจงแบบ unimodal ใด ๆ จะต้องตอบสนองอย่างใดอย่างหนึ่งของ มันยังสามารถแสดงให้เห็นว่า ความไม่เสมอภาค

Mmμ or Mmμ

(3)|μM|3σ

เก็บไว้สำหรับการกระจาย unimodal ใด ๆ , สี่เหลี่ยมจัตุรัส integrable (โดยไม่คำนึงถึงความเอียง) สิ่งนี้ได้รับการพิสูจน์อย่างเป็นทางการในJohnson และ Rogers (1951)ถึงแม้ว่าการพิสูจน์จะขึ้นอยู่กับบทแทรกเสริมมากมายที่ยากที่จะทำให้พอดี ไปดูกระดาษต้นฉบับ


มีเงื่อนไขเพียงพอสำหรับการแจกแจงเพื่อตอบสนองใน [2] ถ้า :μ เมตรM FFμmMF

(4)F(mx)+F(m+x)1 for all x

แล้วM ยิ่งกว่านั้นถ้าดังนั้นความไม่เท่าเทียมนั้นก็เข้มงวด Pearson Type I to XII distributions เป็นหนึ่งในตัวอย่างของตระกูลการแจกแจงที่พอใจ [4] (ตัวอย่างเช่น Weibull คือการแจกแจงทั่วไปที่หนึ่งที่ไม่ถือดู [5])μ เมตร( 4 ) ( 4 )μmMμm(4)(4)

ตอนนี้สมมติว่าถืออย่างเคร่งครัดและ wlog ที่เรามี σ = 1 3 ( m - μ ) ( 0 , 3 (4)σ=1

3(mμ)(0,30.6] and Mμ(mμ,3]

และเนื่องจากช่วงที่สองของช่วงสองช่วงนี้ไม่ว่างจึงเป็นไปได้ที่จะพบการแจกแจงที่การยืนยันเป็นจริง (เช่นเมื่อ ) ช่วงของค่าของการกระจายบางพารามิเตอร์ แต่มันไม่เป็นความจริงสำหรับการกระจายและไม่ได้สำหรับการกระจายความพึงพอใจทั้งหมด(4)(4)0<mμ<33<σ=1(4)

  • [0]: ปัญหาเวลาสำหรับการแจกจ่ายแบบ Unimodal NL Johnson และ CA Rogers พงศาวดารของสถิติคณิตศาสตร์ฉบับที่ 22, ลำดับที่ 3 (ก.ย. , 1951), หน้า 433-439
  • [1]: ความไม่เท่าเทียมกันของค่ามัธยฐานโหมด: คู่ตัวอย่าง Karim M. Abadir ทฤษฎีเศรษฐมิติ, ฉบับที่ 1 21, ฉบับที่ 2 (เม.ย. , 2005), หน้า 477-482
  • [2]: WR van Zwet, ค่าเฉลี่ย, มัธยฐาน, โหมด II, Statist Neerlandica, 33 (1979), pp. 1--5
  • [3]: ความหมาย, ค่ามัธยฐานและโหมดการแจกแจงแบบ Unimodal: การอธิบายลักษณะ S. Basu และ A. DasGupta (1997) ทฤษฎี Probab Appl., 41 (2), 210–223
  • [4]: ข้อสังเกตบางอย่างเกี่ยวกับค่าเฉลี่ยมัธยฐานโหมดและความเบ้ Michikazu Sato วารสารสถิติออสเตรเลีย เล่มที่ 39 ฉบับที่ 2 หน้า 219–224 มิถุนายน 1997
  • [5]: PT von Hippel (2005) Mean, Median และ Skew: การแก้ไขกฎของตำราเรียน วารสารสถิติการศึกษาเล่มที่ 13, หมายเลข 2.

ฉันขอโทษฉันเป็นแค่นักเรียนคณิตศาสตร์ปีแรก คุณช่วยระบุ / แนะนำลิงค์ / หนังสือ / กระดาษที่อธิบายถึงความสัมพันธ์ที่ได้รับมาได้อย่างไร
ซาร่า

3
@Sara ฉันคิดว่ามันย้อนกลับไปที่ Karl Pearson ซึ่งใช้ความสัมพันธ์เชิงประจักษ์กับ "Pearson mode skewness" ของเขา นอกเหนือจากนี้คุณอาจพบที่น่าสนใจบทความออนไลน์นี้j.mp/aWymCv
chl

ขอบคุณ chl และ kwak สำหรับลิงก์และคำตอบที่คุณให้ไว้ ฉันจะศึกษาพวกเขา
Sara

2
E|Xk|kX

1
|Mμ|3|μm|

9

กระดาษ chl ชี้ให้ข้อมูลที่สำคัญบางอย่าง - แสดงให้เห็นว่ามันไม่ได้อยู่ใกล้กับกฎทั่วไป (แม้สำหรับตัวแปรต่อเนื่อง, ราบรื่น, "มีพฤติกรรมที่ดี" เช่น Weibull) ดังนั้นแม้ว่ามันอาจจะเป็นจริงโดยประมาณ แต่ก็ไม่บ่อยนัก

เพียร์สันมาจากไหน เขามาถึงที่ประมาณนี้ได้อย่างไร

โชคดีที่เพียร์สันบอกเราด้วยคำตอบของตัวเอง

การใช้คำว่า "เอียง" ครั้งแรกในแง่ที่เรากำลังใช้ดูเหมือนจะเป็นเพียร์สัน, 1895 [1] (มันปรากฏในชื่อเรื่อง) บทความนี้ดูเหมือนจะเป็นที่ที่เขาแนะนำโหมดคำศัพท์(เชิงอรรถ, p345):

ฉันพบว่ามันสะดวกที่จะใช้โหมดคำศัพท์สำหรับ abscissa ที่สอดคล้องกับการกำหนดความถี่สูงสุด "ค่าเฉลี่ย" โหมด "" และ "ค่ามัธยฐาน" มีอักขระที่แตกต่างกันสำคัญสำหรับนักสถิติ

นอกจากนี้ยังดูเหมือนจะเป็นจริงครั้งแรกของเขาที่มีรายละเอียดของของระบบการทำงานของเส้นโค้งความถี่

ดังนั้นในการหารือเกี่ยวกับการประมาณค่าพารามิเตอร์รูปร่างในการแจกแจงเพียร์สันType III (สิ่งที่เราเรียกตอนนี้ว่าการเปลี่ยนแปลง - และอาจพลิก - แกมม่า) เขาพูด (p375):

p

>1

x

และถ้าเราดูอัตราส่วนของ (ค่าเฉลี่ยโหมด) ต่อ (ค่าเฉลี่ยมัธยฐาน) สำหรับการแจกแจงแกมม่าเราจะสังเกตสิ่งนี้:

ป้อนคำอธิบายรูปภาพที่นี่

(ส่วนสีน้ำเงินเป็นเครื่องหมายของพื้นที่ Pearson บอกว่าการประมาณนั้นสมเหตุสมผล)

αβ

ป้อนคำอธิบายรูปภาพที่นี่

βα=kβααβααββ+α=cβ+ααβ

α>10

ป้อนคำอธิบายรูปภาพที่นี่

eμσ2,eμeμ+σ2/2

eμeσ2/2eσ2eσ2/21σ232σ212σ2σ2

มีจำนวนพอสมควรของการแจกแจงที่รู้จักกันดี - หลายแห่งซึ่งเพียร์สันคุ้นเคย - ซึ่งใกล้เคียงกับจริงสำหรับค่าพารามิเตอร์ที่หลากหลาย เขาสังเกตเห็นว่ามันมีการแจกแจงแกมม่า แต่จะมีความคิดยืนยันเมื่อเขามาดูการกระจายอื่น ๆ ที่เขาน่าจะพิจารณา

[1]: เพียร์สัน, K. (1895),
"การมีส่วนร่วมกับทฤษฎีทางคณิตศาสตร์ของการวิวัฒนาการ, II: การเปลี่ยนแปลงเอียงในวัสดุที่เป็นเนื้อเดียวกัน,"
ธุรกรรมทางปรัชญาของราชสมาคม, ซีรี่ส์ A, 186, 343-414
[หมดลิขสิทธิ์ มีอิสระที่นี่ ]


4

ความสัมพันธ์นี้ไม่ได้มา มันก็สังเกตเห็นประมาณยึดมั่นในการแจกแจงแบบสมมาตรซึ่งอยู่ใกล้กับสังเกตุ ดูนิทรรศการของเทศกาลคริสต์มาสในบทนำสู่ทฤษฎีสถิติ (1922), หน้า 121, บทที่เจ็ดมาตรา 20 เขานำเสนอตัวอย่างเชิงประจักษ์


+1 แน่นอนคำพูดของฉันที่ Pearson 1895 ระบุว่าเป็นสิ่งที่เขาสังเกตเห็นแทนที่จะได้มา
Glen_b

2
ตำราคณิตศาสตร์เก่า ๆ นั้นสนุกกว่าการอ่านมากกว่าการเขียนในวันนี้
อั
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.