ทำไมความโด่งของการแจกแจงแบบปกติคือ 3 แทนที่จะเป็น 0


18

โดยความหมายของคำว่า kurtosis ของการแจกแจงแบบปกติคือ 3 หมายความว่าบนเส้นแนวนอนค่า 3 สอดคล้องกับความน่าจะเป็นสูงสุดหรือ 3 คือโหมดของระบบ?

เมื่อฉันดูเส้นโค้งปกติดูเหมือนว่าจุดสูงสุดเกิดขึ้นที่ศูนย์กลางหรือที่ 0 ดังนั้นเหตุใดเคิร์ตซีสจึงไม่เป็น 0 และแทนที่จะเป็น 3


6
ตามที่ @Glen_b เขียนค่าสัมประสิทธิ์ "kurtosis" ถูกกำหนดเป็นช่วงเวลามาตรฐานที่สี่: มันจึงเกิดขึ้นว่าสำหรับการกระจายปกติμ4=3σ4ดังนั้นβ2=3 โด่งเกินมักจะแสดงโดยγ2คือγ2=β2(ปกติ)-3 ต้องใช้ความระมัดระวังเพราะบางครั้งผู้เขียนเขียน "kurtosis" และพวกเขาหมายถึง "เกิน kurtosis"
β2=E[(Xμ)4](E[(Xμ)2])2=μ4σ4
μ4=3σ4β2=3γ2γ2=β2(Normal)3
Alecos Papadopoulos

1
เรื่องความคิดเห็นก่อนหน้าของฉัน การแสดงออกที่ถูกต้องสำหรับค่าสัมประสิทธิ์เคิร์ตซีเกินคือ
γ2=β2β2(Normal)=β23
Alecos Papadopoulos

คำตอบ:


29

Kurtosis ไม่ใช่ตำแหน่งของจุดสูงสุด อย่างที่คุณพูดนั่นเรียกว่าโหมดแล้ว

Kurtosis เป็นช่วงเวลามาตรฐานที่สี่: ถ้าเป็นรุ่นมาตรฐานของตัวแปรที่เราดูอยู่จากนั้นประชากรที่มีกำลังเฉลี่ยที่สี่ของตัวแปรมาตรฐานนั้น E(Z4) ตัวอย่างความเกี่ยวข้องเกี่ยวข้องกับค่าเฉลี่ยกำลังสี่ของค่าตัวอย่างมาตรฐาน (ในบางกรณีมันถูกปรับอัตราส่วนโดยปัจจัยที่ไป 1 ในตัวอย่างขนาดใหญ่)Z=XμσE(Z4)

ดังที่คุณทราบช่วงเวลามาตรฐานที่สี่นี้คือ 3 ในกรณีของตัวแปรสุ่มปกติ ในฐานะที่เป็นอเล็กซ์บันทึกไว้ในความคิดเห็นบางคนนิยามความหมายเป็น ; บางครั้งเรียกว่าkurtosis ที่มากเกินไป (มันก็เป็น cumulant ที่สี่) เมื่อเห็นคำว่า 'kurtosis' คุณจำเป็นต้องระลึกถึงความเป็นไปได้ที่ผู้คนต่างใช้คำเดียวกันเพื่ออ้างถึงปริมาณที่แตกต่างกันสอง (แต่เกี่ยวข้องอย่างใกล้ชิด)E(Z4)3

Kurtosis มักจะอธิบายว่า peakedness * (พูดว่ายอดเขาโค้งอย่างแหลมคม - ซึ่งน่าจะเป็นความตั้งใจในการเลือกคำว่า "kurtosis") หรือ tailedness หนัก (มักเป็นสิ่งที่ผู้คนสนใจใช้ในการวัด) แต่ใน ความจริงที่เกิดขึ้นจริงช่วงเวลามาตรฐานที่สี่ปกติไม่ได้วัดสิ่งเหล่านั้นอย่างใดอย่างหนึ่ง

อันที่จริงปริมาตรแรกของเคนดัลล์และสจวร์ตมอบตัวอย่างที่แสดงให้เห็นว่าความโด่งที่สูงขึ้นนั้นไม่จำเป็นต้องเกี่ยวข้องกับยอดเขาที่สูงขึ้น (ในตัวแปรที่เป็นมาตรฐาน) หรือหางที่อ้วนขึ้น (ในทำนองเดียวกันว่าช่วงเวลาที่สาม คิดว่ามันทำ)

อย่างไรก็ตามในหลาย ๆ สถานการณ์มีแนวโน้มที่จะเกี่ยวข้องกับทั้งสองอย่างในความแหลมที่มากขึ้นและความหางที่หนักมากมักจะเห็นได้เมื่อ kurtosis สูงขึ้น - เราควรระวังให้ดีคิดว่ามันจำเป็น

Kurtosis และความเบ้มีความสัมพันธ์กันอย่างมาก (kurtosis ต้องมีอย่างน้อย 1 มากกว่าจัตุรัสของความเบ้การตีความของ kurtosis ค่อนข้างง่ายขึ้นเมื่อการกระจายค่อนข้างสมมาตร

ป้อนคำอธิบายรูปภาพที่นี่

ดาร์ลิงตัน (1970) และทุ่ง (2529) แสดงให้เห็นว่าช่วงเวลาที่สี่ของการวัดความโด่งดังของ kurtosis นั้นมีความแปรปรวนของผลกระทบเกี่ยวกับ "ไหล่" - และ Balanda และ MacGillivray (1988) แนะนำให้นึกถึงเงื่อนไขที่คลุมเครือ และพิจารณาวิธีอื่นในการวัด) ถ้าการแจกแจงกระจุกตัวใกล้กับμ ± σ , kurtosis นั้นเล็ก (จำเป็น) เล็ก ๆ , ในขณะที่ถ้าการกระจายกระจายออกไปจาก μ ± σ (ซึ่งจะมีแนวโน้มที่จะกองพะเนินเทินทึกในใจกลางพร้อมกันและเคลื่อนย้ายความน่าจะเป็นเข้าไปในหาง เพื่อที่จะย้ายมันออกไปจากบ่า), ช่วงเวลาที่สี่จะมีขนาดใหญ่ขึ้นμ±σμ±σμ±σ

De Carlo (1997) เป็นสถานที่เริ่มต้นที่สมเหตุสมผล (หลังจากแหล่งข้อมูลพื้นฐานเพิ่มเติมเช่น Wikipedia) สำหรับการอ่านเกี่ยวกับ kurtosis

แก้ไข: ฉันเห็นการซักถามเป็นครั้งคราวว่าค่าความแหลมที่สูงขึ้น (ค่าใกล้ 0) สามารถส่งผลต่อ kurtosis ได้หรือไม่ คำตอบคือใช่แน่นอนมันสามารถ นั่นคือกรณีนี้เป็นผลมาจากการที่มันเป็นช่วงเวลาที่สี่ของตัวแปรมาตรฐาน - เพื่อเพิ่มช่วงเวลาที่สี่ของตัวแปรมาตรฐานคุณต้องเพิ่มในขณะที่ถือE ( Z 2 )อย่างต่อเนื่อง ซึ่งหมายความว่าการเคลื่อนไหวของความน่าจะเป็นต่อไปที่หางจะต้องมาพร้อมกับบางอย่างเพิ่มเติมใน (ภายใน( - 1 , 1 )E(Z4)E(Z2) (1,1)); และในทางกลับกัน - ถ้าคุณวางน้ำหนักไว้ที่กึ่งกลางมากขึ้นในขณะที่ถือความแปรปรวนไว้ที่ 1 คุณก็จะเอาหางไปด้วย

[NB ตามที่กล่าวไว้ในความคิดเห็นนี้ไม่ถูกต้องตามคำแถลงทั่วไป จำเป็นต้องใช้คำสั่งที่แตกต่างกันบ้างที่นี่]

ผลกระทบของความแปรปรวนที่ถูกจัดขึ้นอย่างต่อเนื่องนี้เชื่อมโยงโดยตรงกับการอภิปรายของ kurtosis ว่า "การเปลี่ยนแปลงเกี่ยวกับไหล่" ในเอกสารของดาร์ลิงตันและมัวร์ ผลลัพธ์นั้นไม่ใช่ความคิดด้วยมือบางอย่าง แต่ความเท่าเทียมกันทางคณิตศาสตร์ที่ธรรมดา - อย่างใดอย่างหนึ่งไม่สามารถถือเป็นอย่างอื่นโดยไม่แสดง kurtosis ผิด

(1,1)(1,1)

[การรวมเคนดอลและสจวร์ตของฉันไว้ในเอกสารอ้างอิงเป็นเพราะการสนทนาของพวกเขาเกี่ยวกับความรุนแรงยังเกี่ยวข้องกับประเด็นนี้ด้วย]

แล้วเราจะพูดอะไรได้? โด่งมักจะเกี่ยวข้องกับยอดที่สูงขึ้นและมีหางหนักโดยไม่ต้องมีที่จะเกิดขึ้นอย่างใดอย่างหนึ่งเหี่ยวแห้ง แน่นอนว่ามันง่ายกว่าที่จะยกระดับความโด่งด้วยการเล่นกับหาง (เนื่องจากเป็นไปได้ที่จะได้รับมากกว่า 1 sd) แล้วปรับศูนย์กลางให้คงที่ค่าความแปรปรวน แต่นั่นไม่ได้หมายความว่าจุดสูงสุดจะไม่มีผลกระทบ มันทำอย่างมั่นใจและสามารถจัดการกับความโด่งโดยมุ่งเน้นที่มันแทน Kurtosis ส่วนใหญ่ แต่ไม่เพียง แต่เกี่ยวข้องกับความหนักเบาของหาง - อีกครั้งลองดูความแปรปรวนเกี่ยวกับผลลัพธ์ของไหล่ หากสิ่งใดที่เป็นสิ่งที่ kurtosis มองในแง่คณิตศาสตร์ที่หลีกเลี่ยงไม่ได้

อ้างอิง

Balanda, KP และ MacGillivray, HL (1988),
"Kurtosis: บทวิจารณ์ที่สำคัญ"
นักสถิติชาวอเมริกัน 42 , 111-119

ดาร์ลิงตันริชาร์ดบี (1970),
"เคิร์ตซีส" ความแหลม "จริง ๆ หรือไม่?"
สถิติอเมริกัน 24 , 19-22

Moors, JJA (1986),
"ความหมายของ kurtosis: Darlington reexamined"
สถิติชาวอเมริกัน 40 , 283-284

DeCarlo, LT (1997),
"ในความหมายและการใช้งานของ kurtosis"
จิตวิทยา วิธีการ2 , 292-307

Kendall, MG, และ A. Stuart,
The Advanced Theory of Statistics ,
Vol. 1, 3 เอ็ด
(ฉบับล่าสุดมี Stuart และ Ord)


03

1
บทความของ Westfall เกี่ยวกับ kurtosis, ชื่อว่า Kurtosis ในฐานะ Peakedness, 1905-2014 RIP มีมูลค่าการพิจารณา มันวิพากษ์วิจารณ์ DeCarlo (กลุ่มคนอื่น ๆ ที่ระบุไว้ข้างต้น) สำหรับการเผยแพร่ความรู้ของ kurtosis เป็นวัดจุดเชื่อมโยงที่นี่: ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Lil'Lobster

1
@Lil ฉันคิดว่า Westfall คุยโวเรื่องของเขา โดย (เกือบ) มุ่งเน้นไปที่หางที่หนักหน่วงทั้งหมดเขาไม่ถูกต้องอย่างเคร่งครัด ในขณะที่ kurtosis มีความสัมพันธ์อย่างแนบแน่นกับหางที่มีน้ำหนักมาก แต่ Kurtosis นั้นไม่ได้มีความหนักหาง (counterexamples ที่หางที่หนักกว่าไปกับ kurtosis ที่ต่ำกว่านั้นหาได้ง่ายเช่นเดียวกับที่กล่าวถึงในเอกสารอ้างอิงข้างต้น Kurtosis มีความสัมพันธ์กับความแหลมน้อยลงอย่างมาก แต่ก็ยังมีความเกี่ยวข้องอยู่ โดยการยืนยันว่ามันไม่ใช่ความแหลมเขาไปไกลเกินไปในการวิพากษ์วิจารณ์ของเขา ... ctd
Glen_b -Reinstate Monica

1
Glen_b ทั้งคุณและฉันรักคณิตศาสตร์ หากคุณกำลังจะวิพากษ์วิจารณ์ฉันสำหรับ "เกินเลยกรณีของฉัน" โปรดให้ข้อโต้แย้งทางคณิตศาสตร์ของคุณที่เชื่อมต่อ kurtosis ของ Pearson กับ "peakedness"
Peter Westfall

1
Gelen_b ความคิดเห็นของคุณ "นี่หมายความว่าการเคลื่อนที่ของความน่าจะเป็นต่อไปที่หางจะต้องตามมาด้วยใน mu + - sigma และในทางกลับกัน - ถ้าคุณใส่น้ำหนักที่จุดศูนย์กลางมากขึ้นขณะถือความแปรปรวนไว้ที่ 1 คุณก็ใส่ ในหาง "เป็นเท็จ มันจะต้องไม่ คุณสามารถรักษาความน่าจะเป็น (ในความเป็นจริงการกระจายทั้งหมด) ภายในค่า mu + - sigma คงที่และเพิ่มความโด่งเป็นอินฟินิตี้ภายในตระกูลตัวแปรแบบกระจาย ดูที่นี่: math.stackexchange.com/questions/167656/…
Peter Westfall

2

นี่คือการสร้างภาพข้อมูลโดยตรงเพื่อทำความเข้าใจสิ่งที่หมายเลข "3" หมายถึงเกี่ยวกับความโด่งของการแจกแจงแบบปกติ

XZ=(Xμ)/σV=Z4VpV(v)

XpV(v)

XpV(v)XpV(v)X

pV(v)

จากมุมมองนี้การตีความ "หางน้ำหนัก" ที่ถูกต้องโดยหลักของ kurtosis อาจมีลักษณะเฉพาะเจาะจงมากขึ้นว่า "การงัดหาง" เพื่อหลีกเลี่ยงความสับสน ท้ายที่สุดมันเป็นไปได้ที่ความสูงที่เพิ่มขึ้นจะสัมพันธ์กับมวลที่หางน้อยลง แต่ในกรณีที่มวลที่ลดลงนี้อยู่ในตำแหน่งที่ห่างไกลกว่า

"ให้ที่สำหรับฉันยืนและฉันจะย้ายโลก" -Archimedes

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.