Kurtosis ของการแจกแจงเกี่ยวข้องกับเรขาคณิตของฟังก์ชันความหนาแน่นอย่างไร


12

Kurtosis คือการวัดความแหลมและความเรียบของการแจกแจง ฟังก์ชันความหนาแน่นของการแจกแจงหากมีอยู่สามารถดูเป็นเส้นโค้งและมีคุณสมบัติทางเรขาคณิต (เช่นความโค้งความนูน, ... ) ที่เกี่ยวข้องกับรูปร่างของมัน

ดังนั้นฉันจึงสงสัยว่า kurtosis ของการแจกแจงนั้นเกี่ยวข้องกับคุณสมบัติทางเรขาคณิตของฟังก์ชันความหนาแน่นซึ่งสามารถอธิบายความหมายทางเรขาคณิตของ kurtosis ได้หรือไม่?


ฉันขอความสัมพันธ์บางอย่างในสูตรกับจำนวนเรขาคณิตของเส้นโค้งความหนาแน่นไม่เพียง แต่ความหมายที่คลุมเครือที่ฉันชี้ให้เห็นในโพสต์ของฉัน หรือเป็นเรื่องดีที่มีคำอธิบายว่าทำไม Kurtosis จึงมีความหมายทางเรขาคณิต
ทิม

@ Peter ที่อยู่ไกลจากความจริง หนึ่งสามารถแก้ไขรูปทรงเรขาคณิตของกราฟของ PDF เกือบโดยพลการโดยไม่ต้องเปลี่ยนช่วงเวลาที่ระบุ (จำนวน จำกัด ของ) ใด ๆ
whuber

คำถามที่เกี่ยวข้องอย่างใกล้ชิดที่stats.stackexchange.com/questions/25010/..แสดงให้เห็นว่าคำตอบที่ถูกต้องสำหรับคำถามนี้คืออะไร
whuber

@ โฮเบอร์ในขณะที่ฉันเห็นด้วยและขอบคุณสำหรับตัวอย่างนั้นฉันยังสงสัยว่ามันจะไม่พูดเกี่ยวกับคุณสมบัติที่โดดเด่นของครอบครัวในรูปแบบ pdf โดยเฉพาะมากกว่าที่เกี่ยวกับความโด่งโดยทั่วไป
user603

@ user603 นั่นเป็นสิ่งที่ดีที่จะสงสัย อย่างไรก็ตามคำแถลงไม่เกี่ยวกับตระกูลนี้: มันเกิดขึ้นที่การกระจาย lognormal หนึ่งสามารถสร้างการแสดงออกที่ชัดเจนของชั้นของไฟล์ PDF ทางเลือกที่มีช่วงเวลาเดียวกัน มันเป็นพิเศษที่ทุกคนในช่วงเวลาที่มีความเหมือนกัน แต่รบกวนการกระจายมากที่สุดในทางที่แก้ไขจำนวน จำกัด ในช่วงเวลาที่พวกเขาจะไม่ยาก (มันยากสำหรับการแจกแจงแบบไม่ต่อเนื่องเช่น Bernoulli แต่ไม่มี PDF)
whuber

คำตอบ:


17

ช่วงเวลาของการแจกแจงแบบต่อเนื่องและฟังก์ชั่นของพวกมันเช่นเคิร์ตซีสบอกคุณน้อยมากเกี่ยวกับกราฟของฟังก์ชันความหนาแน่นของมัน

ยกตัวอย่างเช่นกราฟต่อไปนี้

ป้อนคำอธิบายรูปภาพที่นี่

แต่ละสิ่งเหล่านี้คือกราฟของฟังก์ชั่นที่ไม่เป็นลบที่รวมเข้ากับ : เป็นไฟล์ PDF ทั้งหมด ยิ่งไปกว่านั้นพวกเขาต่างก็มีช่วงเวลาที่เหมือนกันทุกครั้งไม่ จำกัด ดังนั้นพวกเขาจึงแบ่งปัน kurtosis ที่พบบ่อย (ซึ่งเกิดขึ้นกับ- 3 + 3 e 2 + 2 e 3 + e 4. )13+3e2+2e3+e4

สูตรสำหรับฟังก์ชั่นเหล่านี้คือ

fk,s(x)=12πxexp(12(log(x))2)(1+ssin(2kπlog(x))

สำหรับ- 1 s 1 ,และk Zx>0, 1s1,kZ.

รูปแสดงค่าที่ด้านซ้ายและค่าkด้านบน คอลัมน์ซ้ายแสดง PDF สำหรับการแจกแจงแบบปกติมาตรฐานsk

แบบฝึกหัด 6.21 ในทฤษฎีขั้นสูงทางสถิติของเคนดัลล์ (Stuart & Ord, รุ่นที่ 5) ขอให้ผู้อ่านแสดงให้เห็นว่าสิ่งเหล่านี้มีช่วงเวลาเดียวกัน

เราสามารถปรับเปลี่ยนpdf ใดก็ได้เพื่อสร้างรูปแบบที่แตกต่างกันอย่างสิ้นเชิงในรูปแบบ pdf แต่ด้วยช่วงเวลากลางที่สองและสี่ที่เหมือนกัน (พูด) ซึ่งจะมีความเหมือนกัน จากตัวอย่างนี้เพียงอย่างเดียวมันควรจะชัดเจนว่า kurtosis ไม่ใช่การวัดหรือการหยั่งรู้ได้ง่ายของสมมาตร, unimodality, bimodality, นูนหรือลักษณะทางเรขาคณิตที่คุ้นเคยอื่น ๆ ของเส้นโค้ง

ฟังก์ชั่นของช่วงเวลาดังนั้น (และ kurtosis เป็นกรณีพิเศษ) ไม่ได้อธิบายคุณสมบัติทางเรขาคณิตของกราฟของ pdf วิธีนี้เหมาะสม: เนื่องจาก pdf หมายถึงความน่าจะเป็นโดยวิธีการของพื้นที่เราสามารถเปลี่ยนความหนาแน่นของความน่าจะเป็นได้อย่างอิสระจากที่หนึ่งไปอีกที่หนึ่งเปลี่ยนการปรากฏตัวของ pdf อย่างรุนแรงในขณะเดียวกันก็กำหนดช่วงเวลาที่แน่นอน


1
"จากตัวอย่างนี้เพียงอย่างเดียวมันควรจะชัดเจนมาก ... ลักษณะทางเรขาคณิตที่คุ้นเคยอื่น ๆ ของเส้นโค้ง" ฉันเข้าใจสิ่งที่คุณหมายถึง แต่มีเหตุผลสำหรับความแตกต่างที่เหมาะสมในการตีความที่นี่ การตีความอีกอย่างคือของดาร์ลิงตันผู้ซึ่งแสดงให้เห็นว่าการเริ่มต้นจากการกระจายแบบสมมาตรการเคลื่อนย้ายมวลที่จุดเฉพาะนั้นจะเพิ่ม / ลดความหนา (อีกครั้งไม่ใช่ความขัดแย้งของตัวอย่างของคุณ
user603

1
@ user603 ฉันไม่เห็นด้วย แต่ฉันคิดว่าวิธีการ "บวก" มองเห็นสมมติฐานที่พิเศษมากที่สร้างขึ้นโดยปริยายเพื่อให้สามารถใช้งานได้ทั้งหมด เราสามารถเริ่มด้วยกราฟของ PDF ที่ไม่สมมาตรอย่างมากซึ่งความเบ้เป็นศูนย์ (ไม่ยากที่จะสร้าง) ดังนั้นวิธีการในเชิงบวกเพียงอธิบายสิ่งที่เกิดขึ้นกับ PDF พิเศษบางอย่างเมื่อมีการย้าย แม้ว่ามันจะมีประโยชน์มากสำหรับการหยั่งรู้
whuber

1
ฉันเห็นด้วยกับความเบ้ (และสำหรับคำตอบของคุณโดยทั่วไป) แต่ความสามารถของ kurtosis นั้นมีค่าน้อยที่สุด ทำให้สิ่งต่าง ๆ น่าสนใจยิ่งขึ้น
user603

1
@ user603 ขอบคุณ; นั่นคือความแตกต่างที่ลึกซึ้ง ฉันไม่คิดว่ามันจะเปลี่ยนแปลงข้อสรุปใด ๆ ในปัจจุบันในรูปแบบที่สำคัญ แต่แน่นอนช่วยปรีชาและชี้ไปที่ความแตกต่างที่สำคัญระหว่างคู่และช่วงเวลาแปลก ๆ
whuber

6

สำหรับการแจกแจงแบบสมมาตร (นั่นคือช่วงเวลาที่มีความหมายเป็นศูนย์กลางแม้จะมีความหมาย) kurtosis วัดคุณลักษณะทางเรขาคณิตของ pdf พื้นฐาน มันไม่เป็นความจริงที่มาตรการเคิร์ตซีส (หรือโดยทั่วไปเกี่ยวข้อง) กับความแหลมของการกระจาย แต่ kurtosis จะวัดว่าการกระจายนั้นอยู่ที่เท่าไหร่จากสมมาตรและ bimodal (พีชคณิตการกระจายแบบสมมาตรและ bimodal ที่สมบูรณ์แบบนั้นจะมี kurtosis 1 ซึ่งเป็นค่าที่เล็กที่สุดที่เป็นไปได้ของ kurtosis) [0]

โดยสรุป [1] หากคุณกำหนด:

k=E(xμ)4/σ4

E(X)=μ,V(X)=σ2

k=V(Z2)+11

Z=(Xμ)/σ

kZ2

[0] RB ดาร์ลิงตัน (1970) Kurtosis เป็น "Peakedness จริง ๆ หรือไม่" ชาวอเมริกันสถิติฉบับ 24 หมายเลข 2

[1] JJA Moors (1986). ความหมายของ Kurtosis: Darlington Reexamined นักสถิติชาวอเมริกันเล่มที่ 40 ฉบับที่ 4


1
ทุกที่ที่คุณเขียน "bimodal" คุณอาจหมายถึง "unimodal" หรือไม่?
whuber

1
fμg(x)=(f(x)+f(2μx))/2.g1. อย่างน้อยที่สุด kurtosis ก็ไม่ได้พูดถึงสิ่งใดที่เกี่ยวกับ bimodality มันไม่ได้อธิบายคุณสมบัติเชิงเรขาคณิตของ pdf อย่างแน่นอน
whuber


1
Kurtosis ไม่ได้บ่งบอกถึงความน่าเชื่อถือ bimodality ยกเว้นในกรณีที่รุนแรงที่สุดซึ่งอยู่ใกล้ขั้นต่ำสุดซึ่งมันบ่งบอกถึงบางสิ่งที่คล้ายกับการกระจายแบบสองจุดที่ติดตั้งได้ คุณสามารถมีการแจกแจงแบบ bimodal ด้วยค่า kurtosis ทุกค่าที่เป็นไปได้ ดูncbi.nlm.nih.gov/pmc/articles/PMC4321753สำหรับตัวอย่าง
Peter Westfall

1
ppv0

5

[NB นี้ถูกเขียนเพื่อตอบคำถามอื่นในไซต์; คำตอบถูกรวมเข้ากับคำถามปัจจุบัน นี่คือเหตุผลที่คำตอบนี้ดูเหมือนจะตอบคำถามที่แตกต่างออกไป อย่างไรก็ตามโพสต์ส่วนใหญ่ควรเกี่ยวข้องที่นี่]

Kurtosis ไม่ได้วัดรูปร่างของการแจกแจงจริงๆ ในบางครอบครัวที่มีการแจกจ่ายคุณสามารถพูดได้ว่ามันอธิบายรูปร่าง แต่โดยทั่วไปความโด่งไม่ได้บอกคุณมากเกี่ยวกับรูปร่างที่แท้จริง รูปร่างนั้นได้รับผลกระทบจากหลาย ๆ อย่างรวมถึงสิ่งที่ไม่เกี่ยวข้องกับการเป็นลมพิษ

หากมีภาพที่ค้นหาภาพเสมือนจริงจะมีไม่กี่ภาพเช่นนี้

พี

ซึ่งดูเหมือนจะแสดงให้เห็นถึงความแปรปรวนที่เปลี่ยนไปแทนที่จะเพิ่มความโด่ง สำหรับการเปรียบเทียบนี่คือความหนาแน่นปกติสามแบบที่ฉันเพิ่งใช้ (ใช้ R) กับค่าเบี่ยงเบนมาตรฐานที่แตกต่างกัน:

ป้อนคำอธิบายรูปภาพที่นี่

อย่างที่คุณเห็นมันดูเหมือนกับภาพก่อนหน้าเกือบจะเหมือนกัน สิ่งเหล่านี้ล้วนมีความเหมือนกัน ในทางตรงกันข้ามนี่คือตัวอย่างที่อาจใกล้เคียงกับแผนภาพที่มีเป้าหมาย

ป้อนคำอธิบายรูปภาพที่นี่

6

นี่คือสิ่งที่ผู้คนมักจะหมายถึงเมื่อพวกเขาพูดถึง kurtosis แสดงรูปร่างของความหนาแน่น อย่างไรก็ตาม kurtosis อาจบอบบาง - ไม่ต้องทำงานอย่างนั้น

ตัวอย่างเช่นที่ความแปรปรวนที่กำหนดความสามารถในการรับแรงกระแทกที่สูงกว่านั้นสามารถเกิดขึ้นได้จริงด้วยค่าสูงสุดที่ต่ำกว่า

เราต้องระวังสิ่งล่อใจ (และในหนังสือไม่กี่เล่มที่ระบุไว้อย่างเปิดเผย) ว่าศูนย์ความเกินส่วนเกินหมายถึงบรรทัดฐาน มีการแจกแจงด้วย kurtosis ส่วนเกิน 0 ซึ่งไม่มีอะไรเหมือนปกติ นี่คือตัวอย่าง:

dgam 2.3

อันที่จริงยังแสดงให้เห็นถึงจุดก่อนหน้า ฉันสามารถสร้างการกระจายตัวที่ดูคล้าย ๆ กันด้วยความโด่งสูงกว่าปกติ แต่ยังคงเป็นศูนย์ที่ศูนย์ - ไม่มีตัวตนสูงสุด

มีจำนวนโพสต์ในเว็บไซต์ที่อธิบายถึงความรุนแรงมากขึ้น ตัวอย่างหนึ่งคือที่นี่


แต่ฉันไม่ได้พูดมัน? หนังสือเล่มนี้บอกว่ามัน?
สถิติ Tistician

ฉันรู้แล้ว. ฉันไม่เคยบอกว่าคุณพูด คุณจะแนะนำให้ฉันตอบงบที่ไม่ถูกต้องโจ่งแจ้งที่คุณถามได้อย่างไร แค่แกล้งทำเป็นว่าพวกเขาไม่ผิด
Glen_b -Reinstate Monica

1
@Glen_b รูปภาพไม่ได้มาจากหนังสือ หนังสือเล่มนี้ไม่ได้ให้ภาพประกอบ ฉันใช้การค้นหารูปภาพ goolge สำหรับภาพประกอบเหล่านี้
สถิติ Tistician

2
ผู้เขียนบางคนเขียนว่า kurtosis เป็นแหลมและบางคนเขียนว่ามันเป็นน้ำหนักหาง แต่การตีความที่ไม่เชื่อว่า kurtosis เป็นสิ่งที่มาตรการ kurtosis เป็นเพียงเรื่องที่ปลอดภัยอย่างสมบูรณ์ ตัวอย่างตัวเลขที่กำหนดโดย Irving Kaplansky (1945) เพียงอย่างเดียวพอเพียงเพื่อแสดงว่า kurtosis หมีไม่ตีความอย่างชัดเจน (กระดาษของ Kaplansky เป็นหนึ่งในไม่กี่แห่งที่เขาเขียนในช่วงกลางทศวรรษที่ 1940 ในความน่าจะเป็นและสถิติเขาเป็นที่รู้จักกันดีในฐานะนักพีชคณิตที่มีชื่อเสียง) การอ้างอิงแบบเต็มและอื่น ๆ ภายในstata-journal.com/sjpdf.html?articlenum=st0204
Nick Cox

1
มีหนังสือและเอกสารที่อ้างว่า kurtosis นั้นมีลักษณะแหลมดังนั้นประโยคแรกของฉันจึงยังคงถูกต้องและสนับสนุนได้เช่นเดียวกับคำแถลงเกี่ยวกับสิ่งที่อยู่ในวรรณคดี สิ่งที่สำคัญยิ่งกว่าคือวิธีหนึ่งที่เกี่ยวกับตัวอย่างและข้อโต้แย้งของ Kaplansky
Nick Cox

3

μ±σ

แก้ไข 11/23/2018: ตั้งแต่เขียนโพสต์นี้ฉันได้พัฒนามุมมองเชิงเรขาคณิตบางอย่างเกี่ยวกับ kurtosis สิ่งแรกคือความเกินจริงสามารถมองเห็นได้ทางเรขาคณิตในแง่ของการเบี่ยงเบนจากเส้น 45 องศาที่คาดไว้ในหางของพล็อตการควอนตัม เห็น พล็อต QQ นี้แสดงถึงการกระจาย leptokurtic หรือ platykurtic หรือไม่?

pV(v)V={(Xμ)/σ}4XE(V)VX

μ±σXμ±σμσX0.25μ±σμσ


3
แทนที่จะส่งต่อผู้คนไปยังบทความในโพสต์ส่วนใหญ่ของคุณต่อไปคุณจะสรุปข้อโต้แย้งที่นี่ได้ไหม? ดูความช่วยเหลือที่นี่ภายใต้ "ระบุบริบทสำหรับลิงก์เสมอ" โดยเฉพาะอย่างยิ่งเมื่อมีข้อความระบุว่า "อ้างอิงส่วนที่สำคัญเสมอ" มันไม่จำเป็นต้องพูดอย่างแท้จริงในกรณีที่มีการโต้แย้งอย่างกว้างขวาง แต่อย่างน้อยก็จำเป็นต้องมีการสรุปข้อโต้แย้ง คุณเพียงแค่ทำงบกวาดสองสามแล้วเชื่อมโยงไปยังกระดาษ คำสั่งที่โด่งมาตรการพฤติกรรมหาง (บริบทขาด) ทำให้เข้าใจผิด (demonstrably ดังนั้น)
Glen_b -Reinstate โมนิกา

2
... แต่มันเป็นไปไม่ได้ที่จะไม่เห็นด้วยกับข้อโต้แย้งที่คุณไม่ได้แสดงที่นี่และอาจได้ข้อสรุปที่เหมาะสมยิ่งขึ้น
Glen_b -Reinstate Monica

ข้อโต้แย้งของฉันชัดเจนวางที่นี่: en.wikipedia.org/wiki/… ยินดีต้อนรับความคิดเห็น! BTW, โด่งเป็นวัดของน้ำหนักหางเพียงไม่เหมือนกับคนอื่น ๆ ที่ได้รับการพิจารณา มันวัดน้ำหนักหางผ่าน E (Z ^ 4) ซึ่งเป็นการวัดน้ำหนักหางเนื่องจากค่า | Z | <1 มีส่วนช่วยน้อยมาก ด้วยตรรกะเดียวกัน E (Z ^ n) สำหรับพลังที่สูงกว่าแม้จะเป็น n ก็เป็นตัววัดน้ำหนักหาง
Peter Westfall

สวัสดีปีเตอร์โปรดไปที่stats.stackexchange.com/help/merging-accountsเพื่อรวมบัญชีของคุณเพื่อให้คุณสามารถแก้ไขโพสต์เก่าได้
whuber

3

คำตอบที่แตกต่าง: เราสามารถอธิบาย kurtosis เชิงเรขาคณิตโดยใช้แนวคิดจากhttp://www.quantdec.com/envstats/notes/class_06/properties.htm : ช่วงเวลาแบบกราฟิก

k=E(Xμσ)4=(xμσ)4f(x)dx
fXμ,σ2x ke=k3

ในต่อไปนี้ฉันจะแสดงพล็อตของ kurtosis แบบกราฟิกสำหรับการแจกแจงแบบสมมาตรทั้งหมดอยู่กึ่งกลางที่ศูนย์และปรับสัดส่วนให้มีความแปรปรวน 1

visual kurtosis สำหรับการแจกแจงแบบสมมาตร

สังเกตการขาดเสมือนจริงของการมีส่วนร่วมกับ kurtosis จากศูนย์ซึ่งแสดงให้เห็นว่า kurtosis ไม่มีส่วนเกี่ยวข้องกับ "ความแหลม" มากนัก


1
Z2b+bb
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.