การแจกแจงแบบ t มีหางที่หนักกว่าการแจกแจงแบบปกติ


10

ในบันทึกการบรรยายของฉันมันบอกว่า

การแจกแจงแบบทีดูเหมือนปกติ แต่มีหางที่หนักกว่าเล็กน้อย

ฉันเข้าใจว่าทำไมมันจึงดูเป็นปกติ (เพราะทฤษฎีบทขีด จำกัด กลาง) แต่ฉันมีเวลายากที่จะเข้าใจวิธีการพิสูจน์ทางคณิตศาสตร์ว่ามันมีหางที่หนักกว่าการแจกแจงแบบปกติและหากมีวิธีการวัดจนถึงระดับที่หนักกว่าการกระจายแบบปกติ

คำตอบ:


12

สิ่งแรกที่ต้องทำคือทำพิธีที่เราหมายถึงโดย "หางที่หนักกว่า" ใคร ๆ ก็มองว่าความหนาแน่นอยู่ในหางที่สูงอย่างเห็นได้ชัดหลังจากปรับมาตรฐานทั้งสองให้มีตำแหน่งและขนาดเท่ากัน (เช่นส่วนเบี่ยงเบนมาตรฐาน):

ป้อนคำอธิบายรูปภาพที่นี่
(จากคำตอบนี้ซึ่งค่อนข้างเกี่ยวข้องกับคำถามของคุณ )

[สำหรับกรณีนี้การปรับขนาดไม่สำคัญในท้ายที่สุด เสื้อจะยังคง "หนัก" กว่าปกติแม้ว่าคุณจะใช้เครื่องชั่งที่แตกต่างกันมาก ปกติจะลดลงในที่สุด]

อย่างไรก็ตามคำจำกัดความดังกล่าว - แม้ว่ามันจะทำงานได้ดีสำหรับการเปรียบเทียบแบบพิเศษนี้ - ก็ไม่ได้พูดคุยกันได้ดีนัก

โดยทั่วไปความหมายที่ดีมากคือในคำตอบ whuber ที่นี่ ดังนั้นถ้าหนักกว่าเทลด์เนื่องจากมีขนาดใหญ่พอ (สำหรับทุกบาง ) ดังนั้นโดยที่โดยที่คือ cdf (สำหรับที่หนักกว่า - ด้านขวามีความหมายที่ชัดเจนคล้ายกันอยู่อีกด้านหนึ่ง)YXtt>t0SY(t)>SX(t)S=1FF

ป้อนคำอธิบายรูปภาพที่นี่

นี่คือบันทึกระดับและในระดับควอไทล์ของปกติซึ่งช่วยให้เราสามารถดูรายละเอียดเพิ่มเติม:

ป้อนคำอธิบายรูปภาพที่นี่

ดังนั้น "การพิสูจน์" ของความหนักเบาจะเกี่ยวข้องกับการเปรียบเทียบ cdf และแสดงให้เห็นว่าหางส่วนบนของ t-cdf ในที่สุดมักจะอยู่เหนือของปกติและท้ายล่างของ t-cdf ในท้ายที่สุดจะอยู่ต่ำกว่าปกติ

ในกรณีนี้สิ่งที่ง่ายต่อการทำคือการเปรียบเทียบความหนาแน่นแล้วแสดงให้เห็นว่าตำแหน่งสัมพันธ์ที่เกี่ยวข้องของ cdfs (/ ฟังก์ชันผู้รอดชีวิต) ต้องเป็นไปตามนั้น

ตัวอย่างเช่นถ้าคุณสามารถโต้แย้งได้ (ในบางกรณี )ν

x2(ν+1)log(1+x2ν)>2log(k)

สำหรับค่าคงที่จำเป็น (ฟังก์ชั่นของ ) สำหรับทุกบางแล้วมันจะเป็นไปได้ที่จะสร้างหางหนักยังเกี่ยวกับความหมายในแง่ของการที่ใหญ่กว่า (หรือใหญ่กว่าบน หางซ้าย)kνx>x0tν1FF

(แบบฟอร์มนี้ตามมาจากความแตกต่างของบันทึกของความหนาแน่นถ้ามีความสัมพันธ์ที่จำเป็นระหว่างความหนาแน่นถือ)

[จริง ๆ แล้วมันเป็นไปได้ที่จะแสดงมันสำหรับใด ๆ (ไม่ใช่เฉพาะที่เราต้องการมาจากค่าคงที่ความหนาแน่นปกติที่เกี่ยวข้อง) ดังนั้นผลลัพธ์จะต้องมีไว้สำหรับเราต้องการ]kk


1
กราฟที่มี (และอาจขยายได้เล็กน้อย ) อาจแสดงให้เห็นถึงหางที่หนักกว่าอย่างชัดเจนยิ่งขึ้นและสามารถทำงานกับองศาอิสระที่สูงขึ้นได้logS(x)x
Henry

1
@Henry ฉันสร้างพล็อตดังกล่าว แต่ไม่แน่ใจว่าจะเพิ่มมูลค่าเท่าใดฉันจึงไม่ได้รวม ฉันจะคิดเกี่ยวกับการใส่มันลงไป
Glen_b

1
@ เฮนรี่ฉันรวมพล็อต
Glen_b -Reinstate Monica

2

วิธีหนึ่งที่จะเห็นความแตกต่างคือโดยการใช้ช่วงเวลาE{xn}.

"Heavier" tails จะหมายถึงค่าที่สูงขึ้นสำหรับช่วงเวลาที่เท่ากัน (power 4, 6, 8) เมื่อความแปรปรวนเหมือนกัน โดยเฉพาะอย่างยิ่งช่วงเวลาลำดับที่ 4 (ประมาณศูนย์) เรียกว่า kurtosis และเปรียบเทียบในแง่ที่แน่นอนว่ามีความหนักเบาของก้อย

ดูรายละเอียดเพิ่มเติมใน Wikipedia ( https://en.wikipedia.org/wiki/Kurtosis )


1
แม้ว่าสำหรับ -distribution กับหรือองศาอิสระ kurtosis นั้นไม่มีที่สิ้นสุดในขณะที่ด้วยองศาอิสระส่วนเบี่ยงเบนมาตรฐานจะไม่มีที่สิ้นสุดดังนั้นคุณจึงไม่สามารถคำนวณ kurtosis ได้และด้วยองศาอิสระคุณไม่สามารถคำนวณค่าเฉลี่ยหรือขณะ TH t34214
Henry

3
@Henry อย่างไรก็ตามความคิดนี้เป็นสิ่งที่ดี ขยาย CDF ของนักเรียนกระจายไปรอบ ๆแสดงให้เห็นว่ามันเป็นสัดส่วน asymptotically การu} ดังนั้นทุกช่วงเวลาที่แน่นอนของน้ำหนักที่น้อยกว่ามีอยู่และช่วงเวลาที่แน่นอนของน้ำหนักที่มากกว่าแตกต่าง ด้วยการแจกแจงแบบปกติจะมีช่วงเวลาที่แน่นอนทั้งหมด นี่เป็นการจัดลำดับที่แน่นอนของก้อยของการแจกแจงแบบทั้งหมดและการแจกแจงแบบปกติ ในผลพารามิเตอร์ให้หนึ่งคำตอบสำหรับคำถามเดิมเกี่ยวกับวิธีการวัดความหนักของหาง t(ν)+xνννtν
whuber

2

นี่คือการพิสูจน์อย่างเป็นทางการตามฟังก์ชั่นการเอาชีวิตรอด ฉันใช้คำจำกัดความของ "heavy tail tail" ที่ได้รับแรงบันดาลใจจากวิกิพีเดีย :

ตัวแปรสุ่มมีฟังก์ชั่นการอยู่รอดมีหางที่หนักกว่าตัวแปรสุ่มมีฟังก์ชันการอยู่รอด iff YSy(t)XSx(t)

limtSy(t)Sx(t)=

พิจารณาตัวแปรสุ่มกระจายเป็นทีของนักเรียนที่มีค่าเฉลี่ยศูนย์องศาอิสระและขนาดพารามิเตอร์ เราเปรียบเทียบกับตัวแปรสุ่ม2) สำหรับตัวแปรทั้งสองฟังก์ชันการเอาชีวิตรอดนั้นแตกต่างกัน ดังนั้น, YνaXN(0,σ2)

limtSy(t)Sx(t)=limtfy(t)fx(t)=explimt(logfy(t)logfx(t))=explimt(ν+12log(1+t2νa2)(12σ2t2)+C)=exp(limtν+12log(1+t2νa2)(12σ2t2)+C)=exp(limt12σ2t2ν+12log(1+t2νa2)+C)=exp(12limua2σ2u(ν+1)log(1+uν)+C)=exp(12limuu(a2σ2(ν+1)log(1+uν)u+Cu))
ที่เราได้แทน 2 โปรดทราบว่าเป็นค่าคงที่,และ ดังนั้นด้วยทฤษฎีบทขีด จำกัด พีชคณิต u=t2/a20<a2/σ2<limuC/u=0
limu(ν+1)log(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
limtSy(t)Sx(t)=exp(12limuu(a2σ2(0)+(0)))=

ที่สำคัญผลลัพธ์นั้นเก็บไว้สำหรับค่าตามอำเภอใจ (จำกัด ) ของ ,และดังนั้นคุณสามารถมีสถานการณ์ที่การกระจายมีความแปรปรวนน้อยกว่าปกติ แต่ยังมีหางที่หนักกว่าaσ2ν


1
เพียงแค่ทราบว่า "คำจำกัดความ" ของหางที่หนักกว่านี้ไม่สามารถยอมรับได้เสมอไป ตัวอย่างเช่นการแจกแจง N (0,1) ตามคำนิยามนี้มีก้อยที่หนักกว่าการแจกแจง. 9999 * U (-1,1) + .0001 * U (-1000, 1000) แม้ว่าการแจกแจงหลังจะสร้าง ค่าเป็นครั้งคราวมากถึง 175 ส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ยแม้จะมีการสนับสนุนที่ถูกผูกไว้ แน่นอนว่า N (0,1) นั้นให้คุณค่าเช่นกัน แต่ด้วยความน่าจะเป็นต่ำกว่าสิ่งที่สามารถพิจารณาได้ว่ามีความเกี่ยวข้องสำหรับการใช้งานจริง
Peter Westfall
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.