ช่วงเวลาของการกระจาย - การใช้งานสำหรับช่วงเวลาบางส่วนหรือสูงกว่า?


20

เป็นเรื่องปกติที่จะใช้ช่วงเวลาที่สองสามและสี่ของการแจกแจงเพื่ออธิบายคุณสมบัติบางอย่าง ช่วงเวลาหรือช่วงเวลาบางช่วงที่สูงกว่าช่วงที่สี่อธิบายคุณสมบัติที่มีประโยชน์ของการแจกแจงหรือไม่?


3
ไม่ใช่คำตอบ แต่สิ่งหนึ่งที่ต้องจำไว้คือช่วงเวลาการสั่งซื้อที่สูงขึ้นนั้นต้องใช้การสังเกตมากขึ้นเพื่อให้ได้รูปแรก
isomorphismes

โพสต์ที่ใช้ช่วงเวลาที่บางส่วนเป็นstats.stackexchange.com/questions/94402/... ดังนั้นช่วงเวลาบางส่วนจึงมีประโยชน์บ้างและอาจใช้มากกว่านี้
kjetil b halvorsen

คำตอบ:


10

นอกเหนือจากคุณสมบัติพิเศษของตัวเลขไม่กี่ (เช่น 2) เหตุผลที่แท้จริงเพียงอย่างเดียวที่จะเป็นโมฆะช่วงเวลาจำนวนเต็มเดียวเมื่อเทียบกับช่วงเวลาเศษส่วนคือความสะดวกสบาย

ช่วงเวลาที่สูงขึ้นสามารถใช้เพื่อทำความเข้าใจพฤติกรรมหางได้ ตัวอย่างเช่นตัวแปรสุ่มกึ่งกลางมีความแปรปรวน 1 มีหาง subgaussian (เช่นP ( | X | > t ) < C e - c t 2สำหรับค่าคงที่บางค่าc , C > 0 ) ถ้าหากE | X | p( A XP(|X|>t)<Cect2c,C>0ทุกหน้า1และบางส่วนคง>0E|X|p(Ap)pp1A>0


ผลลัพธ์ที่คุณระบุสำหรับ [sub] gaussian tail ไม่ถูกต้อง ตามขอบเขต [ ] ที่คุณกล่าวถึงที่พีทีเอชบรรทัดฐานของศูนย์กลางตัวแปรเกาส์จะไม่ [ในวงเงิน] เกิน 1 แต่พีทีเอชบรรทัดฐานของ RV มีแนวโน้มที่จะจีบ ESS ซึ่งเป็น+สำหรับตัวแปรเกาส์ Appthpth+
ronaf

ขอบคุณสำหรับการจับที่ ฉันลืมเลขยกกำลังบน RHS; มันถูกต้องแล้ว
Mark Meckes

คุณสามารถให้การอ้างอิงสำหรับผลลัพธ์นี้ได้หรือไม่?
Gary

@ แกรี่: น่าเสียดายที่ฉันไม่รู้จักการอ้างอิง (เผยแพร่หรือออนไลน์); มันเป็นส่วนหนึ่งของคติชนวิทยาในสาขาของฉันสะกดในหลักสูตร แต่เขียนออกมาเป็น "เรียบง่ายและเป็นที่รู้จัก" ในเอกสาร การพิสูจน์นั้นง่ายแม้ว่า ได้รับการประมาณการหางประมาณการช่วงเวลาดังต่อไปนี้จากการบูรณาการโดยชิ้นส่วน (เช่น ) และสูตรของสเตอร์ลิง ได้รับการประมาณการขณะที่ประมาณการหางดังต่อไปนี้โดยใช้ความไม่เท่าเทียมกันของมาร์คอฟและเพิ่มประสิทธิภาพมากกว่าหน้า E|X|p=0ptp1P(|X|>t)dtp
Mark Meckes

9

ฉันสงสัยเมื่อได้ยินคนถามถึงช่วงเวลาที่สามและสี่ มีข้อผิดพลาดทั่วไปสองประการที่ผู้คนมักนึกถึงเมื่อนำเสนอหัวข้อ ฉันไม่ได้บอกว่าคุณจำเป็นต้องทำผิดพลาดเหล่านี้ แต่พวกเขามักจะเกิดขึ้น

ครั้งแรกดูเหมือนว่าพวกเขาเชื่อโดยปริยายว่าการแจกแจงสามารถต้มลงไปได้สี่ตัวเลข พวกเขาสงสัยว่าแค่สองตัวเลขไม่เพียงพอ แต่สามหรือสี่ควรมีมากมาย

ข้อที่สองฟังดูเหมือนย้อนกลับไปถึงวิธีการจับคู่ช่วงเวลากับสถิติที่ได้สูญเสียไปกับวิธีการความน่าจะเป็นสูงสุดในสถิติร่วมสมัย

ปรับปรุง: ฉันขยายคำตอบนี้เป็นบล็อกโพสต์


3

ตัวอย่างหนึ่งของการใช้งาน (การตีความหมายคือตัวระบุที่ดีกว่า) ของช่วงเวลาที่สูงขึ้น: ช่วงเวลาที่ห้าของการแจกแจง univariate เป็นการวัดความไม่สมดุลของก้อย


3
แต่ช่วงเวลาที่สาม (กลาง) ไม่ทำเช่นนี้ในแบบที่มั่นคงและใช้งานได้จริงหรือ
whuber

3
@Wuber:> ที่สามคือการวัดความไม่สมดุลโดยรวมซึ่งไม่เหมือนกันกับความไม่สมดุลของหาง เนื่องจากเลขชี้กำลังที่สูงขึ้นค่าที่ห้าจึงถูกกำหนดโดยก้อยเกือบทั้งหมด
user603

1
@Kwak: ขอบคุณสำหรับการชี้แจงความหมายของคุณ แน่นอนว่าการตอบสนองแบบเดียวกันสามารถนำไปใช้กับช่วงเวลาแปลก ๆ ใด ๆ ได้: พวกเขาวัดความไม่สมดุลมากขึ้นและไกลออกไปในหาง
whuber

@Whuber:> แน่นอน โปรดทราบว่าแม้จะมีการแจกแจงแบบหางเท่ ๆ อย่าง Gaussian ในช่วงเวลาที่ 7 คุณจะได้รับการเปรียบเทียบค่าสูงสุดกับค่าต่ำสุด
user603

1
@Kwak: สองคำถามที่ติดตามอย่างรวดเร็ว ไม่จำเป็นต้องตอบกลับหากคุณไม่ต้องการ (1) "Fair tailed" ?? (2) นาทีและสูงสุดของ Gaussian คืออะไร?
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.