ทฤษฎี Extreme Value - แสดง: Normal ถึง Gumbel


21

จำนวนสูงสุดของ IID Standardnormals ลู่กับมาตรฐานกัมเบลจัดจำหน่ายตามมากราคาทฤษฎีX1,,Xn.

เราจะแสดงสิ่งนั้นได้อย่างไร

เรามี

P(maxXix)=P(X1x,,Xnx)=P(X1x)P(Xnx)=F(x)n

เราจำเป็นต้องค้นหา / เลือกan>0,bnRลำดับของค่าคงที่เช่น:

F(anx+bn)nnG(x)=eexp(x)

คุณสามารถแก้ไขหรือค้นหามันในวรรณคดี?

มีบางตัวอย่างหน้า 6/71แต่ไม่ใช่สำหรับกรณีปกติ:

Φ(anx+bn)n=(12πanx+bney22dy)neexp(x)

คำตอบ:


23

วิธีการทางอ้อมมีดังนี้:
สำหรับการแจกแจงแบบต่อเนื่องอย่างแน่นอน Richard von Mises (ในปี 1936 บทความ"La distribution de la plus grande de n valeurs"ซึ่งดูเหมือนว่าจะได้รับการทำซ้ำ - ภาษาอังกฤษ - ในฉบับปี 1964 ที่เลือก เอกสารของเขา) ได้จัดให้มีเงื่อนไขเพียงพอต่อไปนี้สำหรับตัวอย่างสูงสุดที่จะมาบรรจบกับ Gumbel มาตรฐานG(x) :

ปล่อยให้เป็นฟังก์ชันการแจกแจงทั่วไปของตัวแปรสุ่ม iid และความหนาแน่นทั่วไป ถ้าอย่างนั้นn f ( x )F(x)nf(x)

limxF1(1)(ddx(1F(x))f(x))=0X(n)dG(x)

ใช้สัญกรณ์ปกติสำหรับมาตรฐานปกติและการคำนวณอนุพันธ์เรามี

ddx(1Φ(x))ϕ(x)=ϕ(x)2ϕ(x)(1Φ(x))ϕ(x)2=ϕ(x)ϕ(x)(1Φ(x))ϕ(x)1

โปรดทราบว่า xนอกจากนี้สำหรับการกระจายปกติ\ ดังนั้นเราต้องประเมินขีด จำกัดF-1(1)=ϕ(x)ϕ(x)=xF1(1)=

limx(x(1Φ(x))ϕ(x)1)

แต่คืออัตราส่วนของ Mill และเรารู้ว่าอัตราส่วนของ Mill สำหรับมาตรฐานปกติมีแนวโน้มที่เมื่อเติบโต ดังนั้น 1/xx(1Φ(x))ϕ(x)1/xx

limx(x(1Φ(x))ϕ(x)1)=x1x1=0

และสภาพที่เพียงพอมีความพึงพอใจ

ชุดที่เกี่ยวข้องจะได้รับเป็น

an=1nϕ(bn),bn=Φ1(11/n)

ภาคผนวก

นี่คือจาก ch 10.5 ของหนังสือเล่มนี้HA David & HN Nagaraja (2003), "การสั่งซื้อสถิติ" (3D Edition)

f ( t ) f ( t ) w ( t )ξa=F1(a)(ก) นอกจากนี้การอ้างอิงถึง de Haan ก็คือ"Haan, LD (1976) ตัวอย่างสุดขั้ว: การแนะนำเบื้องต้น Statistica Neerlandica, 30 (4), 161-172 " แต่ระวังเพราะสัญกรณ์บางอันมีเนื้อหาต่างกันในde Haan - ตัวอย่างในหนังสือคือฟังก์ชันความหนาแน่นของความน่าจะเป็นในขณะที่ในde Haanหมายถึงฟังก์ชันของหนังสือ (เช่นอัตราส่วนของโรงสี) นอกจากนี้ de Haan ตรวจสอบสภาพเพียงพอที่แตกต่างกันแล้วf(t) f(t)w(t)

ป้อนคำอธิบายรูปภาพที่นี่


ฉันไม่แน่ใจว่าฉันเข้าใจโซลูชันของคุณมากแค่ไหน ดังนั้นคุณเอามาเป็น CDF มาตรฐานทั่วไป ฉันทำตามและยอมรับว่ามีสภาพเพียงพอ แต่ซีรีย์ที่เกี่ยวข้องคือและในทันทีที่ได้รับมาจากซีรี่ส์เหล่านั้น? a n b nFanbn
renrenthehamster

@renrenthehamster ฉันคิดว่าทั้งสองส่วนมีการระบุไว้อย่างอิสระ (ไม่มีการเชื่อมต่อโดยตรง)
emcor

แล้วชุดที่เกี่ยวข้องจะได้รับอย่างไร อย่างไรก็ตามฉันเปิดคำถามเกี่ยวกับปัญหานี้ (และโดยทั่วไปแล้วสำหรับการแจกแจงอื่น ๆ นอกเหนือจากมาตรฐานทั่วไป)
renrenthehamster

@renrenthehamster ฉันได้เพิ่มเนื้อหาที่เกี่ยวข้อง ฉันไม่เชื่อว่ามีสูตรมาตรฐานสำหรับทุกกรณีเพื่อค้นหาซีรี่ส์เหล่านี้
Alecos Papadopoulos

14

คำถามถามสองสิ่ง: (1) วิธีแสดงให้เห็นว่าสูงสุดลู่ในแง่ที่ลู่ (กระจาย) สำหรับลำดับที่เลือกอย่างเหมาะสมและไปยังการกระจาย Gumbel มาตรฐานและ (2) วิธีการค้นหาลำดับดังกล่าว ( X ( n ) - b n ) / a n ( a n ) ( b n )X(n)(X(n)bn)/an(an)(bn)

คนแรกเป็นที่รู้จักและบันทึกไว้ในเอกสารต้นฉบับของทฤษฎีบท Fisher-Tippett-Gnedenko (FTG) ครั้งที่สองดูเหมือนจะยากขึ้น นั่นคือปัญหาที่แก้ไขที่นี่

โปรดทราบเพื่อชี้แจงให้ชัดเจนถึงการยืนยันที่ปรากฏที่อื่นในกระทู้นี้

  1. ค่าสูงสุดไม่ได้รวมเข้ากับสิ่งใด: มันเบี่ยงเบนไป (แม้ว่าช้ามาก)

  2. ดูเหมือนว่าจะมีการประชุมที่แตกต่างกันเกี่ยวกับการกระจาย Gumbel ผมจะนำมาใช้ในการประชุมว่า CDF ของตรงกันข้ามกระจายกัมเบลเป็นถึงขนาดและสถานที่ที่กำหนดโดย(x)) ค่าสูงสุดมาตรฐานที่เหมาะสมของตัวแปร iid ปกติจะรวมเข้ากับการแจกแจงแบบกัมเบลที่กลับด้าน1exp(exp(x))


ปรีชา

เมื่อเป็น iid ที่มีฟังก์ชั่นการแจกแจงทั่วไปการแจกแจงสูงสุดคือ F X ( n )XiFX(n)

Fn(x)=Pr(X(n)x)=Pr(X1x)Pr(X2x)Pr(Xnx)=Fn(x).

เมื่อการสนับสนุนของไม่มีขอบเขตบนเช่นเดียวกับการแจกแจงแบบปกติลำดับของฟังก์ชั่นเดินไปทางขวาตลอดไปโดยไม่มีขีด จำกัด :F nFFn

รูปที่ 1

กราฟบางส่วนของสำหรับจะปรากฏขึ้น n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16Fnn=1,2,22,24,28,216

เพื่อศึกษารูปทรงของการแจกแจงเหล่านี้เราสามารถเลื่อนแต่ละอันกลับไปทางซ้ายด้วยจำนวนและ rescale โดยเพื่อทำให้มันเปรียบเทียบกันa nbnan

รูปที่ 2

กราฟก่อนหน้าแต่ละอันถูกเลื่อนไปที่ตำแหน่งมัธยฐานที่และทำให้ช่วงความยาวหน่วยระหว่างหน่วย0

FTG อ้างว่าลำดับและสามารถเลือกฟังก์ชั่นเพื่อให้การกระจายเหล่านี้มาบรรจบกันในทุก pointwiseบางส่วนกระจายความคุ้มค่ามากขึ้นไปขนาดและที่ตั้ง เมื่อคือการแจกแจงแบบปกติการ จำกัด การกระจายค่าที่มากเป็นพิเศษคือ Gumbel ที่กลับด้านขึ้นอยู่กับตำแหน่งและสเกล( b n ) x F(an)(bn)xF


วิธีการแก้

มันเป็นเรื่องดึงดูดที่จะเลียนแบบทฤษฎีบทขีด จำกัด กลางโดยกำหนดมาตรฐานให้มีค่าเฉลี่ยหน่วยและความแปรปรวนของหน่วย แม้ว่ามันจะไม่เหมาะสม แต่ส่วนหนึ่งเป็นเพราะ FTG ใช้กับการแจกแจงแบบต่อเนื่องที่ไม่มีช่วงเวลาที่หนึ่งหรือสอง ให้ใช้เปอร์เซ็นไทล์ (เช่นค่ามัธยฐาน) แทนเพื่อกำหนดตำแหน่งและความแตกต่างของเปอร์เซ็นต์ไทล์ (เช่น IQR) เพื่อพิจารณาการแพร่กระจาย (วิธีการทั่วไปนี้ควรประสบความสำเร็จในการค้นหาและสำหรับการแจกแจงแบบต่อเนื่องใด ๆ )a n b nFnanbn

สำหรับการแจกแจงแบบปกติมาตรฐานสิ่งนี้กลายเป็นเรื่องง่าย! Let1 quantile ของสอดคล้องกับเป็นค่าใด ๆที่Q ระลึกถึงความหมายของวิธีแก้คือF n Q x Q0<q<1FnqxqF n ( x ) = F n ( x )Fn(xq)=qFn(x)=Fn(x)

xq;n=F1(q1/n).

ดังนั้นเราอาจตั้งค่า

bn=x1/2;n, an=x3/4;nx1/4;n; Gn(x)=Fn(anx+bn).

เพราะจากการก่อสร้างมัธยฐานของเป็นและ IQR ของมันคือค่ามัธยฐานของค่า จำกัด ของ (ซึ่งเป็นรุ่นของตรงกันข้ามกัมเบลบางคน) จะต้องเป็นและ IQR มันจะต้องเป็น1ให้พารามิเตอร์ขนาดเป็นและพารามิเตอร์สถานที่เป็น\เนื่องจากค่ามัธยฐานคือและ IQR จึงพบว่าเป็นพารามิเตอร์จึงต้องGn01Gn01βαα+βloglog(2)β(loglog(4)loglog(4/3))

α=loglog2loglog(4/3)loglog(4); β=1loglog(4)loglog(4/3).

มันไม่ได้เป็นสิ่งที่จำเป็นสำหรับและจะเป็นว่าค่าเหล่านี้พวกเขาต้องการเพียงใกล้เคียงกับพวกเขาให้ขีด จำกัด ของยังคงนี้ตรงกันข้ามกระจายกัมเบล การวิเคราะห์ที่ตรงไปตรงมา (แต่น่าเบื่อ) สำหรับปกติมาตรฐานแสดงให้เห็นว่าการประมาณanbnGnF

an=log((4log2(2))/(log2(43)))22log(n), bn=2log(n)log(log(n))+log(4πlog2(2))22log(n)

จะทำงานได้ดี (และเรียบง่ายที่สุดเท่าที่จะทำได้)

รูปที่ 3

เส้นโค้งสีฟ้าอ่อนเป็นกราฟบางส่วนของสำหรับใช้ลำดับโดยประมาณและb_nสายสีแดงเข้มกราฟกลับกระจายกัมเบลที่มีพารามิเตอร์และ\การบรรจบกันนั้นชัดเจน (แม้ว่าอัตราการลู่เข้าสำหรับการลบจะช้าลงอย่างเห็นได้ชัด) n = 2 , 2 6 , 2 11 , 2 16 ' n B ' nอัลฟ่าบีตาxGnn=2,26,211,216anbnαβx


อ้างอิง

BV Gnedenko, การกระจายการ จำกัด ของระยะเวลาสูงสุดในซีรีส์แบบสุ่ม ใน Kotz และ Johnson, Breakthroughs ในสถิติ Volume I: รากฐานและทฤษฎีพื้นฐาน, Springer, 1992 แปลโดย Norman Johnson


@Vossler สูตรในโพสต์ Alecos สำหรับลู่ไปเป็นnก็จะทำงานเช่นขนาดใหญ่n 0 n →การ( 2 ล็อก( n ) - ล็อก( 2 π ) ) - 1 / 2 nan0n(2log(n)log(2π))1/2n
whuber

ใช่มันเป็นความจริงฉันรู้ว่าไม่นานหลังจากที่ฉันโพสต์ความคิดเห็นของฉันดังนั้นฉันจึงลบมันทันที ขอขอบคุณ!
Vossler

@ เจสฉันหวังว่าคำตอบนี้จะถูกเข้าใจว่าเป็นการแสดงเหนือสิ่งอื่นใดที่ไม่มีสิ่งเช่น "สูตร": มีสูตรที่ถูกต้องมากมายสำหรับและ nanbn.
whuber

@ เจสนั้นดีกว่าเพราะแสดงให้เห็นถึงวิธีการอื่นคือแรงจูงใจในการเขียนคำตอบนี้ ฉันไม่เข้าใจความโหยหาของคุณที่ฉันคิดว่ามัน "ไร้ประโยชน์ที่จะเขียนคำตอบ" เพราะนั่นคือสิ่งที่ฉันได้ทำที่นี่อย่างชัดเจน
whuber

@ เจสฉันไม่สามารถสนทนาต่อไปได้เพราะมันเป็นด้านเดียว: ฉันยังจำอะไรที่ฉันเขียนไม่ได้ในลักษณะของคุณ ฉันเลิกในขณะที่ฉันอยู่ข้างหลัง
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.