คุณจะคำนวณฟังก์ชันความหนาแน่นของความน่าจะเป็นของค่าสูงสุดของตัวอย่างของตัวแปรสุ่มชุด IID ได้อย่างไร


45

รับตัวแปรสุ่ม

Y=max(X1,X2,,Xn)

โดยที่Xiเป็นตัวแปรชุด IID ฉันจะคำนวณ PDF ของYอย่างไร


4
หากเป็นการบ้านโปรดอ่านคำถามที่พบบ่อยและอัปเดตคำถามของคุณตามนั้น
พระคาร์ดินัล

สามารถใช้ข้อมูลประจำตัวของ Vandermonde เพื่อแสดงฟังก์ชั่นร่วมกันของ 2 คำสั่งสถิติว่า F_y (r) * G_y (r) หรือไม่?
larry mintz

หลักสูตรนี้ครอบคลุมปัญหาประเภทใดโดยไม่สนใจ ไม่ใช่สิ่งที่ฉันพบในหลักสูตรความน่าจะเป็นทางวิศวกรรมของฉัน
อเล็กซ์

@Alex หลักสูตรสถิติที่ครอบคลุมการ resampling เป็นอย่างไร
SOFe

คำตอบ:


64

เป็นไปได้ว่าคำถามนี้เป็นการบ้าน แต่ฉันรู้สึกว่าคำถามความน่าจะเป็นแบบคลาสสิกนี้ยังคงไม่มีคำตอบที่สมบูรณ์หลังจากผ่านไปหลายเดือนดังนั้นฉันจะให้ที่นี่

จากคำแถลงปัญหาเราต้องการกระจาย

Y=max{X1,...,Xn}

ที่จะ IIDB) เรารู้ว่าถ้าหากองค์ประกอบของกลุ่มตัวอย่างทุกคนเป็นน้อยกว่าxจากนั้นสิ่งนี้ตามที่ระบุไว้ในคำใบ้ @ varty ของบวกกับความจริงที่ว่าเป็นอิสระช่วยให้เราสามารถอนุมานX1,...,XnUniform(a,b)Y<xxXi

P(Yx)=P(X1x,...,Xnx)=i=1nP(Xix)=FX(x)n

ที่เป็นCDF ของการกระจายชุด ดังนั้น CDF ของคือ FX(x)Y

FY(y)=P(Yy)={0ya[(ya)/(ba)]ny(a,b)1yb

ตั้งแต่มีการกระจายอย่างต่อเนื่องอย่างที่เราสามารถได้รับความหนาแน่นของตนโดยความแตกต่าง CDF ดังนั้นความหนาแน่นของคือYY

pY(y)=n(ya)n1(ba)n

ในกรณีพิเศษที่เรามีซึ่งเป็นความหนาแน่นของการแจกแจงเบต้าด้วยและตั้งแต่na=0,b=1pY(y)=nyn1α=nβ=1Beta(n,1)=Γ(n+1)Γ(n)Γ(1)=n!(n1)!=n

เป็นบันทึกลำดับที่คุณได้รับถ้าคุณมีการจัดเรียงตัวอย่างของคุณในการสั่งซื้อที่เพิ่มขึ้น - - จะเรียกว่าสถิติการสั่งซื้อ ลักษณะทั่วไปของคำตอบนี้คือสถิติการสั่งซื้อทั้งหมดของตัวอย่างกระจายมีการแจกแจงแบบเบต้าดังที่ระบุไว้ในคำตอบของ @ bnaul X(1),...,X(n)Uniform(0,1)


นี่เป็นคำถามการบ้านสำหรับฉันจริง ๆ ขอบคุณสำหรับคำอธิบาย
Paul PM

ฉันรู้สึกว่าฉันควรจะเข้าใจอย่างถ่องแท้ที่นี่และตอบคำถามนี้แต่ฉันไม่เห็นวิธีการทำเช่นนั้น คุณช่วยฉันออกได้ไหม คุณสามารถแนะนำหนังสือหรือบทที่พูดถึงปัญหาทั่วไปนี้ได้หรือไม่?

@ PaulPM หลักสูตรนี้ครอบคลุมปัญหาประเภทใดบ้าง ไม่ใช่สิ่งที่ฉันพบในหลักสูตรความน่าจะเป็นทางวิศวกรรมของฉัน
อเล็กซ์

6

สูงสุดของกลุ่มตัวอย่างเป็นหนึ่งในสถิติการสั่งซื้อโดยเฉพาะใน TH สถิติการสั่งซื้อของกลุ่มตัวอย่างX_1,โดยทั่วไปการคำนวณการแจกแจงสถิติการสั่งซื้อนั้นทำได้ยากดังที่อธิบายไว้ในบทความ Wikipedia สำหรับการแจกแจงพิเศษบางอย่างสถิติการสั่งซื้อเป็นที่รู้จักกันดี (เช่นสำหรับการแจกจ่ายแบบสม่ำเสมอซึ่งมีสถิติการสั่งซื้อแบบกระจายเบต้า)nX1,,Xn

แก้ไข: บทความ Wikipedia เกี่ยวกับตัวอย่างสูงสุดและต่ำสุดเป็นประโยชน์และเฉพาะเจาะจงมากขึ้นสำหรับปัญหาของคุณ


5
สำหรับการแจกแจงที่มีความหนาแน่นการคำนวณการกระจายตัวของลำดับคำสั่งเฉพาะนั้นค่อนข้างตรงไปตรง มันง่ายยิ่งขึ้นสำหรับสถิติการสั่งซื้อ "พิเศษ" เช่นขั้นต่ำและสูงสุด
พระคาร์ดินัล

ฉันเดาว่าขึ้นอยู่กับความหมายโดย "คำนวณ" ในคำถามเดิม แน่นอนว่าการทำตัวเลขเป็นเรื่องตรงไปตรงมา ฉันตีความคำถามว่าถามว่าจะหาวิธีแก้ปัญหาแบบปิดซึ่งโดยทั่วไปไม่ใช่เรื่องง่าย
bnaul

8
@bnaul: Let 'เป็นพลฟังก์ชั่นการจัดจำหน่ายและให้เป็นตัวอย่าง IID จากFให้เป็นสถิติลำดับที่จากนั้นQED F(x)=P(Xx)X1,,XnFX(k)k
P(X(k)x)=m=knP(|{i:Xix}|=m)=m=kn(nm)F(x)m(1F(x))nm.
พระคาร์ดินัล

1
บางทีวิธีที่จะเข้าใจคำตอบของพระคาร์ดินัล (เนื่องจากคุณเข้าใจสถิติการเรียงลำดับสำหรับชุดเครื่องแบบ) ก็คือเนื่องจาก cdf เป็นการแปลงแบบ 1 ต่อ 1 ของ cdf แบบ monotonic เราสามารถแสดงเหตุการณ์ {X <a} ในรูปแบบของเครื่องแบบได้เสมอ ตัวแปรสุ่ม (นี่คือสาเหตุที่ monte carlo ทำงาน) ดังนั้นผลใด ๆ อยู่บนพื้นฐานของการกระจายชุดได้อย่างง่ายดายจะคุยกับตัวแปรอื่น ๆ สุ่ม - เพียงแค่ใช้การเปลี่ยนแปลง(X) U=FX(X)
ความน่าจะเป็นทาง

2
@probabilityislogic: ปรีชาเป็นสิ่งที่ดีแม้ว่าดูเหมือนว่าคุณจะมีตัวแปรสุ่มอย่างต่อเนื่องในใจในความคิดเห็นของคุณ (ผลในความคิดเห็นที่สองของฉันข้างต้นเช่น, การทำงานสำหรับฟังก์ชั่นการจัดจำหน่ายโดยพล.)
พระคาร์ดินัล

1

ถ้าเป็น CDF ของดังนั้น จากนั้นคุณสามารถใช้คุณสมบัติ iid และ CDF ของตัวแปรเครื่องแบบในการคำนวณ(y)FY(y)Y

FY(y)=Prob(y>X1,y>X2,...,y>Xn)
FY(y)

-3

ค่าสูงสุดของชุดตัวแปรสุ่มของ IID เมื่อปรับมาตรฐานอย่างเหมาะสมโดยทั่วไปแล้วจะรวมกันเป็นหนึ่งในสามประเภทของค่าที่มากที่สุด นี่คือทฤษฎีบทของ Gnedenko ความเท่ากันของทฤษฎีบทขีด จำกัด กลางสำหรับสุดขั้ว ประเภทเฉพาะขึ้นอยู่กับพฤติกรรมหางของการกระจายประชากร เมื่อรู้สิ่งนี้คุณสามารถใช้การ จำกัด การกระจายเพื่อประมาณการกระจายให้สูงสุด

เนื่องจากการแจกแจงแบบสม่ำเสมอบน [a, b] เป็นหัวข้อของคำถามนี้มาโครได้ให้การแจกแจงที่แน่นอนสำหรับ n และคำตอบที่ดีมาก ผลลัพธ์ค่อนข้างเล็กน้อย สำหรับการแจกแจงแบบปกติแบบฟอร์มปิดที่ดีนั้นเป็นไปไม่ได้ แต่ปรับค่าสูงสุดให้เหมาะสมสำหรับการกระจายแบบปกติไปยังการกระจายแบบกัมเบล F (x) = exp (- e )x

สำหรับเครื่องแบบการทำให้เป็นมาตรฐานคือ (ba) -x / n และ F (bax / n) = (1-x / [n (ba)])nn

ซึ่งลู่อี ^)สังเกตที่นี่ว่า y = bax / n และ F (y) แปลงเป็น 1 เมื่อ y ไปที่ ba นี่ถือเป็น 0 ทั้งหมด x/(ba)n

ในกรณีนี้มันง่ายที่จะเปรียบเทียบค่าที่แน่นอนกับขีด จำกัด ของซีมโทติค

หนังสือของกัมเบล

หนังสือของ Galambos

หนังสือของ Leadbetter

หนังสือของโนวัค

หนังสือโคลส์


4
เพื่อให้คำตอบนี้สามารถนำไปใช้ได้จริงคุณจะต้องกำหนดรายละเอียดว่าจะ "ปรับค่าปกติ" ให้เหมาะสมได้อย่างไรและคุณต้องเตรียมวิธีการประมาณว่าขนาดใหญ่จะต้องอยู่ก่อนสูตร asymptotic จะมีความน่าเชื่อถือโดยประมาณ n
whuber

@whuber ทุกคนสามารถดูทฤษฎีบทของ Gnedenko เพื่อดูการฟื้นฟู ความสำคัญเท่าเทียมกันคือลักษณะหางที่กำหนดว่าจะใช้สามชนิดใด ทฤษฎีบทพูดคุยกับกระบวนการสุ่มนิ่ง ดังนั้นใครก็ตามที่ต้องการทราบรายละเอียดเล็ก ๆ น้อย ๆ สามารถอ่านหนังสือของ Leadbetter หรือวิทยานิพนธ์เอกของฉัน เมื่อ n มีขนาดใหญ่พอจะเป็นคำถามที่ตอบยากสำหรับรูปแบบของ asymptotics ฉันเดาว่าทฤษฎีบท Berry-Esseen ช่วยให้ทฤษฎีบทขีด จำกัด กลางได้ ฉันไม่รู้ว่าอะไรเปรียบได้กับสุดขั้ว
Michael Chernick
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.