ช่วยพัฒนาสมอง: ความยาวที่คาดหวังของลำดับ iid ที่เพิ่มขึ้นแบบซ้ำซากคืออะไรเมื่อดึงจากการแจกแจงแบบ [0,1]


28

นี่เป็นคำถามที่สัมภาษณ์สำหรับตำแหน่งนักวิเคราะห์เชิงปริมาณรายงานที่นี่ สมมติว่าเราวาดจากการแจกแจงแบบสม่ำเสมอและการจับสลากคือ iid ความยาวที่คาดหวังของการแจกแจงแบบซ้ำซ้อนเพิ่มขึ้นคือเท่าใด? คือเราหยุดการวาดถ้าการดึงปัจจุบันมีขนาดเล็กกว่าหรือเท่ากับการวาดก่อนหน้า[0,1]

ฉันได้รับสองสามครั้งแรก: \ Pr (\ text {length} = 2) = \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_0 ^ {x_2} \ mathrm {d} x_3 \, \ mathrm {d} x_2 \, \ mathrm {d} x_1 = 1/3 \ Pr (\ text {length} = 3) = \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_ {x_2} ^ 1 \ int_0 ^ {x_3} \ mathrm {d} x_4 \, \ mathrm { d} x_3 \, \ mathrm {d} x_2 \, \ mathrm {d} x_1 = 1/8

Pr(length=1)=010x1dx2dx1=1/2
Pr(length=2)=01x110x2dx3dx2dx1=1/3
Pr(length=3)=01x11x210x3dx4dx3dx2dx1=1/8

แต่ฉันคิดว่าการคำนวณปริพันธ์ซ้อนกันเหล่านี้ยากมากขึ้นและฉันไม่ได้รับ "เคล็ดลับ" ที่จะพูดคุยเพื่อPr(length=n)n) ฉันรู้ว่าคำตอบสุดท้ายมีโครงสร้าง

E(length)=n=1nPr(length=n)

ความคิดเห็นเกี่ยวกับวิธีตอบคำถามนี้หรือไม่?

คำตอบ:


37

ต่อไปนี้เป็นคำแนะนำทั่วไปในการแก้ไขคำถามนี้:

คุณมีลำดับของตัวแปรสุ่มแบบต่อเนื่องของ IID ซึ่งหมายความว่าสามารถแลกเปลี่ยนได้ สิ่งนี้หมายความว่าอะไรเกี่ยวกับความน่าจะเป็นที่จะได้รับออเดอร์เฉพาะสำหรับค่าnแรกn? จากสิ่งนี้ความน่าจะเป็นที่จะได้รับลำดับที่เพิ่มขึ้นสำหรับค่าnแรกnคืออะไร มันเป็นไปได้ที่จะคิดออกโดยไม่ต้องรวมการกระจายของตัวแปรสุ่มพื้นฐาน หากคุณทำได้ดีคุณจะสามารถหาคำตอบได้โดยไม่ต้องมีการแจกแจงแบบสม่ำเสมอ - คุณจะได้คำตอบที่ใช้กับลำดับการแลกเปลี่ยนของตัวแปรสุ่มแบบต่อเนื่องใด ๆ


นี่เป็นวิธีการแก้ปัญหาอย่างเต็มรูปแบบ ( อย่าดูว่าคุณควรจะเข้าใจตัวเอง ):

ให้เป็นลำดับของตัวแปรสุ่มแบบต่อเนื่องอิสระและให้เป็นจำนวนองค์ประกอบที่เพิ่มขึ้นในช่วงเริ่มต้นของลำดับ เพราะสิ่งเหล่านี้เป็นตัวแปรสุ่มที่แลกเปลี่ยนได้อย่างต่อเนื่องพวกเขาเกือบจะไม่เท่าเทียมกันและการเรียงลำดับใด ๆ มีแนวโน้มเท่ากันดังนั้นเราจึงมี: (โปรดทราบว่าผลลัพธ์นี้เก็บไว้สำหรับลำดับ IID ใด ๆ ของตัวแปรสุ่มต่อเนื่องพวกเขาไม่จำเป็นต้องมีการแจกแจงแบบสม่ำเสมอ) ดังนั้นตัวแปรสุ่มจึงมีฟังก์ชันความน่าจะเป็นแบบN สูงสุด{ n N | U 1 < U 2 < < U n } P ( N n ) = P ( U 1 < U 2 < < U n ) = 1U1,U2,U3,IID Continuous DistNmax{nN|U1<U2<<Un}NpN(n)=P(N=n)=1

P(Nn)=P(U1<U2<<Un)=1n!.
NE(N)= n=1P(Nn)= n=11
pN(n)=P(N=n)=1n!1(n+1)!=n(n+1)!.
คุณจะสังเกตเห็นว่าผลลัพธ์นี้สอดคล้องกับค่าที่คุณคำนวณโดยใช้การผสานรวมกับค่าที่เกี่ยวข้อง (ส่วนนี้ไม่จำเป็นสำหรับการแก้ปัญหา; มันรวมอยู่เพื่อความสมบูรณ์) การใช้กฎที่รู้จักกันดีสำหรับค่าที่คาดหวังของตัวแปรสุ่มที่ไม่เป็นลบเรามี: โปรดทราบอีกครั้งว่าไม่มีสิ่งใดในการทำงานของเราที่ใช้การกระจายชุดข้อมูลพื้นฐาน ดังนั้นนี่คือผลลัพธ์ทั่วไปที่ใช้กับลำดับที่แลกเปลี่ยนได้ของตัวแปรสุ่มต่อเนื่อง
E(N)=n=1P(Nn)=n=11n!=e1=1.718282.

ข้อมูลเชิงลึกเพิ่มเติมบางอย่าง:

จากการทำงานข้างต้นเราจะเห็นว่าผลลัพธ์การกระจายตัวนี้และผลลัพธ์ที่คาดหวังนั้นไม่ได้ขึ้นอยู่กับการแจกแจงพื้นฐานตราบใดที่มันเป็นการกระจายอย่างต่อเนื่อง นี่ไม่น่าแปลกใจจริงๆเมื่อเราพิจารณาความจริงที่ว่าตัวแปรสุ่มแบบสเกลาร์ต่อเนื่องทุกตัวสามารถรับได้จากการแปลงแบบโมโนโทนิกของตัวแปรสุ่มแบบสม่ำเสมอ (ด้วยการแปลงเป็นฟังก์ชันควอนไทล์) นับตั้งแต่การเปลี่ยนแปลงต่อเนื่องรักษายศสั่งกำลังมองหาที่น่าจะเป็นของ orderings ของ IID พลตัวแปรสุ่มต่อเนื่องเป็นเช่นเดียวกับการมองหาที่น่าจะเป็นของ orderings ของ IID เครื่องแบบตัวแปรสุ่ม


6
ทำได้ดีมาก! (+1)
jbowman

1
@Ben ฉันตามคุณจนกว่าสมการสุดท้าย ... ฉันคิดว่าค่าที่คาดหวังควรเป็นแทนที่จะเป็น ... คุณช่วยอธิบายส่วนนี้เพิ่มเติมอีกไหม? E ( N ) = n = 1 P ( N n )
E(N)=n=1P(N=n)n=n=1n2/(n+1)!
E(N)=n=1P(Nn)
Amazonian

5
นี่คือกฎที่รู้จักกันดีสำหรับค่าที่คาดหวังของตัวแปรสุ่มที่ไม่ใช่เชิงลบ การใช้เทคนิคที่เกี่ยวข้องกับการสลับลำดับของการสรุปคุณมี: ดังนั้นคุณจะพบว่า1)!} n 1
E(N)=n=1nP(N=n)=n=1k=1nP(N=n)=n=1k=nP(N=k)=n=1P(Nn).
n1n!=nn2(n+1)!
Reinstate Monica

คุณช่วยอธิบายเพิ่มเติมได้ไหมว่าทำไม ? P(Nn)=P(U1<U2<<Un)
badmax

1
@badmax: ตัวแปรสุ่มคือจำนวนองค์ประกอบที่เพิ่มขึ้นของที่จุดเริ่มต้นของลำดับ (ดูคำจำกัดความ) ดังนั้นหากนั่นหมายความว่ามีองค์ประกอบที่เพิ่มขึ้นอย่างน้อยองค์ประกอบที่จุดเริ่มต้นของลำดับ ซึ่งหมายความว่าครั้งแรกที่องค์ประกอบจะต้องอยู่ในลำดับที่เพิ่มขึ้นซึ่งเป็น<U_n U N n n n U 1 < U 2 < < U nNUNnnnU1<U2<<Un
Reinstate Monica

8

อีกวิธีการแก้ปัญหาที่ทำให้คุณได้รับการแก้ปัญหาสำหรับกรณีทั่วไปมากขึ้น

สมมติว่าเป็นระยะเวลาที่คาดว่าจะมีการเรียงลำดับต่อเนื่องเช่นว่าx_2 ค่าที่เราต้องการที่จะคำนวณเป็น(0) และเรารู้ว่า 0 เงื่อนไขในค่าถัดไป{ x 1 , x 2 , . . } x x 1x 2F ( 0 ) F ( 1 ) = 0F(x){x1,x2,...}xx1x2F(0)F(1)=0

F(x)=0xπ(y)0dy+x1π(y)(1+F(y))dy=x11+F(y)dy

โดยที่คือความหนาแน่นของ U [0,1] ดังนั้นπ(y)=1

F(x)=(1+F(x))

แก้ด้วยเงื่อนไขขอบเขตเราได้รับ 1 ดังนั้นE-1F(1)=0F(x)=e(1x)1F(0)=e1


2
มันฉลาดมาก เพื่อที่จะสะกดมันออกมาเล็กน้อย: ข้อสังเกตของคุณคือ 1) ถ้าคือความยาวของลำดับการเพิ่มเริ่มต้นที่ยาวที่สุดลบหนึ่งมันก็เพียงพอที่จะกำหนดและเซตและ 2)เป็นศูนย์ถ้าและอย่างอื่น เนื่องจากเราได้ซึ่งในกรณีเครื่องแบบสามารถแก้ไขได้โดยตรง LE(L|X0=x)=:F(x)x=0E(L|X0=x,X1=Y)Y<x1+E(L|X0=Y)E(L|X0=x)=E(E(L|X0=x,X1))=RX(Y)E(L|X0=x,X1=Y)dY=x1X(Y)(1+E(L|X0=Y))dY=x1X(Y)(1+F(Y))dYF'(x)=-X(x)(1+F(x))
Matthew Towers

2
+1 ฉลาดมาก แต่เนื่องจากคำตอบสุดท้ายไม่ขึ้นอยู่กับการจัดจำหน่าย (ขณะที่กล่าวถึงในคำตอบอื่น ๆ ) การคำนวณนี้ควรอย่างใดไม่ได้ขึ้นอยู่กับ(y) มีวิธีดูไหม CC ถึง @m_t_ π(Y)
อะมีบาพูดว่า Reinstate Monica

3
@ amoeba ฉันเห็นด้วยไม่ควรขึ้นอยู่กับการกระจายตัวของแต่ค่าอื่น ๆ ของควร: วิธีแก้ปัญหาทั่วไปของ DE นั้นคือF(0)XFF=Cอี-π-1
Matthew Towers

1
@Martijn Weterings ฉันคิดว่าไม่ใช่ 1 เช่นในกรณีเครื่องแบบเราได้รับC=อีอีอี-x-1
Matthew Towers

1
ใช่คุณถูก. ฉันใช้กรณีเครื่องแบบเพื่ออนุมานคำสั่งของฉัน แต่ใช้เท็จแทนอี1-x-1อี-x-1
Sextus Empiricus

0

อีกวิธีการแก้คือการคำนวณอินทิกรัลโดยตรง

ความน่าจะเป็นของการสร้างลำดับที่ส่วนที่เพิ่มขึ้นมีความยาวของคือโดยที่int_nn(0)n(x)=x1x11x21...xn-21xn-11dxndxn-1...dx2dx1

สิ่งที่เราต้องทำคือการคำนวณ(0)n(0)

หากคุณพยายามคำนวณๆ บางทีคุณอาจพบว่าn(x)n(x)=Σเสื้อ=0n(-x)เสื้อเสื้อ!(n-เสื้อ)!

กรณีฐาน: เมื่อ ,n=11(x)=Σเสื้อ=01(-x)เสื้อเสื้อ!(n-เสื้อ)!=1-x=x1dx1

สมมติฐานอุปนัย: เมื่อ ,n=kn(x)=Σเสื้อ=0k(-x)เสื้อเสื้อ!(k-เสื้อ)! สำหรับ k1

Inductive Step: เมื่อ ,n=k+1

     n(x)=k+1(x)=x1k(x* * * *)dx* * * *

=x1Σเสื้อ=0k(-x* * * *)เสื้อเสื้อ!(k-เสื้อ)!dx* * * *

=Σเสื้อ=0k-(-x* * * *)เสื้อ+1เสื้อ!(k-เสื้อ)!×(เสื้อ+1)|x1=Σเสื้อ=0k-(-x* * * *)เสื้อ+1(เสื้อ+1)!(k-เสื้อ)!|x1

=Σเสื้อ=1k+1-(-x* * * *)เสื้อเสื้อ!(k-เสื้อ+1)!|x1

=Σเสื้อ=1k+1(-1)เสื้อ+1เสื้อ!(k-เสื้อ+1)!+Σเสื้อ=1k+1(-x)เสื้อเสื้อ!(k-เสื้อ+1)!

=Σเสื้อ=1k+1(-1)เสื้อ+1Cเสื้อk+1(k+1)!+Σเสื้อ=1k+1(-x)เสื้อเสื้อ!(k-เสื้อ+1)!

=1(k+1)!+Σเสื้อ=0k+1(-1)เสื้อ+1Cเสื้อk+1(k+1)!+Σเสื้อ=1k+1(-x)เสื้อเสื้อ!(k-เสื้อ+1)!

=1(k+1)!-(1-1)k+1(k+1)!+Σเสื้อ=1k+1(-x)เสื้อเสื้อ!(k-เสื้อ+1)!

=Σเสื้อ=0k+1(-x)เสื้อเสื้อ!(k-เสื้อ+1)!

โดยอุปนัยทางคณิตศาสตร์ข้อสันนิษฐานถือ

ดังนั้นเราจะได้รับn(0)=1n!

ดังนั้นE(ล.อีnก.เสื้อชั่วโมง)=Σn=1PR(ล.อีnก.เสื้อชั่วโมงn)=Σn=11n!=อี-1

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.