ด้วยข้อมูลที่ได้รับจาก @Glen_b ฉันสามารถหาคำตอบได้ ใช้สัญลักษณ์เดียวกับคำถาม
P( Zk≤ x ) = ∑j = 0k + 1( k+1J) (-1)J( 1 - j x )k+,
โดยที่หากและอย่างอื่น ฉันยังให้ความคาดหวังและการบรรจบกันแบบซีมโทติคกับการกระจายGumbel ( NB : ไม่ใช่เบต้า)a > 0 0a+= aa > 00
E( Zk) = 1k + 1Σi = 1k + 11ผม∼ บันทึก( k + 1 )k + 1,P( Zk≤ x ) ~ ประสบการณ์( - e- ( k + 1 ) x + บันทึก( k + 1 )).
เนื้อหาของบทพิสูจน์ถูกนำมาจากสิ่งพิมพ์หลายฉบับที่เชื่อมโยงในเอกสารอ้างอิง ค่อนข้างยาว แต่ตรงไปตรงมา
1. หลักฐานการกระจายที่แน่นอน
Letตัวแปรสุ่ม พ.ศ. IID เครื่องแบบในช่วงเวลา(0,1)โดยการสั่งซื้อพวกเราได้รับสถิติเพื่อแสดง {(k)}) ระยะปลูกเครื่องแบบจะถูกกำหนดเป็นกับและ1 ระยะปลูกที่สั่งซื้อจะสอดคล้องสถิติสั่งซื้อ1)} ตัวแปรที่น่าสนใจคือ1)}( 0 , 1 ) k ( U ( 1 ) , … , U ( k ) ) Δ i = U ( i ) - U ( i - 1 ) U(U1,…,Uk)(0,1)k(U(1),…,U(k))Δi=U(i)−U(i−1) U ( k + 1 ) =1 Δ ( 1 ) ≤U(0)=0U(k+1)=1 Δ ( k + 1 )Δ(1)≤…≤Δ(k+1)Δ(k+1)
สำหรับการแก้ไขเรากำหนดตัวแปรตัวบ่งชี้\}} โดยสมมาตรเวกเตอร์แบบสุ่มสามารถแลกเปลี่ยนได้ดังนั้นการกระจายตัวของเซตย่อยขนาดจึงเหมือนกับการกระจายข้อต่อของ คนแรกที่เจด้วยการขยายผลิตภัณฑ์เราจึงได้รับ1 i = 1 { Δ i > x } ( 1 1 , … , 1 k + 1 ) j jx∈(0,1)1i=1{Δi>x}(11,…,1k+1)jj
P( Δ( k + 1 )≤ x ) = E( ∏i = 1k + 1( 1 - 1)ผม) ) = 1 + ∑j = 1k + 1( k+1J) (-1)JE( ∏i = 1J1ผม) .
ตอนนี้เราจะพิสูจน์ว่าซึ่งจะสร้างการแจกแจงดังกล่าวข้างต้น เราพิสูจน์สิ่งนี้สำหรับเนื่องจากกรณีทั่วไปได้รับการพิสูจน์ในทำนองเดียวกัน j = 2E( ∏Ji = 11ผม)=(1−jx)k+j=2
E(∏i=121i)=P(Δ1>x∩Δ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).
หากที่จุดพักอยู่ในช่วงเวลา1) โดยมีเงื่อนไขในเหตุการณ์นี้เบรกพอยต์ยังคงสามารถแลกเปลี่ยนได้ดังนั้นความน่าจะเป็นที่ระยะทางระหว่างจุดที่สองและจุดพักแรกมากกว่าเท่ากับความน่าจะเป็นที่ระยะทางระหว่างจุดพักจุดแรกและจุดกั้นด้านซ้าย (ที่ตำแหน่ง ) มีค่ามากกว่าxดังนั้นk ( x , 1 ) x x xΔ1>xk(x,1)xxx
P(Δ2>x|Δ1>x)=P(all points are in (2x,1)∣∣all points are in (x,1)),soP(Δ2>x∩Δ1>x)=P(all points are in (2x,1))=(1−2x)k+.
2. ความคาดหวัง
สำหรับการแจกแจงด้วยการสนับสนุนที่ จำกัด เรามี
E(X)=∫P(X>x)dx=1−∫P(X≤x)dx.
การบูรณาการการกระจายของเราได้รับΔ(k+1)
E(Δ(k+1))=1k+1∑j=1k+1(k+1j)(−1)j+1j=1k+1∑j=1k+11j.
ความเท่าเทียมกันสุดท้ายเป็นตัวแทนคลาสสิกของตัวเลขฮาร์โมนิซึ่งเราแสดงให้เห็นด้านล่างHi=1+12+…+1i
Hk+1=∫101+x+…+xkdx=∫101−xk+11−xdx.
ด้วยการเปลี่ยนแปลงของตัวแปรและการขยายผลิตภัณฑ์เราได้รับu=1−x
Hk+1=∫10∑j=1k+1(k+1j)(−1)j+1uj−1du=∑j=1k+1(k+1j)(−1)j+1j.
3. การก่อสร้างทางเลือกของการเว้นระยะสม่ำเสมอ
ในการที่จะได้รับการกระจายเชิงซีมโทติคของชิ้นส่วนที่ใหญ่ที่สุดเราจะต้องแสดงการสร้างแบบดั้งเดิมของการเว้นวรรคแบบสม่ำเสมอเป็นตัวแปรเลขชี้กำลังหารด้วยผลรวมของพวกมัน ความหนาแน่นของความน่าจะเป็นของสถิติคำสั่งซื้อที่เกี่ยวข้อง คือ(U(1),…,U(k))
fU(1),…U(k)(u(1),…,u(k))=k!,0≤u(1)≤…≤u(k+1).
หากเราแสดงถึงการเว้นวรรคอย่างสม่ำเสมอ , ด้วยเราจะได้รับ U ( 0 ) = 0Δi=U(i)−U(i−1)U(0)=0
fΔ1,…Δk(δ1,…,δk)=k!,0≤δi+…+δk≤1.
โดยการกำหนดเราจะได้รับU(k+1)= 1
fΔ1,…Δk+1(δ1,…,δk+1)=k!,δ1+…+δk=1.
ตอนนี้ให้จะ IID ชี้แจงตัวแปรสุ่มที่มีค่าเฉลี่ย 1 และให้1} ด้วยการเปลี่ยนแปลงอย่างง่ายของตัวแปรเราจะเห็นได้ว่าS = X 1 +(X1,…,Xk+1)S=X1+…+Xk+1
fX1,…Xk,S(x1,…,xk,s)=e−s.
กำหนดเช่นนั้นโดยการเปลี่ยนแปลงของตัวแปรที่เราได้รับYi=Xi/S
fY1,…Yk,S(y1,…,yk,s)=ske−s.
การรวมความหนาแน่นนี้เข้ากับเราจึงได้s
fY1,…Yk,(y1,…,yk)=∫∞0ske−sds = k ! ,0 ≤ yผม+ … + yk≤ 1 ,และดังนั้นฉY1, … Yk + 1,( y1, … , yk + 1) = k ! ,Y1+ … + yk + 1= 1
ดังนั้นการกระจายข้อต่อของชุดอวกาศในช่วงเวลาจึงเท่ากับการกระจายตัวแบบร่วมของตัวแปรสุ่มเลขชี้กำลังหารด้วยผลรวมของพวกเขา เรามาถึงความเท่าเทียมกันของการกระจายต่อไปนี้( 0 ,k + 1( 0 , 1 )k+1
Δ(k+1)≡X(k+1)X1+…+Xk+1.
4. การกระจายเชิงเส้นกำกับ
เราได้รับการใช้ความเท่าเทียมกันข้างต้น
P((k+1)Δ(k+1)−log(k+1)≤x)=P(X(k+1)≤(x+log(k+1))X1+…+Xk+1k+1)=P(X(k+1)−log(k+1)≤x+(x+log(k+1))Tk+1),
ที่-1 ตัวแปรนี้หายไปในความน่าจะเป็นเพราะและ0 asymptotically กระจายเป็นเช่นเดียวกับที่ของ1) เนื่องจากเป็น IID เราจึงมีTk+1=X1+…+Xk+1k+1−1E(Tk+1)=0Var(log(k+1)Tk+1)=(log(k+1))2k+1↓0X(k+1)−log(k+1)Xi
P(X(k+1)−log(k+1)≤x)=P(X1≤x+log(k+1))k+1=(1−e−x−log(k+1))k+1=(1−e−xk+1)k+1∼exp{−e−x}.
5. ภาพรวมกราฟิก
พล็อตด้านล่างแสดงการกระจายของชิ้นส่วนที่ใหญ่ที่สุดสำหรับค่าที่แตกต่างของkสำหรับฉันได้ซ้อนการกระจายกัมเบลแบบซีมโทติค (เส้นบาง ๆ ) ด้วย กัมเบลนั้นเป็นค่าประมาณที่แย่มากสำหรับค่าเล็ก ๆ ของดังนั้นฉันจึงไม่ใช้มันเพื่อไม่ให้ภาพเกินพิกัด กัมเบลประมาณเป็นสิ่งที่ดีจาก50kk = 10 , 20 , 50kk ≈ 50
6. การอ้างอิง
หลักฐานข้างต้นมาจากการอ้างอิง 2 และ 3 วรรณกรรมที่อ้างถึงมีผลลัพธ์อีกมากมายเช่นการกระจายของการเว้นวรรคที่ได้รับคำสั่งของตำแหน่งใด ๆ การกระจายขีด จำกัด และการสร้างทางเลือกอื่นของชุดอวกาศที่ได้รับคำสั่ง การอ้างอิงที่สำคัญนั้นไม่สามารถเข้าถึงได้ง่ายดังนั้นฉันจึงให้ลิงก์ไปยังข้อความเต็ม
- Bairamov และคณะ (2010) จำกัด ผลลัพธ์สำหรับการเว้นระยะห่างแบบสม่ำเสมอเอกสารสถิติ 51: 1, pp 227-240
- โฮลส์ (1980) เมื่อวันที่ความยาวของชิ้นส่วนของไม้ที่เสียที่สุ่มเจ Appl Prob., 17, pp 623-634
- Pyke (1965) Spacings , JRSS (B) 27: 3, pp. 395-449
- Renyi (1953) ตามทฤษฎีของสถิติการสั่งซื้อ Acta math Hung, 4, pp 191-231