ช่องว่างสูงสุดระหว่างตัวอย่างที่วาดโดยไม่ต้องเปลี่ยนจากการแจกแจงแบบไม่ต่อเนื่อง


16

ปัญหานี้เกี่ยวข้องกับการวิจัยในห้องปฏิบัติการของฉันเกี่ยวกับการครอบคลุมของหุ่นยนต์:

สุ่มตัวเลขจาก setโดยไม่มีการแทนที่และเรียงลำดับตัวเลขจากมากไปหาน้อย เมตรn{1,2,,m}1nm

จากรายการที่เรียงลำดับหมายเลข , สร้างความแตกต่างระหว่างตัวเลขที่ต่อเนื่องกันและขอบเขต:\} นี่จะให้ช่องว่างของn + 1{a(1),a(2),,a(n)}g={a(1),a(2)a(1),,a(n)a(n1),m+1a(n)}n+1

การกระจายตัวของช่องว่างสูงสุดคืออะไร?

P(max(g)=k)=P(k;m,n)=?

คุณสามารถใส่กรอบนี้โดยใช้สถิติการสั่งซื้อ : P(g(n+1)=k)=P(k;m,n)=?

ดูลิงค์สำหรับการกระจายของช่องว่างแต่คำถามนี้ถามกระจายช่องว่างสูงสุด

ฉันจะพอใจกับค่าเฉลี่ยE[g(n+1)]1)}]

หากn=mช่องว่างทั้งหมดคือขนาด 1 หากn+1=mจะมีช่องว่างขนาดหนึ่ง2และn+1ตำแหน่งที่เป็นไปได้ ขนาดช่องว่างสูงสุดคือmn+1และช่องว่างนี้สามารถวางไว้ก่อนหรือหลัง หมายเลขnใด ๆnสำหรับตำแหน่งที่เป็นไปได้ทั้งหมดn+1ขนาดช่องว่างสูงสุดที่เล็กที่สุดคือ\mnn+1กำหนดความน่าจะเป็นของการรวมกันใดก็ตามT=(mn)11}

ฉันได้แก้ไขฟังก์ชันความน่าจะเป็นบางส่วนเป็น (1)P(g(n+1)=k)=P(k;m,n)={0k<mnn+11k=mnn+11k=1 (occurs when m=n)T(n+1)k=2 (occurs when m=n+1)T(n+1)k=m(n1)n?m(n1)nkmn+1T(n+1)k=mn+10k>mn+1

งานปัจจุบัน (1): สมการสำหรับช่องว่างแรกa(1)ตรงไปตรงมา:

P(a(1)=k)=P(k;m,n)=1(mn)k=1mn+1(mk1n1)
ค่าที่คาดหวังมีค่าง่าย ๆ : E[P(a(1))]=1(mn)k=1mn+1(mk1n1)k=mn1+nn} โดยความสมมาตรฉันคาดว่าช่องว่างnทั้งหมดnจะมีการกระจายตัวนี้ บางทีวิธีการแก้ปัญหาสามารถพบได้โดยการวาดภาพจากการกระจายครั้งนี้nครั้ง

งานปัจจุบัน (2):เป็นเรื่องง่ายที่จะรันการจำลอง Monte Carlo

simMaxGap[m_, n_] := Max[Differences[Sort[Join[RandomSample[Range[m], n], {0, m+1}]]]];
m = 1000; n = 1; trials = 100000;
SmoothHistogram[Table[simMaxGap[m, n], {trials}], Filling -> Axis,
Frame -> {True, True, False, False},
FrameLabel -> {"k (Max gap)", "Probability"},
PlotLabel -> StringForm["m=``,n=``,smooth histogram of maximum map for `` trials", m, n, trials]][![enter image description here][1]][1]

1
ด้วยเงื่อนไขเหล่านี้คุณจะต้องมี n <= m ฉันคิดว่าคุณต้องการ g = {a_ (1), a_ (2) -a_ (1), ... , a_ (n) -a_ (n-1)} การสุ่มเลือกหมายถึงการเลือกแต่ละหมายเลขด้วยความน่าจะเป็น 1 / m ในการจับรางวัลครั้งแรกหรือไม่? เนื่องจากคุณไม่ได้แทนที่ความน่าจะเป็นจะเป็น 1 / (m-1) ในวินาทีและต่อไปจนถึง 1 ในการวาด mth ถ้า n = m หาก n <m สิ่งนี้จะหยุดก่อนหน้านี้พร้อมกับการจับรางวัลครั้งสุดท้ายที่มีความน่าจะเป็น 1 / (m- (n-1)) ในการจับรางวัลที่ n
Michael R. Chernick

2
คำอธิบายดั้งเดิมของคุณในไม่มีเหตุผลเพราะ (ฉันเชื่อว่า) คุณได้เลื่อนสองห้อย โปรดยืนยันว่าการแก้ไขของฉันสอดคล้องกับความตั้งใจของคุณ: โดยเฉพาะอย่างยิ่งโปรดยืนยันว่าคุณหมายถึงการมีช่องว่างโดยที่เป็นครั้งแรก gna(1)
whuber

1
@gung ฉันคิดว่านี่เป็นงานวิจัยแทนที่จะศึกษาด้วยตนเอง
Glen_b -Reinstate Monica

1
ผมคิดว่าขั้นต่ำและขนาดช่องว่างสูงสุดของคุณควรจะเป็นและM-1ขนาดช่องว่างขั้นต่ำคือเมื่อเลือกจำนวนเต็มต่อเนื่องและขนาดช่องว่างสูงสุดเกิดขึ้นเมื่อคุณเลือกและจำนวนเต็มแรก (หรือและ )1mn+1mn11,,n11mn+2,,m
ความน่าจะเป็นเชิง

1
ขอบคุณ Michael Chernick และความน่าจะเป็นเป็นไปได้ที่จะทำการแก้ไข ขอบคุณ @whuber สำหรับการแก้ไข!
AaronBecker

คำตอบ:


9

ให้เป็นโอกาสที่ค่าต่ำสุด , เท่ากับ ; ที่เป็นกลุ่มตัวอย่างประกอบด้วยและ -subset ของ\} มีเซตย่อยดังกล่าวจากเซตย่อยที่มีโอกาสเท่ากันf(g;n,m)a(1)ggn1{g+1,g+2,,m}(mgn1)(mn)

Pr(a(1)=g=f(g;n,m)=(mgn1)(mn).

การเพิ่มสำหรับค่าที่เป็นไปได้ทั้งหมดของมากกว่าทำให้ได้ฟังก์ชันการอยู่รอดf(k;n,m)kg

Pr(a(1)>g)=Q(g;n,m)=(mg)(mg1n1)n(mn).

ให้เป็นตัวแปรสุ่มที่กำหนดโดยช่องว่างที่ใหญ่ที่สุด:Gn,m

Gn,m=max(a(1),a(2)a(1),,a(n)a(n1)).

(สิ่งนี้ตอบคำถามตามกรอบเดิมก่อนที่จะมีการแก้ไขเพื่อรวมช่องว่างระหว่างและ .)a(n)m เราจะคำนวณฟังก์ชันการอยู่รอดของจากการที่จัดจำหน่ายทั้งหมดของได้มาอย่างง่ายดาย วิธีการเป็นโปรแกรมแบบไดนามิกที่เริ่มต้นด้วยซึ่งเป็นที่ชัดเจนว่า

P(g;n,m)=Pr(Gn,m>g),
Gn,mn=1

(1)P(g;1,m)=Pr(G1,m>1)=mgm, g=0,1,,m.

สำหรับใหญ่กว่าโปรดทราบว่าเหตุการณ์คือการรวมกันของเหตุการณ์n>1Gn,m>g

a1>g,

ซึ่งช่องว่างแรกเกินและเหตุการณ์แยกgg

a1=k and Gn1,mk>g, k=1,2,,g

ซึ่งช่องว่างแรกเท่ากับและช่องว่างที่มากกว่าเกิดขึ้นในภายหลังในตัวอย่าง กฎหมายความน่าจะเป็นโดยรวมยืนยันความน่าจะเป็นของเหตุการณ์เหล่านี้kg

(2)P(g;n,m)=Q(g;n,m)+k=1gf(k;n,m)P(g;n1,mk).

การแก้ไขและสร้างอาร์เรย์แบบสองทางที่ทำดัชนีโดยและเราอาจคำนวณโดยใช้เพื่อกรอกข้อมูลในแถวแรกและเพื่อกรอกข้อมูลในแต่ละแถวที่ต่อเนื่องกันโดยใช้การดำเนินการต่อแถว ดังนั้นตารางสามารถจะแล้วเสร็จในการดำเนินงานและตารางทั้งหมดสำหรับผ่านสามารถถูกสร้างขึ้นในการดำเนินงานgi=1,2,,nj=1,2,,mP(g;n,m)(1)(2)O(gm)O(gmn)g=1g=mn+1O(m3n)

Figure

กราฟเหล่านี้แสดงฟังก์ชั่นการอยู่รอดสำหรับnเมื่อมีการเพิ่มขึ้นกราฟจะเลื่อนไปทางซ้ายซึ่งสอดคล้องกับโอกาสลดลงของช่องว่างขนาดใหญ่gP(g;n,64)n=1,2,4,8,16,32,64n

สูตรปิดสำหรับสามารถรับได้ในหลายกรณีโดยเฉพาะอย่างยิ่งสำหรับขนาดใหญ่แต่ฉันไม่สามารถรับสูตรปิดที่ใช้กับได้ทั้งหมด การประมาณที่ดีนั้นหาได้ง่ายโดยการแทนที่ปัญหานี้ด้วยปัญหาแบบอะนาล็อกสำหรับตัวแปรที่ต่อเนื่องกันP(g;n,m)ng,n,m

ในที่สุดความคาดหวังของจะได้รับจากการรวมฟังก์ชั่นการอยู่รอดของมันเริ่มต้นที่ :Gn,mg=0

E(Gn,m)=g=0mn+1P(g;n,m).

Figure 2: contour plot of expectation

โครงร่างความคาดหวังนี้แสดงรูปร่างที่ , จบการศึกษาจากมืดถึงสว่าง2,4,6,,32


คำแนะนำ: เส้น "ให้เป็นตัวแปรสุ่มได้รับจากช่องว่างที่ใหญ่ที่สุด:" โปรดเพิ่มช่องว่างสุดท้ายของ{n} แผนความคาดหวังของคุณตรงกับการจำลอง Monte Carlo ของฉัน Gn,mm+1an
AaronBecker
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.