การกระจายแบบไม่ต่อเนื่องนี้คืออะไร (สมการส่วนต่างแบบเรียกซ้ำ) ที่ฉันได้รับ


11

ฉันเจอเกมนี้ในคอมพิวเตอร์และต้องการเรียนรู้เพิ่มเติมเกี่ยวกับพฤติกรรมของมัน มันมาจากการตัดสินใจว่าเหตุการณ์บางอย่างควรเกิดขึ้นหลังจากการกระทำของผู้เล่นจำนวนหนึ่งหรือไม่ รายละเอียดนอกเหนือจากนี้ไม่เกี่ยวข้อง ดูเหมือนว่าเหมาะสมกับสถานการณ์อื่น ๆ และฉันพบว่ามันน่าสนใจเพราะง่ายต่อการคำนวณและสร้างหางยาว

ทุกขั้นตอนเกมสร้างตัวเลขสุ่มเครื่องแบบ<1 ถ้าเหตุการณ์จะถูกเรียกใช้ หลังจากเหตุการณ์เกิดขึ้นอีกครั้งเกมจะรีเซ็ตn = 0และทำงานตามลำดับอีกครั้ง ฉันสนใจเพียงเหตุการณ์เดียวที่เกิดขึ้นสำหรับปัญหานี้เพราะนั่นหมายถึงการกระจายที่เกมใช้อยู่ (นอกจากนี้คำถามใด ๆ เกี่ยวกับเหตุการณ์หลายรายการสามารถตอบด้วยแบบจำลองเหตุการณ์เดียว)0 X < 1 X < p ( n ) n = 0n0X<1X<p(n)n=0

"ความผิดปกติ" หลักที่นี่คือพารามิเตอร์ความน่าจะเป็นในการแจกแจงนี้เพิ่มขึ้นเมื่อเวลาผ่านไปหรืออีกทางหนึ่งเกณฑ์เพิ่มขึ้นเมื่อเวลาผ่านไป ในตัวอย่างมันเปลี่ยนแปลงเป็นเส้นตรง แต่ฉันคิดว่าอาจใช้กฎอื่น หลังจากnขั้นตอนหรือการกระทำโดยผู้ใช้

p(n)=kn

สำหรับบางคนคง0<k<1<1 ในบางจุดnmaxเราได้รับp(nmax)11 เหตุการณ์รับประกันได้ว่าจะเกิดขึ้นในขั้นตอนนั้น

ฉันสามารถระบุได้ว่า

f(n)=p(n)[1F(n1)]
และ
F(n)=p(n)+F(n1)[1p(n)]
สำหรับ PMF f(n)และ CDF F(n)(n) โดยสรุปความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นในขั้นตอนที่nเท่ากับความน่าจะเป็นp(n)น้อยกว่าความน่าจะเป็นที่เกิดขึ้นแล้วในขั้นตอนก่อนหน้านี้

นี่คือพล็อตจากเพื่อนของเรา Monte Carlo เพื่อความสนุกสนานกับk0.0030.003 ค่ามัธยฐานทำงานได้ถึง 21 และเฉลี่ยถึง 22 ป้อนคำอธิบายรูปภาพที่นี่

นี่เทียบเท่ากับสมการผลต่างลำดับที่หนึ่งจากการประมวลผลสัญญาณดิจิตอลซึ่งเป็นพื้นหลังของฉันดังนั้นฉันจึงพบว่ามันค่อนข้างแปลกใหม่ ฉันรู้สึกทึ่งกับความคิดที่ว่าp(n)อาจแตกต่างกันไปตามสูตรใดก็ได้

คำถามของฉัน:

  1. การกระจายนี้มีชื่อว่าอะไรถ้ามี?
  2. มีวิธีใดที่จะได้รับนิพจน์สำหรับโดยไม่มีการอ้างอิงถึง ?F ( n )f(n)F(n)
  3. มีตัวอย่างอื่น ๆ ของการกระจายแบบเรียกซ้ำแบบไม่ต่อเนื่องเช่นนี้หรือไม่?

แก้ไข กระบวนการที่ชี้แจงเกี่ยวกับการสร้างหมายเลขสุ่ม


1
เหตุผลใดที่คุณเลือกวงเล็บเหลี่ยมแทน ()
Cam.Davidson.Pilon

1
@ Cam.Davidson.Pilon: พื้นหลัง DSP ของฉันแอบเข้าไปเรามักจะใช้วงเล็บเหลี่ยมสำหรับฟังก์ชั่นเวลาไม่ต่อเนื่อง ฉันเดาว่านี่จะต้องสั่นสะเทือนดังนั้นฉันจะเปลี่ยนมัน
jbarlow

1
กระบวนการที่คุณสมมติไม่ปรากฏชัดเจนที่นี่ คุณพูดว่า "ทุกขั้นตอนเกมจะหมุนหมายเลขสุ่มหากเหตุการณ์จะเริ่มขึ้น" แต่คุณไม่มีข้อกำหนดสำหรับวิธีการวาดฉันคิดว่ามันจะเป็นประโยชน์หากกระบวนการสามารถอธิบายได้แม่นยำขึ้นอีกเล็กน้อย nXX<p(n)X
พระคาร์ดินัล

2
@jbarlow: ขออภัยถ้าคำพูดก่อนหน้าของฉันไม่ชัดเจน ถ้าสำหรับบางส่วนแล้วไม่มีวิธีที่กระบวนการของคุณจะมีมากกว่าขั้นตอนเนื่องจากตัวเลขสุ่มแบบสม่ำเสมอระหว่างศูนย์และหนึ่งจะมีขนาดเล็กลงอย่างแน่นอน กว่าสำหรับการใด ๆ k ปริมาณเป็นฟังก์ชั่นของที่เกี่ยวข้องอย่างใกล้ชิดกับสิ่งที่เรียกว่าฟังก์ชั่นอันตรายในฟิลด์ของสถิติที่เรียกว่าการวิเคราะห์การอยู่รอด p(n)=kn0<k<1k1p(n)n>1/kp(n)n
พระคาร์ดินัล

1
สำหรับขนาดเล็กการใช้ analog analog ของสมการความแตกต่างนี้แสดงว่า ( ไม่ใช่ !) ใกล้กับ Gaussian (จากนี้เราได้ทันทีอนุมานเช่นว่าหมายความว่าจะต้องอยู่ใกล้กับ .) โปรดทราบเหมือนกันว่ามีบาง (แรง) ข้อ จำกัด ใน , สำหรับมิฉะนั้นครั้งเดียวเกิน (ซึ่งในที่สุดก็ไม่) ไม่มีการรับประกันว่ายังคงน้อยกว่าหรือเท่ากับ1F f kF fkp(n)1F1/k=33318kp(n)1F1
whuber

คำตอบ:


9

ในแง่หนึ่งสิ่งที่คุณทำคือการแจกแจงค่าจำนวนเต็มแบบไม่ลบทั้งหมด

ลองแยกคำอธิบายของกระบวนการสุ่มสักครู่แล้วจดจ่อกับการสอบถามซ้ำในคำถาม

หากแล้วแน่นอน{n-1} ถ้าเราเขียนการสอบถามซ้ำครั้งที่สองนี้ในรูปของฟังก์ชันการเอาตัว รอด (ที่มีการแจกแจง ) เราจะได้รับสิ่งที่ชี้นำและง่ายต่อการจัดการ ชัดเจน และอื่น ๆ ดังนั้นตราบใดที่ลำดับของเรารับค่าในและไม่ได้มาบรรจบกันอย่างรวดเร็วจนเกินศูนย์เราจะได้ฟังก์ชันการเอาตัวรอดที่ถูกต้อง (เช่น monotonically ลดลงเป็นศูนย์เป็น )F n = p n + ( 1 - p n ) F n - 1 S n = 1 - F n = P ( T > n ) T F S n = 1 - F n = ( 1 - p n ) S nfn=pn(1Fn1)Fn=pn+(1pn)Fn1 Sn=1Fn=P(T>n)TFS n = n k = 0 ( 1 - p k )

Sn=1Fn=(1pn)Sn1,
( p n ) [ 0 , 1 ] n
Sn=k=0n(1pk).
(pn)[0,1]n

โดยเฉพาะอย่างยิ่ง,

ข้อเสนอ : ลำดับรับค่าในเป็นตัวกำหนดการแจกแจงของจำนวนเต็มที่ไม่ใช่ค่าลบถ้าหากและการแจกแจงดังกล่าวทั้งหมดมีลำดับที่สอดคล้องกัน (แม้ว่ามันอาจจะไม่ซ้ำกัน)[ 0 , 1 ] - n = 0บันทึก( 1 - p n ) = (pn)[0,1]

n=0log(1pn)=,

ดังนั้นการเรียกซ้ำที่เขียนในคำถามคือทั่วไปอย่างเต็มที่ : ใด ๆ กระจายติดลบมูลค่ามีลำดับที่สอดคล้องกัน การค่าเป็น[0,1][ 0 , 1 ](pn)[0,1]

อย่างไรก็ตามการสนทนาไม่เป็นความจริง นั่นคือมีลำดับมีค่าในที่ไม่สอดคล้องกับการแจกแจงที่ถูกต้องใด ๆ (โดยเฉพาะให้พิจารณาสำหรับและสำหรับ )[ 0 , 1 ] 0 < p n < 1 n N p n = 0 n > N(pn)[0,1]0<pn<1nNpn=0n>N

แต่เดี๋ยวก่อนมีอีกมาก!

เราได้พูดถึงการเชื่อมโยงกับการวิเคราะห์การอยู่รอดและมันคุ้มค่าที่จะสำรวจสิ่งนี้ให้ลึกซึ้งยิ่งขึ้น ในการวิเคราะห์การอยู่รอดคลาสสิกกับการกระจายอย่างต่อเนื่องอย่างและสอดคล้องกับความหนาแน่นของที่ ฟังก์ชั่นอันตรายถูกกำหนดให้เป็น f h ( t ) = f ( t )Ff

h(t)=f(t)S(t).

อันตรายสะสมแล้วและการวิเคราะห์อย่างง่ายของการแสดงตราสารอนุพันธ์ที่ จากนี้เราได้ทันทีสามารถให้ลักษณะของฟังก์ชั่นอันตรายที่ยอมรับ: มันเป็นใด ๆ ฟังก์ชั่นที่วัดดังกล่าวว่าสำหรับทุกและ เป็น\S ( t ) = exp ( - Λ ( t ) ) = exp ( - t 0 h ( s )Λ(t)=0th(s)dsh h ( t ) 0 t t 0 h ( s )

S(t)=exp(Λ(t))=exp(0th(s)ds).
hh(t)0tt 0th(s)dst

เราได้รับ recursion ที่คล้ายกันสำหรับฟังก์ชั่นการเอาชีวิตรอดไปยังที่อยู่ด้านบนโดยสังเกตว่าสำหรับt>t0

S(t)=et0th(s)dsS(t0).

สังเกตโดยเฉพาะอย่างยิ่งว่าเราสามารถเลือกเป็นค่าคงที่ทีละชิ้นโดยแต่ละชิ้นมีความกว้าง 1 และอินทิกรัลแปรเปลี่ยนเป็นอินฟินิตี้ นี่จะให้ฟังก์ชันการอยู่รอด ที่ตรงกับจำนวนเต็มที่ไม่ต่อเนื่องที่ต้องการใด ๆ ที่มีค่าหนึ่งในแต่ละจำนวนเต็มบวกh(t)S(t)

เชื่อมต่อกลับเข้ากับเคสแบบไม่ต่อเนื่อง

เพื่อให้ตรงกับที่ไม่ต่อเนื่องที่ต้องการในแต่ละจำนวนเต็มเราควรเลือกฟังก์ชั่นอันตรายที่เป็นค่าคงที่ทีละชิ้นเช่น onนี่เป็นการพิสูจน์ข้อที่สองของเงื่อนไขที่จำเป็นสำหรับลำดับเพื่อกำหนดการแจกแจงที่ถูกต้องS(n)

h(t)=hn=log(1pn),
(n1,n](pn)

หมายเหตุว่าสำหรับขนาดเล็ก , ซึ่งมีการเชื่อมต่อการแก้ปัญหาระหว่างการทำงานของสารอันตรายของการกระจายอย่างต่อเนื่องและการกระจายที่ไม่ต่อเนื่องที่มีฟังก์ชั่นการอยู่รอดการจับคู่ใน จำนวนเต็มpnlog(1pn)pn=fn/Sn1

Postscript : ในฐานะที่เป็นบันทึกสุดท้ายตัวอย่างในคำถามไม่ เป็นไปตามเงื่อนไขที่จำเป็นโดยไม่มีการดัดแปลงที่เหมาะสมเป็น ที่และการตั้งค่าสำหรับ\pn=knfnn=k1fn=0n>k1


1
+1 ส่องสว่างมาก แต่เกี่ยวกับวรรณกรรมมันดูเหมือนว่าฉันว่า "การตัดที่เหมาะสม" เกิดขึ้นเป็นเรื่องของหลักสูตรสำหรับค่าพิเศษของkตัวอย่างเช่นด้วยเราได้รับและโดยทั่วไปด้วยเราได้รับ 0 kk=1/2f=(0,1/2,1/2,0,)k=1/mf(m+1)=f(m+2)==0
whuber

2
@whuber: ฉันควรระบุให้ชัดเจนยิ่งขึ้นว่าฉันหมายถึงอะไรโดย "การตัดทอนที่เหมาะสม" ฉันกำลังคิดที่จะตัดทอน (ลดขนาด) ค่าของที่จุดที่ระบุ (เพื่อให้กลายเป็นเอกภาพ) ผมคิดว่าความคิดที่ว่ายังคงถูกต้องในกรณีที่คุณพูดถึงเพียงว่าการตัดจะไม่ส่งผลให้เกิดการเปลี่ยนแปลงของมูลค่าของf_nฉันจะพยายามชี้แจงในการแก้ไขในไม่ช้า ขอบคุณ! fnFnfn
พระคาร์ดินัล

2
คำตอบที่ดี นี่มันลึกซึ้งมาก ฉันสนใจจริงๆที่จะเห็นปัญหานี้เชื่อมโยงกับพื้นที่และแนวคิดอื่น ๆ
jbarlow

1
@jbarlow: ขอบคุณ ฉันดีใจที่คุณพบว่ามีประโยชน์! ฉันสนุกกับการคิดเล็กน้อยเกี่ยวกับมันเพราะมันเป็นคำถามที่ดี
พระคาร์ดินัล

9

ในกรณีเรามีคุณสมบัติที่รู้จักกันบ้าง เราสามารถแก้ไขความสัมพันธ์ที่เกิดซ้ำได้p(n)=p<1

F(n)=p+F(n1)(1p);F(0)=p

มีทางออก

F(n)=P(Nn)=1(1p)n+1
ซึ่งเป็นกระจายทางเรขาคณิต เป็นการศึกษาที่ดี

กรณีทั่วไปมากขึ้นของอาจไม่สามารถคำนวณในรูปแบบปิดและดังนั้นจึงน่าจะไม่ได้มีการกระจายที่รู้จักกันp(n)

กรณีอื่น ๆ :

  1. p(n)=pn;p<1;F(0)=pมีทางออก ซึ่งไม่ใช่การกระจายที่รู้จักกันทั่วไป
    F(n)=1(1p)Γ(n+1p)Γ(1p)Γ(n+1)
  2. กำหนด (หรือที่เรียกว่าฟังก์ชันการเอาตัวรอดในสถิติ) ความสัมพันธ์ที่เกิดซ้ำข้างต้นจะลดลงในรูปแบบที่ง่ายขึ้น: S(n)=1F(n)
    S(n)=(1p(n))S(n1)
  3. จากตัวอย่างของคุณก็จะปรากฏขึ้นคุณต้องการฟังก์ชั่นที่เพิ่มขึ้นในการnทางเลือกของคุณไม่ดีเพราะการวิเคราะห์ของการแบ่งที่ 1 นักคณิตศาสตร์และนักสถิติชอบสิ่งที่ราบรื่น ดังนั้นฉันจึงเสนอ ซึ่งและลู่เข้าสู่ 1 การแก้ความสัมพันธ์ที่เกิดซ้ำกับนี้มีรูปแบบการวิเคราะห์ที่ดี: พิจารณา . สถิติที่ทราบคือ p(n)np(n)=knp>1
    p(n)=1(1p)n+1p<1
    p(0)=pp(n)S(n)=1-F(n)=(1-p) n + 1
    F(n)=1(1p)n+1n!
    i=0S(i)=E[N]E[N]=(1-p)e(1-p)S(n)=1F(n)=(1p)n+1n!
    i=0S(i)=E[N]
    ซึ่งถ้าคุณจำแคลคูลัสได้ดูเหมือนว่าอนุกรมของเทย์เลอร์เอ็กซ์โปเนนเชียลดังนั้น
    E[N]=(1p)e(1p)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.