จะสร้างแบบจำลองผลรวมของตัวแปรสุ่มของเบอร์นูลลี่สำหรับข้อมูลที่ต้องพึ่งพาได้อย่างไร


9

ฉันมีคำถามเกือบเหมือนกัน: ฉันจะสร้างแบบจำลองผลรวมของตัวแปรสุ่มของเบอร์นูลลี่ได้อย่างมีประสิทธิภาพได้อย่างไร

แต่การตั้งค่าแตกต่างกันมาก:

  1. S=i=1,NXi, P(Xi=1)=pi, N~ 20 pi~ 0.1

  2. เรามีข้อมูลสำหรับผลลัพธ์ของตัวแปรสุ่มของ Bernoulli: Xi,j , Sj=i=1,NXi,j

  3. ถ้าเราประเมิน pi ด้วยการประเมินความเป็นไปได้สูงสุด (และรับ p^iMLE) ปรากฎว่า P^{S=3}(p^iMLE) มีขนาดใหญ่กว่าเกณฑ์อื่นที่คาดไว้: P^{S=3}(p^iMLE)P^expected{S=3}0.05

  4. ดังนั้น, Xi และ Xj (j>k) ไม่สามารถถือว่าเป็นอิสระได้ (มีการพึ่งพาอาศัยกันเล็กน้อย)

  5. มีข้อ จำกัด บางประการดังนี้: pi+1pi และ s2P^{S=s}=A (ทราบ) ซึ่งควรช่วยในการประมาณ P{S}.

เราจะลองจำลองผลรวมของตัวแปรสุ่มของเบอร์นูลลี่ในกรณีนี้ได้อย่างไร

วรรณกรรมประเภทใดที่มีประโยชน์ในการแก้ปัญหา?

ปรับปรุง

มีความคิดเพิ่มเติม:

(1) มีความเป็นไปได้ที่จะสันนิษฐานว่าการพึ่งพาอาศัยกันระหว่าง Xiเริ่มหลังจาก 1 หรือมากกว่าความสำเร็จในซีรีส์ ดังนั้นเมื่อi=1,KXi>0, pK+1pK+1 และ pK+1<pK+1.

(2) ในการใช้ MLE เราจำเป็นต้องมีแบบจำลองที่น่าสงสัยน้อยที่สุด นี่คือตัวแปร:

P{X1,...,Xk}=(1p1)...(1pk) ถ้า i=1,kXi=0 สำหรับ k ใด ๆ P{X1,...,Xk,Xk+1,...,XN}=(1p1)...pkP{Xk+1,...,XN} ถ้า i=1,k1Xi=0 และ Xk=1และ P'{Xk+1=1,Xk+2=1,...,Xยังไม่มีข้อความ=1}พีk+1พีk+2...พียังไม่มีข้อความ สำหรับ k ใด ๆ

(3) เนื่องจากเราสนใจเท่านั้น P{S} เราสามารถตั้งค่า P'{Xk+1,...,Xยังไม่มีข้อความ}P"{Σผม=1,kXผม=s';ยังไม่มีข้อความ-(k+1)+1=ล.} ความน่าจะเป็นของ Σผม=k+1,ยังไม่มีข้อความXผมความสำเร็จสำหรับ N- (k + 1) +1 เรียกจากหาง) และใช้พารามิเตอร์P"{Σผม=k,ยังไม่มีข้อความXผม=s';ยังไม่มีข้อความ-k+1=ล.}=พีs',ล.

(4) ใช้ MLE สำหรับรุ่นตามพารามิเตอร์ พี1,...,พียังไม่มีข้อความ และ พี0,1,พี1,1;พี0,2,พี1,2,พี2,2;... กับ พีs',ล.=0 สำหรับ s'6 (และใด ๆ ล.) และข้อ จำกัด อื่น ๆ

ทุกอย่างโอเคกับแผนนี้หรือไม่

อัปเดต 2

ตัวอย่างของการกระจายเชิงประจักษ์ P{S} (สีแดง) เปรียบเทียบกับการแจกแจงแบบปัวซง (สีน้ำเงิน) (ค่าปัวส์หมายถึง 2.22 และ 2.45 ขนาดตัวอย่าง 332 และ 259):

Sample1 sample2

สำหรับตัวอย่าง (A1, A2) ที่มีค่าปัวซงหมายถึง 2.28 และ 2.51 (ขนาดตัวอย่างคือ 303 และ 249):

sample3 sample4

สำหรับ samlpe ที่เข้าร่วม A1 + A2 (ขนาดตัวอย่างคือ 552):

ตัวอย่าง 3 + ตัวอย่าง 4

ดูเหมือนว่าการแก้ไข Poisson ควรเป็นโมเดลที่ดีที่สุด :)


2
สิ่งที่เป็น Xผม,J?
chl

1
@Andrey สูตรใน (2) และข้อ จำกัด ที่สองใน (4) ไม่สมเหตุสมผล: หมวกมีความหมายอย่างไรใน (4) คืออะไรS? (คุณได้กำหนดไว้เท่านั้นSJไม่ใช่ S.) การแสดงออกใน (4) เป็นผลรวมของสามผลิตภัณฑ์หรืออย่างอื่น?
whuber

Xผม,J คือผลลัพธ์แบบสุ่มของ Bernoulli (ผลลัพธ์ i-th ในชุด j-th) SJ คือผลลัพธ์ j-th ของผลรวม (ผลรวมของอนุกรม) Sเป็นตัวแปรสุ่มของผลรวม หมวกใน (4) หมายถึงค่าประมาณ ดังนั้นจึงมีข้อมูลเพิ่มเติมเกี่ยวกับผลรวมของค่าต่ำสุดของS. ขอโทษสำหรับความสับสน.
Andrey

คำตอบ:


3

แนวทางหนึ่งคือการสร้างแบบจำลอง Xด้วยโมเดลเชิงเส้นทั่วไป (GLM) ที่นี่คุณจะกำหนดพีผมความน่าจะเป็นที่จะประสบความสำเร็จใน ผม'การทดลองใช้เป็นฟังก์ชั่นเชิงเส้นตรงของประวัติการสังเกตการณ์ ดังนั้นคุณควรปรับค่า GLM แบบตอบรับอัตโนมัติให้เหมาะสมโดยที่เสียงนั้นคือเบอร์นูลลีและฟังก์ชั่นการเชื่อมโยงเป็น logit การตั้งค่าคือ:

พีผม=(+a1Xผม-1+a2Xผม-2+...akXผม-k)ที่ไหน

(x)=11+ประสบการณ์(x)และ

Xผม~BอีRnโอยูล.ล.ผม(พีผม)

พารามิเตอร์ของโมเดลคือ {,a1,...ak}ซึ่งสามารถประมาณได้โดยการถดถอยโลจิสติก (สิ่งที่คุณต้องทำคือตั้งค่าเมทริกซ์การออกแบบของคุณโดยใช้ส่วนที่เกี่ยวข้องของประวัติการสังเกตในแต่ละการทดลองและส่งผ่านไปยังฟังก์ชันการประมาณการถดถอยแบบโลจิสติก หากผลลัพธ์มีความเป็นอิสระแน่นอนแล้วaผมจะถูกตั้งค่าเป็นศูนย์ บวกaผมหมายความว่าตามมา พีผมเพิ่มขึ้นเมื่อใดก็ตามที่สังเกตเห็นความสำเร็จ

แบบจำลองไม่ได้ให้การแสดงออกอย่างง่ายสำหรับความน่าจะเป็นเหนือผลรวมของXผมแต่สิ่งนี้ง่ายต่อการคำนวณโดยการจำลอง (การกรองอนุภาคหรือ MCMC) เนื่องจากตัวแบบมีโครงสร้างของ Markovian ง่าย

แบบจำลองชนิดนี้ถูกนำมาใช้กับความสำเร็จอย่างยิ่งใหญ่ในการสร้างแบบจำลองการพึ่งพาชั่วคราวระหว่าง "spikes" ของเซลล์ประสาทในสมองและมีวรรณกรรมที่ครอบคลุมเกี่ยวกับแบบจำลองกระบวนการชี้จุดอัตโนมัติ ดูตัวอย่างTruccolo et al 2005 (แม้ว่าบทความนี้ใช้ปัวซองแทนความเป็นไปได้ของเบอร์นูลลี แต่การทำแผนที่จากที่หนึ่งไปอีกที่หนึ่งเป็นเรื่องตรงไปตรงมา)


1

หากการพึ่งพาอาศัยกันเกิดจากการรวมกลุ่มแบบปัวซองแบบผสมอาจเป็นคำตอบของแบบจำลอง SJ. การอ้างอิงแบบสุ่มค่อนข้างเป็นสิ่งนี้โดย Barbour และ Chryssaphinou

ในทิศทางที่แตกต่างอย่างสิ้นเชิงเนื่องจากคุณระบุว่า ยังไม่มีข้อความ คือ 20 และค่อนข้างเล็กสามารถสร้างแบบจำลองกราฟิกของ XผมJแต่ฉันไม่ทราบว่าการตั้งค่าและข้อมูลของคุณทำให้เป็นไปได้หรือไม่ ในฐานะที่เป็นความคิดเห็น @chl มันจะมีประโยชน์ถ้าคุณอธิบายสิ่งที่Xผม,Jคือ

หากว่า Xผม,Jเป็นตัวแทนของการวัดตามลำดับเช่นเมื่อเวลาผ่านไปและการพึ่งพาเกี่ยวข้องกับสิ่งนี้ความเป็นไปได้ครั้งที่สาม - และเพื่อเพิ่มการประนีประนอมระหว่างคำแนะนำสองข้อด้านบน - คือการใช้โมเดลของมาร์คอฟที่ซ่อนอยู่ Xผม,J's


Xผม,Jคือผลลัพธ์แบบสุ่มของ Bernoulli ขออภัยในความไม่ถูกต้อง ดังนั้น,Xผมคือผลรวมของคะแนนสำหรับทีมกีฬาสำหรับช่วงเวลาที่เท่ากันตามลำดับเวลา ปรากฎว่าหลังจากทำประตูแรกแล้วความน่าจะเป็นของประตูถัดไปในช่วงเวลาจะแตกต่างกัน
Andrey
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.