ความสำเร็จของการทดลองใน Bernoulli ด้วยความน่าจะเป็นที่แตกต่างกัน

11

หากมีการทดลอง Bernoulli อิสระ 20 ครั้งโดยแต่ละคนมีความน่าจะเป็นที่จะประสบความสำเร็จแตกต่างกันและล้มเหลว ความน่าจะเป็นที่การทดลองใช้ n จาก 20 ครั้งนั้นประสบความสำเร็จอย่างไร

มีวิธีที่ดีกว่าในการคำนวณความน่าจะเป็นเหล่านี้แทนที่จะรวมเข้าด้วยกันเป็นการรวมกันของความสำเร็จและความล้มเหลวที่เป็นไปได้หรือไม่?

— Maha123
แหล่งที่มา

12

การกระจายที่คุณถามเกี่ยวกับการกระจายตัวที่เรียกว่าPoisson Binomialซึ่งมี PMF ค่อนข้างซับซ้อน (ดู Wikipedia สำหรับคำอธิบายที่กว้างขึ้น)

ราคา (X = x) = \underset{A \in F_{x}}{Σ} \underset{ผม \in A}{Π} {พี}_{ผม} \underset{J \in A^{ค}}{Π} (1 - {พี}_{J})

$\Pr(X=x) = \sum\limits_{A\in F_x} \prod\limits_{i\in A} p_i \prod\limits_{j\in A^c} (1-p_j)$

โดยทั่วไปปัญหาคือคุณไม่สามารถใช้สมการนี้สำหรับการทดลองจำนวนมากขึ้น (โดยทั่วไปเมื่อจำนวนการทดลองเกิน ) นอกจากนี้ยังมีวิธีอื่นในการคำนวณ pmf เช่นสูตรแบบเรียกซ้ำ แต่มันไม่เสถียรเชิงตัวเลข วิธีที่ง่ายที่สุดในการแก้ไขปัญหาเหล่านั้นคือวิธีการประมาณ (เช่นอธิบายโดยHong, 2013 ) ถ้าเรากำหนด $n=30$

μ = Σ_{ผม = 1}^{n} {พี}_{ผม}

$\mu = \sum_{i=1}^n p_i$

σ = \sqrt{Σ_{ผม = 1}^{n} {พี}_{ผม} (1 - {พี}_{ผม})}

$\sigma = \sqrt{ \sum_{i=1}^n p_i(1-p_i) }$

γ = σ^{- 3} Σ_{ผม = 1}^{n} {พี}_{ผม} (1 - {พี}_{ผม}) (1 - 2 {พี}_{ผม})

$\gamma = \sigma^{-3} \sum_{i=1}^n p_i (1 - p_i) (1 - 2p_i)$

จากนั้นเราสามารถประมาณ pmf ด้วยการแจกแจงปัวซองผ่านกฏหมายจำนวนน้อยหรือทฤษฎีบทเลอแคม

ราคา (X = x) \approx \frac{μ^{x} ประสบการณ์ (- μ)}{x!}

$\Pr(X = x) \approx \frac{\mu^x \exp(-\mu)}{x!}$

แต่จะเห็นได้ว่าการประมาณแบบทวินามโดยทั่วไปจะทำงานได้ดีกว่า ( Choi และ Xia, 2002 )

ราคา (X = x) \approx B ผม n โอ ม. (n, \frac{μ}{n})

$\Pr(X = x) \approx \mathrm{Binom} \left( n, \frac{\mu}{n} \right)$

คุณสามารถใช้การประมาณปกติ

ฉ (x) \approx φ (\frac{x + 0.5 - μ}{σ})

$f(x) \approx \phi \left( \frac{x + 0.5 - \mu}{ \sigma} \right)$

หรือ cdf สามารถประมาณค่าได้โดยใช้สิ่งที่เรียกว่าการประมาณปกติแบบละเอียด (Volkova, 1996)

F (x) \approx สูงสุด (0, ก. (\frac{x + 0.5 - μ}{σ}))

$F(x) \approx \max\left(0, \ g \left( \frac{x + 0.5 - \mu}{ \sigma} \right) \right)$

ที่{6} $g(x) = \Phi(x) + \gamma(1-x^2) \frac{\phi(x)}{6}$

อีกทางเลือกหนึ่งคือการจำลองสถานการณ์ของ Monte Carlo

dpbinomฟังก์ชั่น R ง่ายจะเป็น

dpbinom <- function(x, prob, log = FALSE,
                    method = c("MC", "PA", "NA", "BA"),
                    nsim = 1e4) {

  stopifnot(all(prob >= 0 & prob <= 1))
  method <- match.arg(method)

  if (method == "PA") {
    # poisson
    dpois(x, sum(prob), log)
  } else if (method == "NA") {
    # normal
    dnorm(x, sum(prob), sqrt(sum(prob*(1-prob))), log)
  } else if (method == "BA") {
    # binomial
    dbinom(x, length(prob), mean(prob), log)
  } else {
    # monte carlo
    tmp <- table(colSums(replicate(nsim, rbinom(length(prob), 1, prob))))
    tmp <- tmp/sum(tmp)
    p <- as.numeric(tmp[as.character(x)])
    p[is.na(p)] <- 0

    if (log) log(p)
    else p 
  }
}

วิธีการส่วนใหญ่ (และอื่น ๆ ) ถูกนำไปใช้ในแพ็คเกจR poibin

เฉิน, LHY (1974) ในการบรรจบกันของปัวซองทวินามกับการแจกแจงปัวซง พงศาวดารแห่งความน่าจะเป็น, 2 (1), 178-180

เฉิน, SX และ Liu, JS (1997) การประยุกต์ทางสถิติของการแจกแจงแบบปัวซอง - ทวินามและการแจกแจงแบบมีเงื่อนไข Statistica Sinica 7, 875-892

เฉิน, SX (1993) ปัวซอง - ทวินามการแจกแจงแบบมีเงื่อนไขเบอร์นูลลีและเอนโทรปีสูงสุด รายงานทางเทคนิค. ภาควิชาสถิติมหาวิทยาลัยฮาร์วาร์ด

เฉิน, XH, Dempster, AP และ Liu, JS (1994) การสุ่มตัวอย่างประชากรแบบ จำกัด จำนวนถ่วงน้ำหนักเพื่อเพิ่มความเอนโทรปี Biometrika 81, 457-469

วัง, YH (1993) ในจำนวนของความสำเร็จในการทดลองอิสระ Statistica Sinica 3 (2): 295-312

Hong, Y. (2013) ในการคำนวณฟังก์ชั่นการกระจายสำหรับการแจกแจงแบบทวินาม สถิติการคำนวณและการวิเคราะห์ข้อมูล, 59, 41-51

Volkova, AY (1996) การปรับแต่งของทฤษฎีขีด จำกัด กลางสำหรับผลรวมของตัวชี้วัดแบบสุ่มอิสระ ทฤษฎีความน่าจะเป็นและการประยุกต์ 40, 791-794

Choi, KP และ Xia, A. (2002) ประมาณจำนวนความสำเร็จในการทดลองอิสระ: ทวินามกับปัวซอง พงศาวดารของความน่าจะเป็นประยุกต์, 14 (4), 1139-1148

Le Cam, L. (1960) ทฤษฎีบทการประมาณสำหรับการแจกแจงแบบสองมิติของปัวซอง วารสารคณิตศาสตร์แปซิฟิก 10 (4), 1181–1197

— ทิม
แหล่งที่มา

0

วิธีหนึ่งคือการใช้ฟังก์ชั่นการสร้าง วิธีแก้ปัญหาของคุณคือสัมประสิทธิ์ในพหุนาม $x^n$

Π_{ผม = 1}^{20} ({พี}_{ผม} x + 1 - {พี}_{ผม}) .

$\prod_{i=1}^{20}(p_ix + 1-p_i).$

นี่คือการเขียนโปรแกรมแบบไดนามิกเทียบเท่า (เวลากำลังสองในจำนวนตัวแปร Bernoulli) ของการทำผลรวมในการกระจาย Poisson Binomial จากคำตอบของทิม (ซึ่งจะเป็นเวลาชี้แจง)

— นีลจี
แหล่งที่มา