การกระจายตัวของ cardinality ของการสุ่มตัวอย่างแบบอิสระโดยไม่มีการแทนที่คืออะไร?

$S$ เป็นชุดบางคนที่มี $n\in\mathbb{N}$ องค์ประกอบและได้รับการแก้ไขจำนวนเต็มบวกน้อยกว่าหรือเท่ากับn $a_1,a_2,...,a_m$ $n$

ที่มีองค์ประกอบของ $S$ เป็นอย่างเท่าเทียมกันมีแนวโน้ม $m$ ตัวอย่าง $L_1, L_2,...,L_m$ จะแยกกันและเป็นอิสระมาจาก $S$ โดยไม่ต้องเปลี่ยนขนาดของซึ่งเป็นตามลำดับ $a_1,a_2,...,a_m$

cardinality ตัดของกลุ่มตัวอย่าง $\left|L_1\cap L_2\cap\ ...\ \cap L_m\right|$ ได้โดยทั่วไปสนับสนุนเท่ากับ $\{0,1,...,\min\{a_1,a_2,...,a_m\}\}$ แต่กระจายไม่ได้ทำตาม?

combinatorics

— น้ำเย็น
แหล่งที่มา

ฉันสามารถให้สูตรการคำนวณแบบวนซ้ำ แต่ฉันไม่ทราบวิธีแก้ปัญหาแบบปิด จะพอเพียงนั้นหรือคุณต้องการการแสดงออกที่ชัดเจนของฟังก์ชั่นการจัดจำหน่ายที่ได้รับ

และ

a_{1}, \dots, a_{m}

$a_1, \dots, a_m$

n

$n$

— Bridgeburners

@Bridgeburners สูตรจะดีอย่างน้อยก็จะให้วิธีการ / วิธีการโจมตีปัญหานี้และที่เกี่ยวข้อง

— llrs

คำตอบ:

นี่คือวิธีการอีกวิธีหนึ่งที่ไม่เกี่ยวข้องกับการสอบถามซ้ำ มันยังคงใช้ผลรวมและผลิตภัณฑ์ที่มีความยาวขึ้นอยู่กับพารามิเตอร์ ก่อนอื่นฉันจะให้การแสดงออกจากนั้นอธิบาย

เรามี

\begin{aligned} P & (| L_{1} \cap L_{2} \cap \dots \cap L_{m} | = k) \\ = \frac{(\binom{n}{k})}{\prod_{i = 1}^{n} (\binom{n}{a_{i}})} \sum_{j = 0}^{min (a_{1}, \dots, a_{m}) - k} (- 1)^{j} (\binom{n - k}{j}) \prod_{l = 1}^{n} (\binom{n - j - k}{a_{l} - j - k}) . \end{aligned}

$\begin{align} P &\bigl( | L_{1} \cap L_{2} \cap \cdots \cap L_{m} | = k \bigr) \\ &= \frac{\binom{n}{k}}{\prod_{i = 1}^{n} \binom{n}{a_{i}}} \sum_{j = 0}^{\min(a_{1}, \ldots, a_{m}) - k} (-1)^{j} \binom{n - k}{j} \prod_{l = 1}^{n} \binom{n - j - k}{a_{l} -j - k}. \end{align}$

แก้ไข:ในตอนท้ายของการเขียนทั้งหมดนี้ฉันตระหนักว่าเราสามารถรวมการแสดงออกข้างต้นเล็กน้อยโดยการรวมค่าสัมประสิทธิ์ทวินามเป็นความน่าจะเป็น hypergeometric และสัมประสิทธิ์ trinomial สำหรับสิ่งที่คุ้มค่านิพจน์ที่แก้ไขคือ นี่เป็นตัวแปรสุ่ม hypergeometric โดยที่จับจะถูกพรากไปจากประชากรขนาดมีสถานะสำเร็จ

\sum_{j = 0}^{min (a_{1}, \dots, a_{m}) - k} (- 1)^{j} (\binom{n}{j, k, n - j - k}) \prod_{l = 1}^{n} P (Hyp (n, j + k, a_{l}) = j + k) .

$\begin{equation} \sum_{j = 0}^{\min(a_{1}, \ldots, a_{m}) - k} (-1)^{j} \binom{n}{j, k, n - j - k} \prod_{l = 1}^{n} P( \text{Hyp}(n, j + k, a_{l}) = j + k). \end{equation}$

Hyp (n, j + k, a_{l})

$\text{Hyp}(n, j + k, a_{l})$

a_{l}

$a_{l}$

n

$n$

j + k

$j + k$

รากศัพท์

มาดูสัญกรณ์กันก่อนเพื่อให้ข้อโต้แย้ง combinatorial ง่ายขึ้นในการติดตาม (หวังว่า) ตลอดเราจะพิจารณาและถาวร เราจะใช้เพื่อแสดงชุดคำสั่ง -tuplesโดยที่อันน่าพอใจ $S$ $a_{1}, \ldots, a_{m}$ $\mathcal{C}(I)$ $m$ $(L_{1}, \ldots, L_{m})$ $L_{i} \subseteq S$

$|L_{i}| = a_{i}$ ; และ
$L_{1} \cap \cdots \cap L_{m} = I$ ฉัน

นอกจากนี้เราจะใช้สำหรับคอลเล็กชันเหมือนกันยกเว้นว่าเราต้องการแทนความเท่าเทียมกัน $\mathcal{C}'(I)$ $L_{1} \cap \cdots \cap L_{m} \supseteq I$

การสังเกตที่สำคัญคือค่อนข้างง่ายที่จะนับ นี่เป็นเพราะเงื่อนไขเทียบเท่ากับสำหรับทั้งหมดดังนั้นในแง่นี้จะลบการโต้ตอบระหว่างค่าแตกต่างกัน สำหรับแต่ละจำนวนเป็นไปตามข้อกำหนดคือเนื่องจากเราสามารถสร้างโดยเลือกเซตย่อยของมีขนาดแล้ว unioning กับฉันมันติดตามว่า $\mathcal{C}'(I)$ $L_{1} \cap \cdots \cap L_{m} \supseteq I$ $L_{i} \supseteq I$ $i$ $i$ $i$ $L_{i}$ $\binom{|S| - |I|}{a_{i} - |I|}$ $L_{i}$ $S \setminus I$ $a_{i} - |I|$ $I$

| C^{'} (I) | = \prod_{i = 1}^{n} (\binom{| S | - | I |}{a_{i} - | I |}) .

$\begin{equation} | \mathcal{C}'(I) | = \prod_{i = 1}^{n} \binom{|S| - |I|}{a_{i} - |I|}. \end{equation}$

ตอนนี้ความน่าจะเป็นแบบดั้งเดิมของเราสามารถแสดงผ่านดังนี้: $\mathcal{C}$

P (| L_{1} \cap L_{2} \cap \dots \cap L_{m} | = k) = \frac{\sum_{I : | I | = k} | C (I) |}{\sum_{all I \subseteq S} | C (I) |} .

$\begin{equation} P \bigl( | L_{1} \cap L_{2} \cap \cdots \cap L_{m} | = k \bigr) = \frac{ \sum_{I : |I| = k} | \mathcal{C}(I) | } { \sum_{\text{all $I \subseteq S$}} | \mathcal{C}(I) | }. \end{equation}$

เราสามารถทำให้เรียบง่ายสองอันที่นี่ได้ทันที ก่อนอื่นตัวหารจะเหมือนกับ ประการที่สองอาร์กิวเมนต์การเปลี่ยนรูปแสดงว่าขึ้นอยู่กับว่าผ่านความสำคัญเท่านั้น. เนื่องจากมีส่วนย่อยของมี cardinalityดังนั้นจึงเป็นไปตามที่ โดยที่เป็นเซตย่อยที่กำหนดโดยพลการของมีภาวะเชิงการนับ

| C^{'} (\emptyset) | = \prod_{i = 1}^{n} (\binom{| S |}{a_{i}}) = \prod_{i = 1}^{n} (\binom{n}{a_{i}}) .

$\begin{equation} | \mathcal{C}'(\emptyset) | = \prod_{i = 1}^{n} \binom{|S|}{a_{i}} = \prod_{i = 1}^{n} \binom{n}{a_{i}}. \end{equation}$

| C (I) |

$| \mathcal{C}(I) |$

I

$I$

| I |

$|I|$

(\binom{n}{k})

$\binom{n}{k}$

S

$S$

k

$k$

\sum_{I : | I | = k} | C (I) | = (\binom{n}{k}) | C (I_{0}) |,

$\begin{equation} \sum_{I : |I| = k} | \mathcal{C}(I) | = \binom{n}{k} | \mathcal{C}(I_{0}) |, \end{equation}$

I_{0}

$I_{0}$

S

$S$

k

$k$ .

เมื่อย้อนกลับไปตอนนี้เราได้ลดปัญหาการแสดง

| C (I_{0}) | = \sum_{j = 0}^{min (a_{1}, \dots, a_{m}) - k} (- 1)^{j} (\binom{n - k}{j}) \prod_{l = 1}^{n} (\binom{n - j - k}{a_{l} - j - k}) .

$\begin{equation} | \mathcal{C}(I_{0}) | = \sum_{j = 0}^{\min(a_{1}, \ldots, a_{m}) - k} (-1)^{j} \binom{n - k}{j} \prod_{l = 1}^{n} \binom{n - j - k}{a_{l} - j - k}. \end{equation}$

ให้เป็นส่วนย่อยที่แตกต่างของที่เกิดขึ้นจากการเพิ่มว่าองค์ประกอบหนึ่งที่จะ{0} จากนั้น (นี่เป็นเพียงการบอกว่าถ้าดังนั้นมีแต่ยังไม่มีองค์ประกอบเพิ่มเติมใด ๆ ) ตอนนี้เราได้เปลี่ยนปัญหาการนับเป็นปัญหาการนับซึ่งเรารู้วิธีจัดการมากขึ้น โดยเฉพาะอย่างยิ่งเรามี $J_{1}, \ldots, J_{n - k}$ $S$ $I_{0}$

C (I_{0}) = C^{'} (I_{0}) ∖ (⋃_{i = 1}^{n - k} C^{'} (J_{i})) .

$\begin{equation} \mathcal{C}(I_{0}) = \mathcal{C}'(I_{0}) \setminus \biggl( \bigcup_{i = 1}^{n - k} \mathcal{C}'(J_{i}) \biggr). \end{equation}$

L_{1} \cap \dots \cap L_{m} = I_{0}

$L_{1} \cap \cdots \cap L_{m} = I_{0}$

L_{1} \cap \dots \cap L_{m}

$L_{1} \cap \cdots \cap L_{m}$

I_{0}

$I_{0}$

C

$\mathcal{C}$

C^{'}

$\mathcal{C}'$

| C (I_{0}) | = | C^{'} (I_{0}) | - | ⋃_{i = 1}^{n - k} C^{'} (J_{i}) | = \prod_{l = 1}^{n} (\binom{n - k}{a_{l} - k}) - | ⋃_{i = 1}^{n - k} C^{'} (J_{i}) | .

$\begin{equation} | \mathcal{C}(I_{0}) | = | \mathcal{C}'(I_{0}) | - \biggl| \bigcup_{i = 1}^{n - k} \mathcal{C}'(J_{i}) \biggr| = \prod_{l = 1}^{n} \binom{n - k}{a_{l} - k} - \biggl| \bigcup_{i = 1}^{n - k} \mathcal{C}'(J_{i}) \biggr|. \end{equation}$

เราสามารถใช้การยกเว้นแบบรวมเพื่อจัดการกับขนาดของการแสดงออกของสหภาพข้างต้น ที่สำคัญก็คือความสัมพันธ์ที่นี่สำหรับที่ว่างเปล่า , นี่เป็นเพราะถ้ามีจำนวนของแล้วมันก็จะมีการรวมกัน เรายังทราบด้วยว่าชุดมีขนาด. ดังนั้น $\mathcal{I} \subseteq \{ 1, \ldots, n - k \}$

⋂_{i \in I} C^{'} (J_{i}) = C^{'} (⋃_{i \in I} J_{i}) .

$\begin{equation} \bigcap_{i \in \mathcal{I}} \mathcal{C}'(J_{i}) = \mathcal{C}' \biggl( \bigcup_{i \in \mathcal{I}} J_{i} \biggr). \end{equation}$

L_{1} \cap \dots \cap L_{m}

$L_{1} \cap \cdots \cap L_{m}$

J_{i}

$J_{i}$

⋃_{i \in I} J_{i}

$\bigcup_{i \in \mathcal{I}} J_{i}$

| I_{0} | + | I | = k + | I |

$|I_{0}| + |\mathcal{I}| = k + |\mathcal{I}|$

\begin{aligned} | ⋃_{i = 1}^{n - k} C^{'} (J_{i}) | & = \sum_{\emptyset \neq I \subseteq {1, \dots, n - k}} (- 1)^{| I | - 1} | ⋂_{i \in I} C^{'} (J_{i}) | \\ = \sum_{j = 1}^{n - k} \sum_{I : | I | = j} (- 1)^{j - 1} \prod_{l = 1}^{n} (\binom{n - j - k}{a_{l} - j - k}) \\ = \sum_{j = 1}^{n - k} (- 1)^{j - 1} (\binom{n - k}{j}) \prod_{l = 1}^{n} (\binom{n - j - k}{a_{l} - j - k}) . \end{aligned}

$\begin{align} \biggl| \bigcup_{i = 1}^{n - k} \mathcal{C}'(J_{i}) \biggr| &= \sum_{\emptyset \neq \mathcal{I} \subseteq \{ 1, \ldots, n - k \}} (-1)^{| \mathcal{I} | - 1} \biggl| \bigcap_{i \in \mathcal{I}} \mathcal{C}'(J_{i}) \biggr| \\ &= \sum_{j = 1}^{n - k} \sum_{\mathcal{I} : |\mathcal{I}| = j} (-1)^{j - 1} \prod_{l = 1}^{n} \binom{n - j - k}{a_{l} - j - k} \\ &= \sum_{j = 1}^{n - k} (-1)^{j - 1} \binom{n - k}{j} \prod_{l = 1}^{n} \binom{n - j - k}{a_{l} - j - k}. \end{align}$ (เราสามารถ จำกัดค่าที่นี่เนื่องจากผลิตภัณฑ์ของสัมประสิทธิ์ทวินามเป็นศูนย์เว้นแต่สำหรับทั้งหมดคือ .)

j

$j$

j \leq a_{l} - k

$j \leq a_{l} - k$

l

$l$

j \leq min (a_{1}, \dots, a_{m}) - k

$j \leq \min(a_{1}, \ldots, a_{m}) - k$

ในที่สุดโดยการแทนที่การแสดงออกในตอนท้ายลงในสมการสำหรับด้านบนและรวบรวมผลรวมเราได้รับ ตามที่อ้างสิทธิ์ $| \mathcal{C}(I_{0}) |$

| C (I_{0}) | = \sum_{j = 0}^{min (a_{1}, \dots, a_{m}) - k} (- 1)^{j} (\binom{n - k}{j}) \prod_{l = 1}^{n} (\binom{n - j - k}{a_{l} - j - k})

$\begin{equation} | \mathcal{C}(I_{0}) | = \sum_{j = 0}^{\min(a_{1}, \ldots, a_{m}) - k} (-1)^{j} \binom{n - k}{j} \prod_{l = 1}^{n} \binom{n - j - k}{a_{l} - j - k} \end{equation}$

— เจสัน
แหล่งที่มา

+1 สำหรับความพยายามและวิธีแก้ปัญหาทั้งหมด แต่ฉันจะต้องขัดคณิตศาสตร์ของฉันให้เข้าใจส่วนใหญ่ (และคำตอบอื่น ๆ ) ขอบคุณ

— llrs

ฉันไม่ทราบวิธีการวิเคราะห์เพื่อแก้ปัญหานี้ แต่นี่เป็นวิธีแบบเรียกซ้ำเพื่อคำนวณผลลัพธ์

สำหรับคุณกำลังเลือกองค์ประกอบจากได้ถูกเลือกมาก่อน ความน่าจะเป็นในการเลือกองค์ประกอบที่ตัดกันด้วยในการจับรางวัลครั้งที่สองของคุณนั้นมาจากการแจกแจง : $m=2$ $a_2$ $n,$ $a_1$ $k \le \min\{a_1,a_2\}$ $L_1$

P (k ∣ n, a_{1}, a_{2}) = \frac{(\binom{a_{1}}{k}) (\binom{n - a_{1}}{a_{2} - k})}{(\binom{n}{a_{2}})} .

$P(k \mid n, a_1, a_2) = \frac{ {a_1 \choose k} {n - a_1 \choose a_2 - k} } {n \choose a_2}.$

เราสามารถเรียกผลลัพธ์เราสามารถใช้ตรรกะเดียวกันเพื่อค้นหาที่คือความสำคัญของการตัดกันของสามตัวอย่าง จากนั้น $b_2.$ $P(b_3 = k \mid n, b_2, a_3),$ $b_3$

P (b_{3} = k) = \sum_{l = 0}^{min (a_{1}, a_{2})} P (b_{3} = k ∣ n, b_{2} = l, a_{3}) P (b_{2} = l ∣ n, a_{1}, a_{2}) .

$P(b_3=k) = \sum_{l=0}^{\min(a_1,a_2)} P(b_3=k \mid n, b_2=l, a_3) P(b_2 =l \mid n, a_1, a_2).$

ค้นหานี้สำหรับแต่ละ\} การคำนวณหลังไม่ยากเชิงตัวเลขเนื่องจากเป็นเพียงผลลัพธ์ของการคำนวณก่อนหน้าและเป็นการเรียก การกระจายตัวแบบ $k \in \{0, 1, 2, \dots, \min(a_1,a_2,a_3)\}$ $P(b_2 = l \mid n, a_1, a_2)$ $P(b_3 = k \mid n, b_2=l, a_3)$

โดยทั่วไปหากต้องการค้นหาคุณสามารถใช้สูตรเรียกซ้ำต่อไปนี้: สำหรับและ ซึ่งกล่าวได้ว่า $P(b_m)$

P (b_{i} = k) = \sum_{l = 0}^{min (a_{1}, a_{2}, \dots, a_{i - 1})} P (b_{i} = k ∣ n, b_{i - 1} = l, a_{i}) P (b_{i - 1} = l),

$P(b_i=k) = \sum_{l=0}^{\min(a_1, a_2, \dots, a_{i-1})} P(b_i = k \mid n, b_{i-1}=l, a_i) P(b_{i-1}=l),$

P (b_{i} = k ∣ n, b_{i - 1} = l, a_{i}) = \frac{(\binom{l}{k}) (\binom{n - l}{a_{i} - k})}{(\binom{n}{a_{i}})},

$P(b_i = k \mid n, b_{i-1}=l, a_i) = \frac{{l \choose k} {n-l \choose a_i - k}} {n \choose a_i},$

i \in {2, 3, \dots, m},

$i \in \{2, 3, \dots, m\},$

P (b_{1}) = δ_{a_{1} b_{1}},

$P(b_1) = \delta_{a_1 b_1},$

b_{1} = a_{1} .

$b_1 = a_1.$

นี่คือใน R:

hypergeom <- function(k, n, K, N) choose(K, k) * choose(N-K, n-k) / choose(N, n)

#recursive function for getting P(b_i) given P(b_{i-1})
PNext <- function(n, PPrev, ai, upperBound) {
  l <- seq(0, upperBound, by=1)
  newUpperBound <- min(ai, upperBound)
  kVals <- seq(0, newUpperBound, by=1)
  PConditional <- lapply(kVals, function(k) {
    hypergeom(k, ai, l, n)
  })
  PMarginal <- unlist(lapply(PConditional, function(p) sum(p * PPrev) ))
  PMarginal
}

#loop for solving P(b_m)
P <- function(n, A, m) {
  P1 <- c(rep(0, A[1]), 1)
  if (m==1) {
    return(P1)
  } else {
    upperBound <- A[1]
    P <- P1
    for (i in 2:m) {
      P <- PNext(n, P, A[i], upperBound)
      upperBound <- min(A[i], upperBound)
    }
    return(P)
  }
}

#Example
n <- 10
m <- 5
A <- sample(4:8, m, replace=TRUE)
#[1] 6 8 8 8 5

round(P(n, A, m), 4)
#[1] 0.1106 0.3865 0.3716 0.1191 0.0119 0.0003
#These are the probabilities ordered from 0 to 5, which is the minimum of A

— Bridgeburners
แหล่งที่มา

ขอบคุณสำหรับวิธีการแก้ปัญหาของคุณและรหัสของคุณ ฉันรอคำตอบอื่น ๆ (ถ้ามี) ก่อนที่จะตัดสินรางวัล

— llrs