คำถามติดแท็ก bernoulli-distribution

การแจกแจงแบบเบอร์นูลลีเป็นการแจกแจงแบบไม่ต่อเนื่องที่เกิดจากความน่าจะเป็น "สำเร็จ" เพียงครั้งเดียว เป็นกรณีพิเศษของการแจกแจงแบบทวินาม

2
ช่วงความเชื่อมั่นสำหรับการสุ่มตัวอย่าง Bernoulli
ฉันมีตัวอย่างแบบสุ่มของตัวแปรสุ่มของ Bernoulliโดยที่คือ iidrv และและเป็นพารามิเตอร์ที่ไม่รู้จักX1...XNX1...XNX_1 ... X_NXiXiX_iP(Xi=1)=pP(Xi=1)=pP(X_i = 1) = pppp เห็นได้ชัดว่าหนึ่งสามารถหาประมาณการสำหรับ : Npppp^:=(X1+⋯+XN)/Np^:=(X1+⋯+XN)/N\hat{p}:=(X_1+\dots+X_N)/N คำถามของฉันคือฉันจะสร้างช่วงความมั่นใจสำหรับอย่างไรppp

6
ทดสอบว่าการแจกแจงทวินามสองรายการนั้นแตกต่างกันหรือไม่
ฉันมีข้อมูลสามกลุ่มแต่ละกลุ่มมีการแจกแจงทวินาม (เช่นแต่ละกลุ่มมีองค์ประกอบที่ประสบความสำเร็จหรือล้มเหลว) ฉันไม่มีความน่าจะเป็นที่คาดการณ์ไว้ของความสำเร็จ แต่สามารถพึ่งพาอัตราความสำเร็จของแต่ละคนเป็นเพียงการประมาณอัตราความสำเร็จที่แท้จริง ฉันเพิ่งพบคำถามนี้ซึ่งใกล้ แต่ดูเหมือนจะไม่จัดการกับสถานการณ์นี้ เพื่อให้การทดสอบง่ายขึ้นสมมติว่าฉันมี 2 กลุ่ม (3 สามารถขยายได้จากกรณีพื้นฐานนี้) การทดลองกลุ่ม 1: = 2455n1n1n_1 การทดลองกลุ่ม 2: = 2730n2n2n_2 ความสำเร็จของกลุ่ม 1: = 1556k1k1k_1 ความสำเร็จของกลุ่ม 2: = 1671k2k2k_2 ฉันไม่ได้มีโอกาสประสบความสำเร็จที่คาดหวังเพียงสิ่งที่ฉันรู้จากตัวอย่าง ดังนั้นอัตราความสำเร็จโดยนัยของฉันสำหรับทั้งสองกลุ่มคือ: อัตราความสำเร็จของกลุ่ม 1: = 1556/2455 = 63.4%พี1พี1p_1 อัตราความสำเร็จของกลุ่ม 2: = 1671/2730 = 61.2%พี2พี2p_2 อัตราความสำเร็จของตัวอย่างแต่ละตัวอย่างค่อนข้างใกล้เคียง อย่างไรก็ตามขนาดตัวอย่างของฉันก็ค่อนข้างใหญ่เช่นกัน ถ้าฉันตรวจสอบ CDF ของการแจกแจงทวินามเพื่อดูว่ามันแตกต่างจากครั้งแรก (โดยที่ฉันสมมติว่าอันแรกคือการทดสอบว่าง) ฉันได้รับความน่าจะเป็นที่น้อยมากที่สามารถทำได้ครั้งที่สอง ใน Excel: …

2
การถดถอยโลจิสติก: Bernoulli กับตัวแปรตอบสนองแบบทวินาม
ฉันต้องการทำการถดถอยโลจิสติกด้วยการตอบสนองทวินามต่อไปนี้และด้วยX1X1X_1และX2X2X_2เป็นตัวทำนายของฉัน ฉันสามารถนำเสนอข้อมูลเดียวกับการตอบสนองของ Bernoulli ในรูปแบบต่อไปนี้ ผลลัพธ์การถดถอยโลจิสติกสำหรับชุดข้อมูล 2 ชุดนี้ส่วนใหญ่จะเหมือนกัน ส่วนเบี่ยงเบนความเบี่ยงเบนและ AIC นั้นแตกต่างกัน (ความแตกต่างระหว่างการเบี่ยงเบนแบบ null และการเบี่ยงเบนที่เหลืออยู่เหมือนกันในทั้งสองกรณี - 0.228) ต่อไปนี้คือผลลัพธ์การถดถอยจาก R ชุดข้อมูลเรียกว่า binom.data และ bern.data นี่คือเอาต์พุตทวินาม Call: glm(formula = cbind(Successes, Trials - Successes) ~ X1 + X2, family = binomial, data = binom.data) Deviance Residuals: [1] 0 0 0 Coefficients: Estimate Std. Error z …

4
การถดถอยโลจิสติก - ข้อผิดพลาดและการกระจาย
ว่ามีข้อผิดพลาดเกิดขึ้นในการถดถอยโลจิสติกส์ (และการกระจายที่สันนิษฐาน) ฉันได้อ่านในสถานที่ต่าง ๆ ที่: ไม่มีข้อผิดพลาดอยู่ คำผิดพลาดมีการแจกแจงแบบทวินาม (ตามการกระจายของตัวแปรตอบสนอง) คำผิดพลาดมีการกระจายโลจิสติก มีคนช่วยอธิบายได้ไหม?

3
K ประสบความสำเร็จในการทดลอง Bernoulli หรือการทดลองภาพยนตร์ของ George Lucas
ฉันกำลังอ่าน "The Drunkard's Walk" ตอนนี้และไม่สามารถเข้าใจเรื่องใดเรื่องหนึ่งได้ นี่มันไป: ลองนึกภาพว่า George Lucas สร้างภาพยนตร์ Star Wars ใหม่และในตลาดการทดสอบเดียวตัดสินใจทำการทดลองที่บ้า เขาเผยแพร่ภาพยนตร์เรื่องเดียวกันภายใต้สองชื่อ: "Star Wars: Episode A" และ "Star Wars: Episode B" ภาพยนตร์แต่ละเรื่องมีแคมเปญการตลาดและตารางการจัดจำหน่ายของตัวเองโดยมีรายละเอียดที่เหมือนกันยกเว้นตัวอย่างภาพยนตร์และโฆษณาสำหรับภาพยนตร์เรื่องหนึ่งที่พูดว่า "Episode A" และภาพยนตร์อื่น ๆ "Episode B" ตอนนี้เราทำการประกวดออกมา ภาพยนตร์เรื่องใดที่จะได้รับความนิยมมากขึ้น สมมติว่าเราดูผู้ชมภาพยนตร์ 20,000 คนแรกและบันทึกภาพยนตร์ที่พวกเขาเลือกที่จะดู (ไม่สนใจแฟน ๆ ที่กำลังจะตายทั้งคู่และยืนยันว่ามีความแตกต่างที่ลึกซึ้ง แต่มีความหมายระหว่างทั้งสอง) เนื่องจากภาพยนตร์และแคมเปญการตลาดของพวกเขาเหมือนกันเราสามารถสร้างแบบจำลองทางคณิตศาสตร์ด้วยวิธีนี้: ลองนึกภาพผู้ชมทั้งหมดในแถวและพลิกเหรียญสำหรับผู้ชมแต่ละคน ถ้าเหรียญก้มลงหัวเขาหรือเธอเห็นตอนที่ A; หากเหรียญก้อยจบลงก็เป็นตอนที่ B. เนื่องจากเหรียญมีโอกาสเท่ากันที่จะเกิดขึ้นไม่ว่าด้วยวิธีใดคุณอาจคิดว่าในสงครามบ็อกซ์ออฟฟิศทดลองนี้ภาพยนตร์แต่ละเรื่องควรเป็นผู้นำในครึ่งเวลา แต่คณิตศาสตร์ของการสุ่มบอกว่าเป็นอย่างอื่น: จำนวนการเปลี่ยนแปลงที่น่าจะเป็นไปได้มากที่สุดในการเป็นผู้นำคือ 0 และมันน่าจะเป็น …

2
วิธีการหาค่าฟังก์ชันความน่าจะเป็นสำหรับการแจกแจงแบบทวินามสำหรับการประมาณค่าพารามิเตอร์
ตามที่มิลเลอร์และ Freund ของความน่าจะเป็นและสถิติสำหรับวิศวกร 8ED (pp.217-218) ฟังก์ชั่นความเป็นไปได้ที่จะขยายใหญ่สุดสำหรับการกระจายทวินาม (Bernoulli ทดลอง) จะได้รับเป็น L ( p ) = ∏ni = 1พีxผม( 1 - p )1 - xผมL(พี)=Πผม=1nพีxผม(1-พี)1-xผมL(p) = \prod_{i=1}^np^{x_i}(1-p)^{1-x_i} จะมาถึงสมการนี้ได้อย่างไร ดูเหมือนว่าฉันจะค่อนข้างชัดเจนเกี่ยวกับดิสทริบิวชันอื่น ๆ ปัวซองและเกาส์; L ( θ ) = ∏ni = 1PDF หรือ PMF ของ distL(θ)=Πผม=1nPDF หรือ PMF ของ distL(\theta) = \prod_{i=1}^n \text{PDF or PMF …

1
การสร้างตัวแปรสุ่มที่มีความสัมพันธ์แบบทวินาม
ฉันสงสัยว่ามันอาจจะเป็นไปได้ที่จะสร้างตัวแปรทวินามแบบสหสัมพันธ์โดยใช้วิธีการแปลงเชิงเส้นหรือไม่? ด้านล่างฉันลองทำอะไรง่ายๆใน R แล้วมันสร้างความสัมพันธ์กันบ้าง แต่ฉันสงสัยว่ามีวิธีการทำเช่นนี้หรือไม่ X1 = rbinom(1e4, 6, .5) ; X2 = rbinom(1e4, 6, .5) ; X3 = rbinom(1e4, 6, .5) ; a = .5 Y1 = X1 + (a*X2) ; Y2 = X2 + (a*X3) ## Y1 and Y2 are supposed to be correlated cor(Y1, Y2)

3
จำนวนที่คาดว่าจะโยนจนกว่าจะถึงหัวครั้งแรกขึ้นมา
สมมติว่าเหรียญยุติธรรมถูกโยนซ้ำ ๆ จนกว่าจะได้รับหัวเป็นครั้งแรก จำนวนของการโยนที่คาดว่าจะต้องมีเท่าไหร่? จำนวนหางที่คาดหวังที่จะได้รับก่อนที่จะได้รับหัวแรกคืออะไร?

2
การกระจายตัวตัวอย่างจากประชากร Bernoulli สองคนที่เป็นอิสระ
สมมติว่าเรามีตัวอย่างของทั้งสองตัวแปรสุ่มอิสระ Bernoulli, Ber(θ1)Ber(θ1)\mathrm{Ber}(\theta_1)และBer(θ2)Ber(θ2)\mathrm{Ber}(\theta_2) ) เราจะพิสูจน์ได้อย่างไร(X¯1−X¯2)−(θ1−θ2)θ1(1−θ1)n1+θ2(1−θ2)n2−−−−−−−−−−−−−−√→dN(0,1)(X¯1−X¯2)−(θ1−θ2)θ1(1−θ1)n1+θ2(1−θ2)n2→dN(0,1)\frac{(\bar X_1-\bar X_2)-(\theta_1-\theta_2)}{\sqrt{\frac{\theta_1(1-\theta_1)}{n_1}+\frac{\theta_2(1-\theta_2)}{n_2}}}\xrightarrow{d} \mathcal N(0,1)? สมมติว่าn1≠n2n1≠n2n_1\neq n_2 2

3
การประมาณความน่าจะเป็นในกระบวนการของ Bernoulli โดยการสุ่มตัวอย่างจนถึง 10 ความล้มเหลว: มันมีอคติหรือไม่
สมมติว่าเรามีกระบวนการ Bernoulli ที่มีความน่าจะเป็นล้มเหลวqqq (ซึ่งจะเล็กพูด ) จากที่เราสุ่มตัวอย่างจนกว่าเราจะพบความล้มเหลวดังนั้นเราจึงประเมินความน่าจะเป็นของความล้มเหลวเนื่องจากโดยที่คือจำนวนตัวอย่างq≤0.01q≤0.01q \leq 0.01101010q^:=10/Nq^:=10/N\hat{q}:=10/NNNN คำถาม : อะไรคือประมาณการลำเอียงของ ? และถ้าเป็นเช่นนั้นมีวิธีแก้ไขหรือไม่?q^q^\hat{q}qqq ฉันกังวลว่าการยืนยันตัวอย่างสุดท้ายคือความเอนเอียงที่ล้มเหลวในการประมาณการ

2
การทดลอง Bernoulli ที่สัมพันธ์กันการกระจายแบบหลายตัวแปรของ Bernoulli?
ฉันลดความซับซ้อนของคำถามการวิจัยที่ฉันมีในที่ทำงาน ลองนึกภาพว่าฉันมี 5 เหรียญและขอเรียกให้ประสบความสำเร็จ เหล่านี้เป็นเหรียญที่มีอคติมากโดยมีโอกาสประสบความสำเร็จ p = 0.1 ตอนนี้ถ้าเหรียญเป็นอิสระแล้วได้รับความน่าจะเป็นของอย่างน้อย 1 หัวหรือมากกว่าง่ายมาก 5 ในสถานการณ์สมมติของฉันการทดลอง Bernoulli ของฉัน (การโยนเหรียญ) ไม่เป็นอิสระ ข้อมูลเดียวที่ฉันสามารถเข้าถึงได้คือความน่าจะเป็นของความสำเร็จ (แต่ละอันคือ p = .1) และความสัมพันธ์เชิงทฤษฎีของเพียร์สันในหมู่ตัวแปรไบนารี1−(1−1/10)51−(1−1/10)51-(1-1/10)^5 มีวิธีการคำนวณความน่าจะเป็นของความสำเร็จหนึ่งครั้งหรือมากกว่านั้นกับข้อมูลนี้หรือไม่? ฉันกำลังพยายามหลีกเลี่ยงวิธีการจำลองสถานการณ์เนื่องจากผลลัพธ์ทางทฤษฎีเหล่านี้จะถูกใช้เพื่อเป็นแนวทางในความแม่นยำของการศึกษาแบบจำลอง ฉันได้รับการพิจารณาในการกระจายตัวของ Bernoulli หลายตัวแปร แต่ฉันไม่คิดว่าฉันสามารถระบุได้อย่างเต็มที่กับความสัมพันธ์และโอกาสที่จะประสบความสำเร็จเพียงเล็กน้อยเท่านั้น เพื่อนคนหนึ่งของฉันแนะนำให้สร้างแบบเกาส์เกาส์ด้วยเบอเนลลีขอบ (ใช้แพ็คเกจ R copula) จากนั้นใช้pMvdc()ฟังก์ชั่นบนตัวอย่างขนาดใหญ่เพื่อให้ได้ความน่าจะเป็นที่ฉันต้องการ แต่ฉันไม่แน่ใจว่าจะทำอย่างไรกับมัน

2
ความสัมพันธ์ระหว่างค่า ph, Matthews และ Pearson สัมประสิทธิ์สหสัมพันธ์
ค่าสัมประสิทธิ์สหสัมพันธ์ของพีและแมทธิวเป็นแนวคิดเดียวกันหรือไม่? พวกมันเกี่ยวข้องกันอย่างไรหรือเทียบเท่ากับสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันสำหรับตัวแปรไบนารีสองตัว? ฉันคิดว่าค่าไบนารีเป็น 0 และ 1 ความสัมพันธ์ของเพียร์สันระหว่างตัวแปรสุ่มสองเบอร์นูลลี่และคือ:yxxxyyy ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]−−−−−−−−−−√=E[xy]−E[x]E[y]Var[x]Var[y]−−−−−−−−−−√=n11n−n1∙n∙1n0∙n1∙n∙0n∙1−−−−−−−−−−√ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]=E[xy]−E[x]E[y]Var[x]Var[y]=n11n−n1∙n∙1n0∙n1∙n∙0n∙1 \rho = \frac{\mathbb{E} [(x - \mathbb{E}[x])(y - \mathbb{E}[y])]} {\sqrt{\text{Var}[x] \, \text{Var}[y]}} = \frac{\mathbb{E} [xy] - \mathbb{E}[x] \, \mathbb{E}[y]}{\sqrt{\text{Var}[x] \, \text{Var}[y]}} = \frac{n_{1 1} n - n_{1\bullet} n_{\bullet 1}}{\sqrt{n_{0\bullet}n_{1\bullet} n_{\bullet 0}n_{\bullet 1}}} ที่ไหน E[x]=n1∙nVar[x]=n0∙n1∙n2E[y]=n∙1nVar[y]=n∙0n∙1n2E[xy]=n11nE[x]=n1∙nVar[x]=n0∙n1∙n2E[y]=n∙1nVar[y]=n∙0n∙1n2E[xy]=n11n \mathbb{E}[x] = \frac{n_{1\bullet}}{n} \quad \text{Var}[x] = \frac{n_{0\bullet}n_{1\bullet}}{n^2} \quad \mathbb{E}[y] …

2
ทางเลือกการกระจายเชิงประจักษ์
เงินรางวัล: เงินรางวัลเต็มจำนวนจะมอบให้กับผู้ที่ให้การอ้างอิงถึงเอกสารเผยแพร่ใด ๆ ที่ใช้หรือกล่าวถึงตัวประมาณF~F~\tilde{F}ด้านล่าง แรงจูงใจ: ส่วนนี้อาจไม่สำคัญสำหรับคุณและฉันสงสัยว่ามันจะไม่ช่วยให้คุณได้รับรางวัล แต่เนื่องจากมีคนถามเกี่ยวกับแรงจูงใจนี่คือสิ่งที่ฉันกำลังทำอยู่ ฉันกำลังทำงานกับปัญหาทฤษฎีกราฟเชิงสถิติ มาตรฐานวัตถุหนาแน่นกราฟ จำกัดW:[0,1]2→[0,1]W:[0,1]2→[0,1]W : [0,1]^2 \to [0,1]เป็นฟังก์ชันสมมาตรในแง่ที่ว่าW(u,v)=W(v,u)W(u,v)=W(v,u)W(u,v) = W(v,u) ) การสุ่มตัวอย่างกราฟบนnnnจุดยอดสามารถคิดได้ว่าเป็นการสุ่มตัวอย่างnnnค่าเครื่องแบบในช่วงหน่วย ( UiUiU_iสำหรับi=1,…,ni=1,…,ni = 1, \dots, n) แล้วน่าจะเป็นของขอบนั้น(i,j)(i,j)(i,j)เป็นW(Ui,Uj)W(Ui,Uj)W(U_i, U_j) ) ให้ถ้อยคำเมทริกซ์ที่เกิดจะเรียกว่าAAA WWW∬ W > 0 f A f f f ∑ A Wf=W/∬Wf=W/∬Wf = W / \iint W∬W>0∬W>0\iint W > 0fffAAAfffffffff∑A∑A\sum AWWW แต่น่าเสียดายที่วิธีการที่ผมพบว่าการแสดงความสอดคล้องเมื่อเราได้ลิ้มลองจากการจัดจำหน่ายที่มีความหนาแน่นฉวิธีสร้างนั้นต้องการให้ฉันสุ่มตารางคะแนน …

3
ขนาดตัวอย่างที่จำเป็นในการประมาณความน่าจะเป็นของ“ ความสำเร็จ” ในการทดลองใช้ Bernoulli
สมมติว่าเกมเสนอเหตุการณ์ที่เมื่อดำเนินการเสร็จแล้วอาจให้รางวัลหรือไม่ทำอะไรเลย กลไกที่แน่ชัดในการพิจารณาว่าการให้รางวัลนั้นไม่เป็นที่รู้จักหรือไม่ แต่ฉันคิดว่าจะใช้ตัวสร้างตัวเลขแบบสุ่มและหากผลลัพธ์นั้นมีค่ามากกว่าค่าฮาร์ดโค้ดบางตัวคุณจะได้รับรางวัล ถ้าฉันต้องการวิศวกรรมย้อนกลับโดยทั่วไปแล้วโปรแกรมเมอร์ใช้ค่าอะไรในการพิจารณาความถี่ที่ได้รับรางวัล (ประมาณ 15-30%) ฉันจะคำนวณจำนวนตัวอย่างที่ฉันต้องการได้อย่างไร ฉันเริ่มต้นด้วยส่วน "เครื่องมือประมาณความน่าจะเป็นจริง" ที่นี่: Checking_whether_a_coin_is_fairแต่ฉันไม่แน่ใจว่าฉันกำลังมุ่งหน้าไปทางที่ถูกต้อง ฉันได้รับผลลัพธ์จาก ~ 1,000 ตัวอย่างที่จำเป็นสำหรับข้อผิดพลาดสูงสุด 3% ที่ความมั่นใจ 95% ท้ายที่สุดนี่คือสิ่งที่ฉันพยายามแก้ไข: กิจกรรม # 1 ให้รางวัล 1.0R, X% ของเวลา กิจกรรม # 2 ให้รางวัล 1.4R กับ Y% ของเวลา ฉันต้องการประเมิน X & Y อย่างแม่นยำพอที่จะตัดสินว่ากิจกรรมใดมีประสิทธิภาพมากกว่า ขนาดตัวอย่างที่มีขนาดใหญ่เป็นปัญหาเนื่องจากฉันสามารถได้รับ 1 ตัวอย่างทุก ๆ 20 นาทีเท่านั้น

2
ความสำเร็จของการทดลองใน Bernoulli ด้วยความน่าจะเป็นที่แตกต่างกัน
หากมีการทดลอง Bernoulli อิสระ 20 ครั้งโดยแต่ละคนมีความน่าจะเป็นที่จะประสบความสำเร็จแตกต่างกันและล้มเหลว ความน่าจะเป็นที่การทดลองใช้ n จาก 20 ครั้งนั้นประสบความสำเร็จอย่างไร มีวิธีที่ดีกว่าในการคำนวณความน่าจะเป็นเหล่านี้แทนที่จะรวมเข้าด้วยกันเป็นการรวมกันของความสำเร็จและความล้มเหลวที่เป็นไปได้หรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.