คำถามติดแท็ก binomial

การแจกแจงทวินามให้ความถี่ของ "ความสำเร็จ" ในจำนวน "การทดลอง" ที่เป็นอิสระ ใช้แท็กนี้สำหรับคำถามเกี่ยวกับข้อมูลที่อาจแจกแจงแบบทวินามหรือคำถามเกี่ยวกับทฤษฎีการกระจายตัวนี้

4
จะประเมินความพอดีของ binomial GLMM ที่ติดตั้ง lme4 (> 1.0) ได้อย่างไร?
ฉันมี GLMM ที่มีการแจกแจงแบบทวินามและฟังก์ชันการเชื่อมโยง logit และฉันรู้สึกว่าข้อมูลที่สำคัญไม่ได้ถูกนำเสนอในโมเดล เพื่อทดสอบสิ่งนี้ฉันอยากจะรู้ว่าข้อมูลถูกอธิบายอย่างดีโดยฟังก์ชันเชิงเส้นในสเกล logit หรือไม่ ดังนั้นฉันต้องการทราบว่าส่วนที่เหลือมีความประพฤติดีหรือไม่ อย่างไรก็ตามฉันไม่สามารถหาว่าพล็อตส่วนที่เหลือจะพล็อตและวิธีการตีความพล็อต โปรดทราบว่าฉันใช้รุ่นใหม่ของ lme4 ( รุ่นพัฒนาจาก GitHub ): packageVersion("lme4") ## [1] ‘1.1.0’ คำถามของฉันคือ: ฉันจะตรวจสอบและตีความส่วนที่เหลือของแบบผสมเชิงเส้นแบบทวินามเชิงเส้นทั่วไปพร้อมฟังก์ชันการเชื่อมโยง logit ได้อย่างไร ข้อมูลต่อไปนี้แสดงให้เห็นถึงข้อมูลจริงของฉันเพียง 17% แต่การติดตั้งอุปกรณ์ใช้เวลาประมาณ 30 วินาทีบนเครื่องของฉันดังนั้นฉันจึงปล่อยให้มันเป็นเช่นนี้: require(lme4) options(contrasts=c('contr.sum', 'contr.poly')) dat <- read.table("http://pastebin.com/raw.php?i=vRy66Bif") dat$V1 <- factor(dat$V1) m1 <- glmer(true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1), dat, family = binomial) พล็อตที่ง่ายที่สุด …

3
การถดถอยแบบลอจิสติกใช้การกระจายแบบทวินามอย่างไร
ฉันพยายามที่จะเข้าใจว่าการถดถอยโลจิสติกใช้การกระจายตัวแบบทวินามอย่างไร สมมติว่าฉันกำลังศึกษาความสำเร็จของรังนกในนก ความน่าจะเป็นของรังที่สำเร็จคือ 0.6 ด้วยการแจกแจงทวินามฉันสามารถคำนวณความน่าจะเป็นของความสำเร็จ r ที่ได้รับจากการทดลอง n (จำนวนรังที่ศึกษา) แต่การกระจายแบบทวินามใช้ในบริบทการสร้างแบบจำลองอย่างไร สมมติว่าฉันต้องการทราบว่าอุณหภูมิเฉลี่ยต่อวันมีผลต่อความสำเร็จของรังอย่างไรและฉันใช้การถดถอยโลจิสติกส์เพื่อสำรวจคำถามนี้ ภายในบริบทที่ฉันอธิบายไว้การถดถอยโลจิสติกใช้การแจกแจงทวินามเป็นอย่างไร ฉันกำลังมองหาคำตอบที่ใช้งานง่ายดังนั้นคำตอบที่ไม่มีสมการ! ฉันคิดว่าสมการจะมีประโยชน์ก็ต่อเมื่อมีความเข้าใจในระดับที่เข้าใจง่าย

4
การใช้ offset ในรูปแบบทวินามเพื่ออธิบายจำนวนผู้ป่วยที่เพิ่มขึ้น
คำถามสองข้อที่เกี่ยวข้องจากฉัน ฉันมีกรอบข้อมูลซึ่งมีจำนวนผู้ป่วยในหนึ่งคอลัมน์ (ช่วงผู้ป่วย 10 - 17 คน) และ 0s และ 1s แสดงว่าเหตุการณ์เกิดขึ้นในวันนั้นหรือไม่ ฉันใช้รูปแบบทวินามเพื่อลดความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นกับจำนวนผู้ป่วย อย่างไรก็ตามฉันต้องการที่จะปรับให้เข้ากับความจริงที่ว่าเมื่อมีผู้ป่วยมากขึ้นจะมีเหตุการณ์ที่เกิดขึ้นอย่างหลีกเลี่ยงไม่ได้เพราะจำนวนเวลาผู้ป่วยทั้งหมดในวอร์ดนั้นสูงขึ้นในวันนั้น ดังนั้นฉันใช้รูปแบบทวินามแบบออฟเซ็ตเช่นนี้ (รหัส R): glm(Incident~Numbers, offset=Numbers, family=binomial, data=threatdata) คำถามของฉันคือ: มันโอเคที่จะมีตัวแปรที่เหมือนกันในการทำนายและใน offset หรือไม่? ฉันต้องการแยกความน่าจะเป็นของยาชูกำลังที่เพิ่มขึ้นและดูว่ามีอะไรเหลืออยู่บ้างหรือไม่ มันสมเหตุสมผลสำหรับฉัน แต่ฉันก็ค่อนข้างระมัดระวังในกรณีที่ฉันผิด มีการระบุออฟเซ็ตอย่างถูกต้องหรือไม่? ฉันรู้ว่าในรูปแบบปัวซองมันจะอ่าน offset=log(Numbers) ฉันไม่ทราบว่ามีสิ่งที่เทียบเท่าที่นี่และฉันไม่สามารถหาการชดเชยทวินามใด ๆ กับ Google (ปัญหาหลักคือการที่ฉันได้รับทวินามลบซึ่งแน่นอนว่าไม่ดี)

3
ฉันจะจำลองการพลิกจนกว่าจะประสบความสำเร็จ N ได้อย่างไร
คุณและฉันตัดสินใจที่จะเล่นเกมที่เราผลัดกันพลิกเหรียญ ผู้เล่นคนแรกที่พลิก 10 หัวรวมเป็นผู้ชนะในเกม โดยธรรมชาติมีข้อโต้แย้งว่าใครควรไปก่อน แบบจำลองของเกมนี้แสดงให้เห็นว่าผู้เล่นที่จะโยนครั้งแรกชนะ 6% มากกว่าผู้เล่นที่พลิกที่สอง (ผู้เล่นคนแรกชนะประมาณ 53% ของเวลา) ฉันสนใจในการสร้างแบบจำลองการวิเคราะห์นี้ นี่ไม่ใช่ตัวแปรสุ่มแบบทวินามเนื่องจากไม่มีการทดลองจำนวนคงที่ (พลิกจนกว่าจะมีใครได้รับ 10 หัว) ฉันจะทำแบบนี้ได้อย่างไร มันคือการกระจายตัวแบบทวินามลบหรือไม่ เพื่อที่จะสามารถสร้างผลลัพธ์ของฉันใหม่นี่คือรหัสหลามของฉัน: import numpy as np from numba import jit @jit def sim(N): P1_wins = 0 P2_wins = 0 for i in range(N): P1_heads = 0 P2_heads = 0 while True: P1_heads += …

1
การกระจายแบบไม่สม่ำเสมอของค่า p เมื่อจำลองการทดสอบทวินามภายใต้สมมติฐานว่าง
ฉันได้ยินมาว่าภายใต้สมมติฐานว่างการกระจาย p-value ควรเหมือนกัน อย่างไรก็ตามการจำลองการทดสอบแบบทวินามใน MATLAB กลับมีการแจกแจงที่แตกต่างกันมากจากชุดที่มีค่าเฉลี่ยมากกว่า 0.5 (0.518 ในกรณีนี้): coin = [0 1]; success_vec = nan(20000,1); for i = 1:20000 success = 0; for j = 1:200 success = success + coin(randperm(2,1)); end success_vec(i) = success; end p_vec = binocdf(success_vec,200,0.5); hist(p_vec); พยายามเปลี่ยนวิธีการที่ฉันสร้างตัวเลขสุ่มไม่ได้ช่วย ฉันขอขอบคุณคำอธิบายที่นี่จริงๆ

2
การประมาณแบบเบย์ของ
คำถามนี้เป็นการติดตามด้านเทคนิคของคำถามนี้ ฉันมีปัญหาในการทำความเข้าใจและจำลองแบบจำลองที่แสดงในRaftery (1988): การอนุมานสำหรับพารามิเตอร์binomial : แนวทาง Bayes แบบลำดับชั้นNNNใน WinBUGS / OpenBUGS / JAGS มันไม่เพียงเกี่ยวกับรหัสเท่านั้นดังนั้นควรอยู่ในหัวข้อที่นี่ พื้นหลัง ให้เป็นชุดของการนับความสำเร็จจากการกระจายทวินามด้วยไม่รู้จักNและθ นอกจากนี้ฉันคิดว่าNตามการกระจายของปัวซองด้วยพารามิเตอร์μ (ดังที่กล่าวไว้ในบทความ) จากนั้นแต่ละx ฉันมีการกระจาย Poisson ที่มีค่าเฉลี่ยλ = μ θ ฉันต้องการที่จะระบุไพรเออร์ในแง่ของλและθx=(x1,…,xn)x=(x1,…,xn)x=(x_{1},\ldots,x_{n})NNNθθ\thetaNNNμμ\muxixix_{i}λ=μθλ=μθ\lambda = \mu \thetaλλ\lambdaθθ\theta สมมติว่าผมไม่ได้มีความรู้ใด ๆ ก่อนที่ดีเกี่ยวกับหรือθผมต้องการที่จะกำหนดไพรเออร์ที่ไม่แสดงข้อมูลทั้งλและθ พูด, ไพรเออร์ของฉันλ ~ G เมตรเมตร ( 0.001 , 0.001 )และθ ~ U n ฉันฉo R เมตร ( 0 …

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
จะทราบได้อย่างไรว่าเว็บไซต์โป๊กเกอร์ออนไลน์นั้นยุติธรรมหรือไม่?
สัปดาห์ที่แล้วฉันมีการสนทนาที่น่าสนใจกับเพื่อนที่ดีของฉัน เขาเล่นโป๊กเกอร์ออนไลน์มาแล้วและแนะนำว่ามีความสัมพันธ์ระหว่างการสมัครสมาชิกใหม่ / การโอนเงินเพิ่มเติมและไพ่ที่คุณได้รับแจกเช่นคุณได้รับไพ่ดี ๆ ไซต์อาจจะเสี่ยงมากถ้าเป็นจริง แต่ปัญหายังคงติดใจฉัน วิธีแรกของฉันไปนี้คือการขอให้เพื่อนของฉันที่จะกำหนด "บัตรดี" และทำง่ายทดสอบทวินาม เพื่อนของฉันมีเวลายากลำบากในการกำหนดว่าการ์ดที่ดีคืออะไร ถ้าเขาได้ไพ่ที่ไม่ดีจริง ๆ เขาก็รู้ว่าจะพับในขณะที่ถ้าเขาได้ไพ่ที่ดีเขาก็จะรู้ว่าจะต้องไปไหน - ไพ่ที่ไม่ดีนั้นอยู่ระหว่างนั้น วิธีอื่นของฉันคือการคำนวณความน่าจะเป็นที่แน่นอนของแต่ละมือที่ได้รับจากนั้นดูว่ามันแตกต่างจากที่คาดไว้หรือไม่โดยใช้การทดสอบแบบลงนามของ Wilcoxonเนื่องจากสิ่งนี้ควรตรวจจับรูปร่างการกระจายที่แตกต่างกัน ฉันเดาว่าส่วนที่ยากคือการคำนวณความน่าจะเป็นที่แน่นอน ข้อมูลจะประกอบด้วยไพ่แจกไพ่ 0-100 ใบแรกเมื่อเทียบกับไพ่แจก 300-400 ใบในสัปดาห์ต่อมา (หรือเพื่อนที่อยู่บนไซต์สักพักหนึ่ง) คำถาม : คุณแนะนำให้แนวทางแก้ไขปัญหาอย่างไร? Texas Hold'em ทำงานอย่างไร ฉันไม่เล่นเกมผู้เชี่ยวชาญ (ผมเคยเล่นเพียง Texas Hold'em 3-4 ครั้ง) แต่มันค่อนข้างง่ายที่คุณสามารถหารายละเอียดเพิ่มเติมเกี่ยวกับหน้าวิกินี่ ความแตกต่างที่สำคัญจากโป๊กเกอร์ทั่วไปคือคุณจะได้รับไพ่ 2 ใบเมื่อเริ่มต้นเท่านั้น คุณไม่ได้เปลี่ยนการ์ดเหล่านี้ บนโต๊ะมีการ์ดอีก 5 ใบคว่ำหน้าลง เมื่อรวมสองโต๊ะของคุณเข้ากับโต๊ะ 5 คุณจะได้ไพ่ 5 ใบที่ดีที่สุดเท่าที่จะเป็นไปได้ …

7
เข้าใจโดยสัญชาตญาณว่าเหตุใดการแจกแจงปัวซงเป็นกรณี จำกัด ของการแจกแจงทวินาม
ใน "การวิเคราะห์ข้อมูล" โดย DS Sivia มีการสืบทอดของการแจกแจงปัวซงจากการแจกแจงทวินาม พวกเขาอ้างว่าการแจกแจงปัวซงเป็นกรณี จำกัด ของการแจกแจงทวินามเมื่อM→∞M→∞M\rightarrow\inftyโดยที่MMMคือจำนวนการทดลอง คำถามที่ 1: การโต้แย้งนั้นจะเข้าใจได้อย่างไรอย่างสังหรณ์ใจ? คำถามที่ 2: ทำไมขีด จำกัดขนาดใหญ่MMMถึงเท่ากับM NM!N!(M−N)!M!N!(M−N)!\frac{M!}{N!(M-N)!}ที่Nคือจำนวนความสำเร็จในการทดลองM? (ขั้นตอนนี้ใช้ในการสืบทอด)MNN!MNN!\frac{M^{N}}{N!}NNNMMM

1
ช่วงการทำนายสำหรับตัวแปรสุ่มแบบทวินาม
สูตร (โดยประมาณหรือแน่นอน) สำหรับช่วงเวลาการทำนายสำหรับตัวแปรสุ่มแบบทวินามคืออะไร สมมติว่าและเราสังเกตว่า (ดึงมาจาก ) เป็นที่รู้จักกันY∼Binom(n,p)Y∼Binom(n,p)Y \sim \mathsf{Binom}(n, p)yyyYYYnnn เป้าหมายของเราคือการได้รับช่วงเวลาที่การคาดการณ์ 95% สำหรับการวาดใหม่จากYYYY ประมาณการจุดคือที่{n} ช่วงความมั่นใจสำหรับนั้นตรงไปตรงมา แต่ฉันไม่สามารถหาสูตรสำหรับช่วงการทำนายสำหรับได้ ถ้าเรารู้ (แทนที่จะเป็น ) ช่วงเวลาการทำนาย 95% นั้นเกี่ยวข้องกับการหาควอนไทล์ของทวินาม มีบางสิ่งที่ชัดเจนที่ฉันมองเห็นหรือไม่?พี = Ynp^np^n\hat{p}P Yพีพีp^=ynp^=yn\hat{p}=\frac{y}{n}p^p^\hat{p}YYYpppp^p^\hat{p}

2
R: ฟังก์ชั่น glm พร้อมตระกูล = ข้อมูลจำเพาะ "ทวินาม" และ "น้ำหนัก"
ฉันสับสนมากกับการทำงานของน้ำหนักใน glm กับครอบครัว = "ทวินาม" ในความเข้าใจของฉันความเป็นไปได้ของ glm กับครอบครัว = "ทวินาม" ระบุไว้ดังนี้: f(y)=(nny)pny(1−p)n(1−y)=exp(n[ylogp1−p−(−log(1−p))]+log(nny))f(y)=(nny)pny(1−p)n(1−y)=exp⁡(n[ylog⁡p1−p−(−log⁡(1−p))]+log⁡(nny)) f(y) = {n\choose{ny}} p^{ny} (1-p)^{n(1-y)} = \exp \left(n \left[ y \log \frac{p}{1-p} - \left(-\log (1-p)\right) \right] + \log {n \choose ny}\right) โดยที่yyyคือ "สัดส่วนของความสำเร็จที่สังเกต" และnnnคือจำนวนการทดลองที่ทราบ ในความเข้าใจของฉันความน่าจะเป็นที่จะประสบความสำเร็จpppถูกเปรียบเทียบกับสัมประสิทธิ์เชิงเส้นββ\betaเป็นp=p(β)p=p(β)p=p(\beta)และฟังก์ชัน glm กับครอบครัว = "ทวินาม" ค้นหา: argmaxβ∑ilogf(yi).argmaxβ∑ilog⁡f(yi). \textrm{arg}\max_{\beta} \sum_i \log f(y_i). ดังนั้นปัญหาการปรับให้เหมาะสมนี้สามารถทำให้ง่ายขึ้นเป็น: หาเรื่องสูงสุดβΣผมเข้าสู่ระบบฉ( yผม) …

2
overdispersion ในการถดถอยโลจิสติก
ฉันพยายามจัดการกับแนวคิดของการกระจายเกินเหตุในการถดถอยโลจิสติก ฉันได้อ่านว่าการกระจายข้อความเกินขนาดนั้นเกิดขึ้นเมื่อความแปรปรวนที่สังเกตได้ของตัวแปรตอบกลับสูงกว่าที่คาดไว้จากการแจกแจงทวินาม แต่หากตัวแปรทวินามมีได้เพียงสองค่า (1/0) จะมีค่าเฉลี่ยและความแปรปรวนได้อย่างไร ฉันสบายดีกับการคำนวณค่าเฉลี่ยและความแปรปรวนของความสำเร็จจากการทดลองหมายเลข Bernoulli แต่ฉันไม่สามารถคาดเดาแนวคิดเรื่องค่าเฉลี่ยและความแปรปรวนของตัวแปรที่มีค่าได้สองค่าเท่านั้น ทุกคนสามารถให้ภาพรวมที่ใช้งานง่ายของ: แนวคิดของค่าเฉลี่ยและความแปรปรวนในตัวแปรที่สามารถมีได้สองค่าเท่านั้น แนวคิดของการกระจายเกินเหตุในตัวแปรที่มีได้เพียงสองค่า

2
ฉันไม่เข้าใจความแปรปรวนของทวินาม
ฉันรู้สึกงี่เง่าจริงๆแม้จะถามคำถามพื้นฐาน แต่นี่ไป: ถ้าฉันมีตัวแปรสุ่มที่สามารถรับค่าและด้วยและดังนั้นถ้าฉันดึงตัวอย่างออกมาฉันจะได้ การกระจายแบบทวินามXXX000111P(X=1)=pP(X=1)=pP(X=1) = pP(X=0)=1−pP(X=0)=1−pP(X=0) = 1-pnnn ค่าเฉลี่ยของการแจกแจงคือ μ=np=E(X)μ=np=E(X)\mu = np = E(X) ความแปรปรวนของการแจกแจงคือ σ2=np(1−p)σ2=np(1−p)\sigma^2 = np(1-p) นี่คือที่ปัญหาของฉันเริ่มต้น: ความแปรปรวนจะถูกกำหนดโดย 2 เนื่องจากสแควร์ของผลลัพธ์เป็นไปได้สองรายการไม่เปลี่ยนแปลงอะไรเลย (และ ) นั่นหมายถึงดังนั้นนั่นหมายถึงσ2=E(X2)−E(X)2σ2=E(X2)−E(X)2\sigma^2 = E(X^2) - E(X)^2XXX02=002=00^2 = 012=112=11^2 = 1E(X2)=E(X)E(X2)=E(X)E(X^2) = E(X) σ2=E(X2)−E(X)2=E(X)−E(X)2=np−n2p2=np(1−np)≠np(1−p)σ2=E(X2)−E(X)2=E(X)−E(X)2=np−n2p2=np(1−np)≠np(1−p)\sigma^2 = E(X^2) - E(X)^2 = E(X) - E(X)^2 = np - n^2p^2 = np(1-np) …

5
ความน่าจะเป็นที่จะประสบความสำเร็จในลำดับ k ของการทดลอง n ของเบอร์นูลลี
ฉันพยายามที่จะหาความน่าจะเป็นที่จะได้ 8 การทดลองในแถวที่ถูกต้องในบล็อก 25 การทดลองคุณมี 8 บล็อกทั้งหมด (25 การทดลอง) เพื่อให้ได้การทดลอง 8 ครั้งที่ถูกต้องในแถว ความน่าจะเป็นของการทดลองใช้ถูกต้องตามการคาดเดาคือ 1/3 หลังจากได้ 8 ในแถวที่ถูกต้องบล็อกจะสิ้นสุด (ดังนั้นการได้รับมากกว่า 8 ในแถวที่ถูกต้องนั้นเป็นไปไม่ได้ในทางเทคนิค) ฉันจะค้นหาความน่าจะเป็นที่จะเกิดขึ้นได้อย่างไร ฉันคิดตามลำดับการใช้งาน (1/3) ^ 8 เนื่องจากความน่าจะเป็นที่จะได้ 8 ในแถวที่ถูกต้องมีโอกาส 17 ที่เป็นไปได้ที่จะได้ 8 ต่อเนื่องเป็นแถวในบล็อก 25 การทดลองถ้าฉันคูณ 17 ความเป็นไปได้ * 8 บล็อกที่ฉันได้รับ 136 จะเป็น 1- (1- (1/3) ^ 8) ^ 136 ให้โอกาสฉันที่จะได้ 8 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.