คำถามติดแท็ก hypergeometric

1
การทดสอบที่แน่นอนของฟิชเชอร์และการกระจาย hypergeometric
ฉันต้องการที่จะเข้าใจการทดสอบที่แม่นยำของฟิชเชอร์มากขึ้นดังนั้นฉันจึงคิดค้นตัวอย่างของเล่นต่อไปนี้โดยที่ f และ m สอดคล้องกับเพศชายและเพศหญิงและ n และ y สอดคล้องกับ "การบริโภคโซดา" เช่นนี้: > soda_gender f m n 0 5 y 5 0 เห็นได้ชัดว่านี่คือการทำให้เข้าใจง่ายมาก แต่ฉันไม่ต้องการให้บริบทเข้ามาขวางทาง ที่นี่ฉันเพิ่งสันนิษฐานว่าผู้ชายไม่ดื่มโซดาและหญิงดื่มโซดาและต้องการดูว่าวิธีการทางสถิติมาถึงข้อสรุปเดียวกัน เมื่อฉันทำการทดสอบฟิชเชอร์ที่แน่นอนใน R ฉันจะได้ผลลัพธ์ต่อไปนี้: > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 …

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
ความน่าจะเป็นของคน n คนจากรายชื่อคน m ที่อยู่ในการสุ่มเลือก x คนจากรายชื่อคน y
ถ้าฉันเลือก 232 คนจากกลุ่ม 363 คนโดยไม่เปลี่ยนความน่าจะเป็นที่ 2 จากรายชื่อ 12 คนที่อยู่ในการเลือกนั้นคืออะไร นี่คือการสุ่มจับฉลากสำหรับการแข่งขันแบบพิเศษที่มีผู้เข้าชม 363 คนจาก 232 จุด มีข้อโต้แย้งว่าการเลือกนั้นมีอคติต่อกลุ่มคน 12 คนหรือไม่ ความพยายามครั้งแรกของฉันในการคำนวณว่ามี 232 ตัวเลือกที่เป็นไปได้ 363 ตัวเลือก จำนวนชุดค่าผสมของบุคคลหนึ่งคนจากรายการสิบสองคือ 1 เลือก 12 + 2 เลือก 12 + ... + 11 เลือก 12 + 12 เลือก 12 ดังนั้น 1 เลือก 12 + 2 เลือก 12 .... / …

3
ความน่าจะเป็นของการแยกจากการสุ่มตัวอย่างหลายครั้งของประชากรเดียวกัน
นี่คือกรณีตัวอย่าง: ฉันมีประชากร 10,000 รายการ แต่ละรายการมีรหัสเฉพาะ ฉันสุ่มเลือก 100 รายการและบันทึกรหัส ฉันเอาไอเท็ม 100 ชิ้นกลับไปเป็นประชากร ฉันสุ่มเลือก 100 รายการอีกครั้งบันทึกรหัสและแทนที่ โดยรวมฉันทำซ้ำการสุ่มตัวอย่างแบบนี้ 5 ครั้ง ความน่าจะเป็นนั้นคืออะไร XXX จำนวนรายการปรากฏในตัวอย่างสุ่มทั้ง 5 รายการหรือไม่ ฉันไม่เชี่ยวชาญในสถิติ สิ่งนี้จะถูกต้องสำหรับหรือไม่?X= 10X=10X = 10 สำหรับการสุ่มตัวอย่างแต่ละครั้งจำนวนชุดค่าผสมที่เป็นไปได้ 100 รายการจาก 10,000 คือb i n o m (10,000,100)binom(10000,100){\rm binom}(10000, 100) จากการรวมกันทั้งหมด 100 รายการชุดค่าผสมมี 10 รายการเฉพาะb i n o m (9990,90)∗ b …

3
สถิติการทดสอบในการทดสอบที่แน่นอนของฟิชเชอร์คืออะไร?
สำหรับตารางฉุกเฉินแบบ 2 คูณ 2 บางคนกล่าวว่าการทดสอบที่แน่นอนของ Fisherใช้การนับX1 , 1X1,1X_{1,1} ในเซลล์ (1,1) ในตารางเป็นสถิติการทดสอบและภายใต้สมมติฐานว่าง X1 , 1X1,1X_{1,1} จะมีการแจกแจง hypergeometric บางคนบอกว่าสถิติการทดสอบของมันคือ |X1 , 1- μ ||X1,1−μ| |X_{1,1} - \mu| ที่ไหน μμ\muคือค่าเฉลี่ยของการแจกแจงไฮเพอร์เมตริกซ์ (ดังที่ได้กล่าวไว้แล้ว) ภายใต้ null นอกจากนี้ยังกล่าวว่าค่า p ถูกกำหนดโดยยึดตามตารางของการแจกแจงแบบไฮเปอร์เมตริกซ์ ฉันสงสัยว่ามีเหตุผลบางอย่างที่จะลบค่าเฉลี่ยแล้วก็ใช้ค่าสัมบูรณ์หรือไม่?|X1 , 1- μ ||X1,1−μ||X_{1,1} - \mu| ไม่มีการแจกแจงไฮเปอร์มิติมิติภายใต้ค่าว่าง
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.