จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร


9

สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์:

Event1 - 5
E2 - 1
E3 - 0
E4 - 12

และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง:

p1 - 0.2
p2 - 0.1
p3 - 0.1
p4 - 0.6

ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม

expectedE1 - 18 * 0.2 = 3.6
expectedE2 - 18 * 0.1 = 1.8
expectedE1 - 18 * 0.1 = 1.8
expectedE1 - 18 * 0.6 = 10.8

ฉันจะเปรียบเทียบค่าที่สังเกตได้กับค่าที่คาดไว้ได้อย่างไร การทดสอบว่าความน่าจะเป็นที่คำนวณได้ของฉันเป็นตัวทำนายที่ดีหรือไม่

ฉันคิดว่าการทดสอบแบบไคสแควร์ แต่ผลการเปลี่ยนแปลงกับขนาดตัวอย่าง (n = 18) ฉันหมายความว่าถ้าฉันคูณค่าที่สังเกตด้วย 1342 และใช้วิธีเดียวกันผลลัพธ์จะแตกต่างกัน บางทีการทดสอบแบบจับคู่ของวิลคอกซ์นั้นใช้ได้ แต่คุณแนะนำอะไร?

หากสามารถแนะนำใน R มันจะดีกว่า

r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

คำตอบ:


4

คุณพูดถึงว่าคุณได้รับผลลัพธ์ที่แตกต่างกันถ้าคุณคูณค่าทั้งหมดโดย1342นี่ไม่ใช่ปัญหา. คุณควรได้รับผลลัพธ์ที่แตกต่างกันมาก ถ้าคุณพลิกเหรียญและหัวมันจะไม่พูดมากนัก หากคุณพลิกเหรียญครั้งและคุณได้รับหัวทุกครั้งคุณมีข้อมูลอีกมากที่ชี้ให้เห็นว่าเหรียญไม่ยุติธรรม13421342

โดยปกติแล้วคุณต้องการใช้ทางเลือกในการเมื่อจำนวนครั้งที่คาดว่าจะเกิดขึ้นนั้นต่ำมาก (เช่นต่ำกว่า ) ในหมวดหมู่ของคุณจำนวนมาก (พูดอย่างน้อย ) ความเป็นไปได้อย่างหนึ่งก็คือการทดสอบที่แน่นอนฟิชเชอร์ซึ่งจะนำมาใช้ในการวิจัย คุณสามารถดูการเป็นการประมาณการทดสอบที่แน่นอนของฟิชเชอร์และการประมาณนั้นดีเฉพาะเมื่อจำนวนที่คาดหวังมากกว่านั้นมีขนาดใหญ่χ2520%χ2


ขอบคุณซึ่งเป็นสิ่งที่ดีกว่าสำหรับเรื่องนี้: เพียงแค่การทดสอบการประมง? หรือการทดสอบฟิชเชอร์ด้วยค่า p จำลอง? และทำไม?
Juan

การจำลองแนะนำข้อผิดพลาดซึ่งอาจมีขนาดเล็ก แต่ไม่ควรจำเป็นสำหรับค่าเล็ก ๆ ถ้าคุณมีประเภทและวัตถุแล้วจำนวนผลลัพธ์ที่เป็นไปเป็นn เมื่อสิ่งนี้มีขนาดเล็กตามมาตรฐานของคอมพิวเตอร์ (อาจน้อยกว่า ) จากนั้นฉันจะใช้การคำนวณที่แน่นอน หากการคำนวณที่แน่นอนช้าให้ทดสอบข้อผิดพลาดของแบบจำลองและดูว่าพวกมันเป็นที่ยอมรับสำหรับการเพิ่มความเร็วหรือไม่ kn(n+k1n)107
Douglas Zare
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.