คำถามติดแท็ก poisson-distribution

การกระจายแบบไม่ต่อเนื่องที่กำหนดไว้ในจำนวนเต็มไม่เป็นลบที่มีคุณสมบัติที่ค่าเฉลี่ยเท่ากับความแปรปรวน

1
ข้อผิดพลาดของตัวชี้วัดสำหรับโมเดลพัวซองที่ผ่านการตรวจสอบความถูกต้อง
ฉันข้ามการตรวจสอบรูปแบบที่พยายามทำนายการนับ หากนี่เป็นปัญหาการจำแนกเลขฐานสองฉันจะคำนวณ AUC แบบพับได้และถ้านี่เป็นปัญหาการถดถอยฉันจะคำนวณ RMSE หรือ Mae แบบ out-of-fold สำหรับโมเดลปัวซงฉันสามารถใช้เมตริกข้อผิดพลาดใดในการประเมิน "ความถูกต้อง" ของการคาดการณ์ที่ไม่อยู่ในกลุ่มตัวอย่าง มีส่วนขยายของปัวซองของ AUC ที่ดูว่าการทำนายลำดับค่าที่แท้จริงดีเพียงใด ดูเหมือนว่าการแข่งขัน Kaggle จำนวนมากสำหรับการนับ (เช่นจำนวนคะแนนโหวตที่เป็นประโยชน์ที่รีวิวร้องเอ๋งจะได้รับหรือจำนวนวันที่ผู้ป่วยจะใช้จ่ายในโรงพยาบาล) ใช้ข้อผิดพลาดรากหมายถึงบันทึกกำลังสองหรือ RMLSE / แก้ไข: สิ่งหนึ่งที่ฉันได้ทำคือการคำนวณ deciles ของค่าที่คาดการณ์ไว้และจากนั้นดูที่การนับจริงโดย binned by decile ถ้า decile 1 อยู่ในระดับต่ำ decile 10 จะสูงและ decile ในระหว่างนั้นเพิ่มขึ้นอย่างเคร่งครัดฉันได้เรียกโมเดล "ดี" แต่ฉันประสบปัญหาในการหาจำนวนกระบวนการนี้และฉันเชื่อว่ามันดีกว่า เข้าใกล้ / แก้ไข 2: ฉันกำลังมองหาสูตรที่ใช้ค่าที่คาดการณ์และตามจริงและส่งกลับเมตริก "ข้อผิดพลาด" หรือ "ความแม่นยำ" บางส่วน แผนของฉันคือการคำนวณฟังก์ชั่นนี้เกี่ยวกับข้อมูลที่อยู่นอกกรอบในระหว่างการตรวจสอบความถูกต้องและจากนั้นใช้เพื่อเปรียบเทียบแบบจำลองที่หลากหลาย …

3
R: การสุ่มฟอเรสต์การโยน NaN / Inf ในข้อผิดพลาด“ การเรียกฟังก์ชันต่างประเทศ” แม้จะไม่มีชุดข้อมูลของ NaN [ปิด]
ฉันใช้คาเร็ตเพื่อรันฟอเรสต์แบบสุ่มที่ผ่านการตรวจสอบความถูกต้องข้ามชุดข้อมูล ตัวแปร Y เป็นปัจจัย ไม่มีชุดข้อมูลของ NaN, Inf's หรือ NA ในชุดข้อมูลของฉัน อย่างไรก็ตามเมื่อใช้ป่าสุ่มฉันได้รับ Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs …

1
การคำนวณซ้ำของเอฟเฟกต์จากโมเดล lmer
ฉันเพิ่งอ่านบทความนี้ซึ่งอธิบายถึงวิธีการคำนวณความสามารถในการทำซ้ำ (ความน่าเชื่อถือหรือความสัมพันธ์ภายในอินทราเน็ต) ของการวัดผ่านการสร้างแบบจำลองเอฟเฟกต์ผสม รหัส R จะเป็น: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

3
ฉันจะตีความ 'ความสัมพันธ์ของเอฟเฟกต์คงที่' ในผลลัพธ์ของ Glmer ได้อย่างไร
ฉันมีผลลัพธ์ต่อไปนี้: Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape) AIC BIC logLik deviance 4062 4093 -2022 4044 Random effects: Groups Name Variance Std.Dev. landscape (Intercept) 0.82453 0.90804 Number of obs: 239, groups: landscape, 45 Fixed effects: Estimate Std. Error …

4
ความแตกต่างระหว่างทวินามลบทวินามและการถดถอยปัวซอง
ฉันกำลังมองหาข้อมูลบางอย่างเกี่ยวกับความแตกต่างระหว่างทวินามลบทวินามและปัวซองการถดถอยและสถานการณ์ที่เหมาะสมที่สุดสำหรับการถดถอยเหล่านี้ มีการทดสอบใดบ้างที่ฉันสามารถทำได้ใน SPSS ที่สามารถบอกได้ว่าการถดถอยแบบใดที่ดีที่สุดสำหรับสถานการณ์ของฉัน นอกจากนี้ฉันจะเรียกใช้ปัวซองหรือทวินามลบใน SPSS ได้อย่างไรเนื่องจากไม่มีตัวเลือกเช่นที่ฉันเห็นในส่วนการถดถอย หากคุณมีลิงค์ที่มีประโยชน์ฉันจะขอบคุณมันมาก

2
จะรู้ได้อย่างไรว่าข้อมูลตามการกระจายของปัวซองใน R หรือไม่
ฉันเป็นนักศึกษาระดับปริญญาตรีและมีโครงการสำหรับชั้นเรียนความเป็นไปได้ของฉัน โดยพื้นฐานแล้วฉันมีชุดข้อมูลเกี่ยวกับพายุเฮอริเคนที่ส่งผลกระทบต่อประเทศของฉันเป็นเวลาหลายปี ในหนังสือน่าจะเป็นของฉัน (ความน่าจะเป็นและสถิติที่มี R) มีตัวอย่าง (ไม่สมบูรณ์) ของวิธีการตรวจสอบว่าข้อมูลเป็นไปตามการแจกแจงแบบปัวซงพวกเขาเริ่มพยายามพิสูจน์ว่าเกณฑ์ 3 ข้อเหล่านี้: (จากหนังสือของฉันหน้า ตัวอย่าง 120 (เกณฑ์) หน้า 122-123) 1- จำนวนผลลัพธ์ในช่วงเวลาที่ไม่ทับซ้อนกันนั้นเป็นอิสระ กล่าวอีกนัยหนึ่งจำนวนผลลัพธ์ในช่วงเวลา (0, t] เป็นอิสระจากจำนวนผลลัพธ์ในช่วงเวลา (t, t + h], h> 0 2- ความน่าจะเป็นของผลลัพธ์สองรายการขึ้นไปในช่วงเวลาสั้น ๆ ที่เพียงพอเป็นศูนย์ กล่าวอีกนัยหนึ่งหาก h มีขนาดเล็กเพียงพอความน่าจะเป็นที่จะได้รับผลลัพธ์สองช่วงขึ้นไปในช่วงเวลานั้น (t, t + h] นั้นเล็กน้อยเมื่อเทียบกับความน่าจะเป็นที่จะได้ผลลัพธ์หนึ่งหรือศูนย์ในช่วงเวลาเดียวกัน 3- ความน่าจะเป็นของผลลัพธ์หนึ่งรายการในช่วงเวลาสั้น ๆ อย่างเพียงพอหรือพื้นที่ขนาดเล็กเป็นสัดส่วนกับความยาวของช่วงเวลาหรือภูมิภาค กล่าวอีกนัยหนึ่งความน่าจะเป็นที่จะเกิดผลลัพธ์หนึ่งครั้งในช่วงความยาว h คือ lambda * h …

3
แบบจำลองที่เหมาะสมสำหรับข้อมูลการนับที่น้อยเกินไปคืออะไร?
ฉันพยายามที่จะสร้างแบบจำลองข้อมูลนับใน R ที่เห็นได้ชัดว่าด้อยค่า (พารามิเตอร์การกระจายตัว ~ .40) นี่อาจเป็นสาเหตุที่รูปแบบแบบglmมีfamily = poissonหรือเชิงลบglm.nbมีความหมายไม่สำคัญ เมื่อฉันดูคำอธิบายข้อมูลของฉันฉันไม่มีข้อมูลการนับทั่วไปและส่วนที่เหลือในเงื่อนไขการทดลองทั้งสองของฉันก็เหมือนกันเช่นกัน ดังนั้นคำถามของฉันคือ: ฉันต้องใช้การวิเคราะห์การถดถอยแบบพิเศษสำหรับข้อมูลการนับของฉันหรือไม่หากข้อมูลการนับของฉันไม่ทำงานเหมือนข้อมูลการนับ บางครั้งฉันต้องเผชิญกับภาวะไม่ปกติ (โดยปกติจะเป็นเพราะความทรมาน) แต่ฉันใช้วิธีบูตสแตรปเปอร์เซ็นไทล์สำหรับการเปรียบเทียบวิธีการที่ถูกตัด (Wilcox, 2012) เพื่ออธิบายถึงความไม่เป็นมาตรฐาน วิธีการสำหรับการนับข้อมูลสามารถทดแทนด้วยวิธีการที่แข็งแกร่งใด ๆ ที่แนะนำโดย Wilcox และรับรู้ในแพ็คเกจ WRS หรือไม่ หากฉันต้องใช้การวิเคราะห์การถดถอยสำหรับข้อมูลนับฉันจะบัญชีสำหรับการกระจายต่ำกว่าได้อย่างไร ปัวซองและการกระจายตัวแบบลบลบถือว่าการกระจายตัวที่สูงขึ้นดังนั้นจึงไม่เหมาะสมใช่ไหม ฉันคิดว่าจะใช้การกระจายแบบกึ่ง - ปัวซองแต่โดยทั่วไปจะแนะนำให้กระจายตัวมากเกินไป ฉันอ่านเกี่ยวกับตัวแบบเบต้า - ทวินามซึ่งดูเหมือนว่าจะสามารถอธิบายได้มากกว่า - รวมถึงการด้อยค่าลงในVGAMชุดของ R ผู้เขียนดูเหมือนจะแนะนำการกระจาย Poisson tildedแต่ฉันไม่สามารถหาได้ในแพ็คเกจ . ใครบ้างที่สามารถแนะนำขั้นตอนการประมวลผลข้อมูลที่ด้อยคุณภาพและอาจมีตัวอย่างรหัส R ให้หรือไม่

9
อนุกรมเวลาสำหรับข้อมูลการนับด้วยการนับ <20
ฉันเพิ่งเริ่มทำงานกับคลินิกวัณโรค เราพบกันเป็นระยะเพื่อพูดคุยเกี่ยวกับจำนวนของผู้ป่วยวัณโรคที่เรากำลังรักษาจำนวนการทดสอบที่ดำเนินการ ฯลฯ ฉันต้องการเริ่มการสร้างแบบจำลองการนับเหล่านี้เพื่อที่เราจะไม่เพียงแค่เดาว่ามีบางอย่างผิดปกติหรือไม่ น่าเสียดายที่ฉันมีการฝึกอบรมน้อยมากในอนุกรมเวลาและการเปิดเผยส่วนใหญ่ของฉันคือการสร้างแบบจำลองสำหรับข้อมูลที่ต่อเนื่องมาก (ราคาหุ้น) หรือการนับจำนวนมาก (ไข้หวัดใหญ่) แต่เราจัดการกับ 0-18 กรณีต่อเดือน (เฉลี่ย 6.68, ค่ามัธยฐาน 7, ค่า 12.3) ซึ่งกระจายอยู่เช่นนี้: [ภาพหายไปจากหมอกแห่งกาลเวลา] [ภาพที่กินโดย Grue] ฉันได้พบบทความเล็ก ๆ น้อย ๆ ที่กล่าวถึงแบบจำลองนี้ แต่ฉันก็ยินดีอย่างยิ่งที่จะได้ยินคำแนะนำจากคุณ - ทั้งแนวทางและแพคเกจ R ที่ฉันสามารถใช้เพื่อใช้แนวทางเหล่านั้น แก้ไข: คำตอบของ mbq ​​ทำให้ฉันต้องคิดอย่างรอบคอบมากขึ้นเกี่ยวกับสิ่งที่ฉันถามที่นี่ ฉันแขวนสายเกินไปเมื่อนับรายเดือนและไม่ได้โฟกัสที่แท้จริงของคำถาม สิ่งที่ฉันอยากรู้คือ: ลดลง (มองเห็นได้ค่อนข้าง) จาก, 2008 เป็นต้นไปสะท้อนให้เห็นถึงแนวโน้มลดลงในจำนวนรวมของคดี? ฉันดูเหมือนว่าจำนวนผู้ป่วยรายเดือนระหว่างปี 2544-2550 สะท้อนให้เห็นถึงกระบวนการที่มีเสถียรภาพ อาจมีบางฤดูกาล แต่โดยรวมมีเสถียรภาพ จากปี 2008 จนถึงปัจจุบันดูเหมือนว่ากระบวนการนั้นกำลังเปลี่ยนแปลงไป: …

2
การกระจายตัวของอัตราส่วนของตัวแปรสุ่มสองตัวของปัวซองคืออะไร
ฉันมีคำถามเกี่ยวกับตัวแปรสุ่ม ขอให้เราคิดว่าเรามีสองตัวแปรสุ่มและYสมมติว่าคือ Poisson กระจายกับพารามิเตอร์และเป็น Poisson กระจายกับพารามิเตอร์\XXXYYYXXXλ1λ1\lambda_1YYYλ2λ2\lambda_2 เมื่อคุณสร้างการแตกหักจากและเรียกสิ่งนี้ว่าตัวแปรสุ่มการกระจายตัวนี้เป็นอย่างไรและค่าเฉลี่ยคืออะไร? มันหรือไม่Z λ 1 / λ 2X/YX/YX/YZZZλ1/λ2λ1/λ2\lambda_1/\lambda_2

3
การถดถอยปัวซองกับการนับการถดถอยกำลังสองน้อยที่สุด?
การถดถอยปัวซองคือGLM ที่มีฟังก์ชั่นบันทึกลิงค์ อีกวิธีหนึ่งในการสร้างแบบจำลองข้อมูลการกระจายที่ไม่ใช่แบบปกติคือการประมวลผลล่วงหน้าโดยการบันทึก (หรือมากกว่าบันทึก (1 + จำนวน) เพื่อจัดการกับ 0) หากคุณทำการถดถอยอย่างน้อยกำลังสองในการตอบกลับนับบันทึกนั่นเกี่ยวข้องกับการถดถอยปัวซองหรือไม่ มันสามารถรองรับปรากฏการณ์ที่คล้ายกันได้หรือไม่?

4
การแจกแจงปัวซงทำงานอย่างไรเมื่อสร้างแบบจำลองข้อมูลต่อเนื่องและทำให้ข้อมูลสูญหาย
เพื่อนร่วมงานกำลังวิเคราะห์ข้อมูลทางชีววิทยาบางอย่างเพื่อทำวิทยานิพนธ์ของเธอด้วย Heteroscedasticity ที่น่ารังเกียจ (ดังรูปด้านล่าง) เธอวิเคราะห์ด้วยโมเดลผสม แต่ยังคงมีปัญหากับส่วนที่เหลือ การเปลี่ยนบันทึกการตอบสนองตัวแปรการทำความสะอาดสิ่งต่าง ๆ ขึ้นอยู่กับความคิดเห็นของคำถามนี้ดูเหมือนจะเป็นวิธีการที่เหมาะสม อย่างไรก็ตามในขั้นต้นเราคิดว่ามีปัญหาในการใช้ตัวแปรที่แปลงแล้วกับตัวแบบผสม ปรากฎว่าเราตีความคำแถลงผิด ๆ ในSASของ Littell &amp; Milliken (2006) สำหรับแบบจำลองผสมซึ่งชี้ให้เห็นว่าเหตุใดจึงไม่เหมาะสมในการแปลงข้อมูลการนับและวิเคราะห์ด้วยแบบจำลองเชิงเส้นเชิงเส้นปกติ(ใบเสนอราคาเต็มด้านล่าง) . วิธีการที่ปรับปรุงส่วนที่เหลือคือการใช้โมเดลเชิงเส้นทั่วไปกับการแจกแจงปัวซอง ฉันได้อ่านแล้วว่าการแจกแจงปัวซงสามารถใช้สำหรับการสร้างแบบจำลองข้อมูลต่อเนื่อง (เช่นที่กล่าวถึงในโพสต์นี้) และแพคเกจสถิติอนุญาต แต่ฉันไม่เข้าใจว่าเกิดอะไรขึ้นเมื่อแบบจำลองนั้นพอดี เพื่อจุดประสงค์ในการทำความเข้าใจวิธีการคำนวณที่แฝงอยู่คำถามของฉันคือ: เมื่อคุณใส่การแจกแจงแบบปัวซงเป็นข้อมูลแบบต่อเนื่อง1)ข้อมูลจะถูกปัดเศษเป็นจำนวนเต็มที่ใกล้ที่สุด2) หรือไม่3)เมื่อใดควรใช้แบบจำลองปัวซองสำหรับข้อมูลต่อเนื่องหรือไม่ Littel &amp; Milliken 2006, pg 529 "การแปลงข้อมูล [count] อาจเป็นการต่อต้านตัวอย่างเช่นการแปลงสามารถบิดเบือนการแจกแจงของเอฟเฟกต์แบบสุ่มหรือความเป็นเชิงเส้นของโมเดลที่สำคัญกว่าการแปลงข้อมูลยังคงเปิดโอกาส ของจำนวนที่คาดการณ์เชิงลบดังนั้นการอนุมานจากตัวแบบผสมที่ใช้ข้อมูลที่แปลงแล้วเป็นที่น่าสงสัยอย่างมาก "

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
อะไรคือการกระจายตัวของตัวแปรสุ่มปัวซองลงเฉลี่ย?
ถ้าฉันมีตัวแปรสุ่มX1,X2,…,XnX1,X2,…,XnX_1,X_2,\ldots,X_nที่ปัวซองกระจายกับพารามิเตอร์λ1,λ2,…,λnλ1,λ2,…,λn\lambda_1, \lambda_2,\ldots, \lambda_n , การกระจายตัวของY=⌊∑ni=1Xin⌋Y=⌊∑i=1nXin⌋Y=\left\lfloor\frac{\sum_{i=1}^n X_i}{n}\right\rfloor(เช่นชั้นจำนวนเต็มของค่าเฉลี่ย)? ผลรวมของ Poissons ก็เป็น Poisson เช่นกัน แต่ฉันไม่มั่นใจในสถิติเพียงพอที่จะตัดสินว่ามันเหมือนกันสำหรับกรณีข้างต้นหรือไม่

2
การกระจายตัวที่อธิบายความแตกต่างระหว่างตัวแปรกระจายแบบทวินามลบ
การกระจาย Skellamอธิบายความแตกต่างระหว่างสองตัวแปรที่มีการแจกแจงปัวส์ซอง มีการแจกแจงแบบเดียวกันที่อธิบายความแตกต่างระหว่างตัวแปรที่ตามหลังการแจกแจงทวินามลบหรือไม่ ข้อมูลของฉันผลิตโดยกระบวนการปัวซง แต่รวมถึงเสียงรบกวนในปริมาณที่เหมาะสม ดังนั้นการสร้างแบบจำลองข้อมูลด้วยการแจกแจงลบทวินาม (NB) จึงทำงานได้ดี ถ้าฉันต้องการจำลองความแตกต่างระหว่างชุดข้อมูล NB สองชุดตัวเลือกของฉันคืออะไร หากช่วยได้ให้ถือว่าวิธีการและความแปรปรวนที่คล้ายกันสำหรับทั้งสองชุด

2
วิธีการจัดให้มีการกระจายแบบไม่ต่อเนื่องเพื่อนับข้อมูล?
ฉันมีฮิสโตแกรมข้อมูลการนับต่อไปนี้ และฉันต้องการให้การกระจายแบบไม่ต่อเนื่องกับมัน ฉันไม่แน่ใจว่าฉันควรทำอย่างไร ฉันควรเพิ่มการแจกแจงแบบแยกส่วนก่อนพูดการแจกแจงลบแบบทวินามบนฮิสโตแกรมเพื่อให้ฉันได้รับพารามิเตอร์การกระจายแบบไม่ต่อเนื่องแล้วเรียกใช้การทดสอบ Kolmogorov – Smirnov เพื่อตรวจสอบค่า p? ฉันไม่แน่ใจว่าวิธีนี้ถูกต้องหรือไม่ มีวิธีการทั่วไปในการจัดการปัญหาเช่นนี้หรือไม่? นี่คือตารางความถี่ของข้อมูลการนับ ในปัญหาของฉันฉันมุ่งเน้นเฉพาะการนับที่ไม่ใช่ศูนย์ Counts: 1 2 3 4 5 6 7 9 10 Frequency: 3875 2454 921 192 37 11 1 1 2 UPDATE:ฉันต้องการถาม: ฉันใช้ฟังก์ชัน fitdistr ใน R เพื่อรับพารามิเตอร์สำหรับการปรับข้อมูลให้เหมาะสม fitdistr(abc[abc != 0], "Poisson") lambda 1.68147852 (0.01497921) จากนั้นฉันพล็อตฟังก์ชันความน่าจะเป็นแบบมวลของการแจกแจงแบบปัวซองที่อยู่ด้านบนของฮิสโตแกรม อย่างไรก็ตามดูเหมือนว่าการกระจาย Poisson ล้มเหลวในการสร้างแบบจำลองข้อมูลการนับ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.