คำถามติดแท็ก goodness-of-fit

ความเหมาะสมของการทดสอบแบบพอดีบ่งบอกว่ามีเหตุผลหรือไม่ที่จะสมมติว่าตัวอย่างแบบสุ่มมาจากการแจกแจงแบบเจาะจง

3
“ กลับกัน” ชาปิโร่ - วิลค์
การทดสอบ Sharipo-Wilk อ้างอิงจากวิกิพีเดียทดสอบสมมติฐานว่าง ( ) "ประชากรจะกระจายตามปกติ"H0H0H_0 ฉันกำลังมองหาการทดสอบคล้ายกันกับ "ประชากรไม่ได้กระจายตามปกติ"H0H0H_0 หลังจากมีการทดสอบฉันต้องการคำนวณเพื่อปฏิเสธที่ระดับนัยสำคัญ iff ; พิสูจน์ให้เห็นว่าประชากรของฉันกระจายตามปกติH 0 α p &lt; αpppH0H0H_0αα\alphap&lt;αp&lt;αp < \alpha โปรดทราบว่าการใช้การทดสอบ Sharipo-Wilk และการยอมรับ iffเป็นวิธีที่ไม่ถูกต้องเนื่องจากมันหมายถึง "เรามีหลักฐานไม่เพียงพอที่จะพิสูจน์ว่า H0 ไม่ได้ถือ" p &gt; αH0H0H_0p&gt;αp&gt;αp > \alpha หัวข้อที่เกี่ยวข้อง - ความหมายของ -valueppp , เป็นปกติทดสอบไร้ประโยชน์? แต่ฉันไม่เห็นวิธีแก้ไขปัญหาของฉัน คำถาม:ฉันควรใช้แบบทดสอบใด? มันนำมาใช้ใน R หรือไม่?

5
ฉันสามารถทดสอบสมมติฐานหาข้อมูลปกติได้หรือไม่
ฉันมีการรวบรวมข้อมูลซึ่ง แต่เดิมฉันคิดว่ามันถูกแจกจ่ายตามปกติ จากนั้นฉันก็ดูมันและตระหนักว่าไม่ใช่เพราะส่วนใหญ่เป็นข้อมูลที่เบ้และฉันก็ทำการทดสอบ shapiro-wilks ด้วย ฉันยังต้องการวิเคราะห์โดยใช้วิธีการทางสถิติและฉันต้องการทดสอบสมมติฐานสำหรับความเบ้ ดังนั้นฉันอยากทราบว่ามีวิธีทดสอบความเป็นปรกติหรือไม่และถ้าเป็นไปได้ห้องสมุดที่ทำแบบทดสอบให้ฉัน

2
Goodness of fit test: คำถามเกี่ยวกับเกณฑ์ทดสอบ Anderson – Darling และCramér – von Mises
ฉันอ่านหน้าเว็บสำหรับความดีของการทดสอบพอดีเมื่อฉันมาถึงการทดสอบแอนเดอ-ดาร์ลิ่งและเกณฑ์Cramér-von Mises จนถึงตอนนี้ฉันก็ได้ประเด็นแล้ว ดูเหมือนว่าการทดสอบแอนเดอ-ดาร์ลิ่งและเกณฑ์Cramér-von Mises จะคล้ายกันเพียงขึ้นอยู่กับฟังก์ชั่นที่แตกต่างกันถ่วงน้ำหนักนอกจากนี้ยังมีความแตกต่างจากเกณฑ์Cramér-von Mises ชื่อการทดสอบวัตสันwww โดยทั่วไปฉันมีสองคำถามที่นี่ มีผลลัพธ์ของ Google ไม่มากนักเกี่ยวกับสองวิธีนี้ พวกเขายังคงสถานะของศิลปะ? หรือถูกแทนที่ด้วยวิธีที่ดีกว่าอยู่แล้ว? เป็นบิตของความประหลาดใจเป็นไปตามบทความนี้เกี่ยวกับการเปรียบเทียบอำนาจของ Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors และแอนเดอ-ดาร์ลิ่งทดสอบ , AD มีประสิทธิภาพค่อนข้างดี; ดีกว่า Lilliefors และ KS เสมอและใกล้เคียงกับการทดสอบ SW ซึ่งได้รับการออกแบบมาโดยเฉพาะสำหรับการแจกแจงแบบปกติ ช่วงความมั่นใจสำหรับการทดสอบดังกล่าวคืออะไร? สำหรับการทดสอบ AD, CM และ Watson ฉันเห็นตัวแปรสถิติการทดสอบที่กำหนดไว้ในหน้า wiki แต่ไม่พบช่วงความมั่นใจ สิ่งที่เป็นเพียงตรงไปตรงมามากขึ้นสำหรับการทดสอบ KS: บนหน้าวิกิพีเดีย , ช่วงความเชื่อมั่นจะถูกกำหนดโดยซึ่งถูกกำหนดจากฟังก์ชันการกระจายสะสมของKKαKαK_\alphaKKK

3
วิธีการเห็นภาพความดีแบบเบย์ของความเหมาะสมสำหรับการถดถอยโลจิสติก
สำหรับปัญหาการถดถอยแบบลอจิสติกแบบเบย์ฉันได้สร้างการแจกแจงการคาดการณ์หลัง ฉันสุ่มตัวอย่างจากการแจกแจงแบบคาดการณ์และได้รับตัวอย่างจำนวนมาก (0,1) สำหรับการสังเกตแต่ละครั้งที่ฉันมี การแสดงให้เห็นถึงความดีงามของพอดีนั้นน้อยกว่าที่น่าสนใจตัวอย่างเช่น พล็อตนี้แสดงตัวอย่าง 10,000 ตัวอย่าง + จุดข้อมูลที่สังเกตได้ (วิธีทางซ้ายสามารถสร้างเส้นสีแดงได้: ใช่แล้วนั่นคือการสังเกต) ปัญหาคือว่าพล็อตนี้ไม่ค่อยให้ข้อมูลและฉันจะมี 23 อันหนึ่งอันสำหรับแต่ละจุดข้อมูล มีวิธีที่ดีกว่าในการมองเห็นจุดข้อมูล 23 จุดพร้อมตัวอย่างหลังหรือไม่ ความพยายามอื่น: ความพยายามอื่นขึ้นอยู่กับกระดาษที่นี่

3
จะประเมินความดีของแบบที่ไม่เชิงเส้นได้อย่างไร [ปิด]
เป็นการยากที่จะบอกสิ่งที่ถูกถามที่นี่ คำถามนี้คลุมเครือคลุมเครือไม่สมบูรณ์กว้างเกินไปหรือโวหารและไม่สามารถตอบได้อย่างสมเหตุสมผลในรูปแบบปัจจุบัน สำหรับความช่วยเหลือในการทำความเข้าใจคำถามนี้เพื่อที่จะสามารถเปิด, ไปที่ศูนย์ช่วยเหลือ ปิดให้บริการใน7 ปีที่ผ่านมา ฉันมีรูปแบบไม่เชิงเส้นโดยที่Φคือ cdf ของการแจกแจงแบบปกติมาตรฐานและ f เป็นแบบไม่เชิงเส้น (ดูด้านล่าง) ฉันต้องการทดสอบความดีพอดีของโมเดลนี้ด้วยพารามิเตอร์aต่อข้อมูลของฉัน( x 1 , y 1 ) , ( x 2 , y 2 ) , … , ( x n , y n )y=Φ(f(x,a))+εy=Φ(f(x,a))+εy=\Phi(f(x,a)) + \varepsilonΦΦ\Phiaaa(x1,y1),(x2,y2),…,(xn,yn)(x1,y1),(x2,y2),…,(xn,yn)(x_1,y_1),(x_2,y_2),\dots,(x_n,y_n)หลังจากที่มีการใช้ในการประมาณค่าความน่าจะเป็นสูงสุดที่จะหา การทดสอบที่เหมาะสมจะเป็นอย่างไร ฉันต้องการใช้การทดสอบนี้เพื่อติดป้ายกำกับข้อมูลไม่ดีพอและระบุว่าควรรวบรวมข้อมูลเพิ่มเติมหรือไม่aaa ผมมองในการใช้อันซ์ซึ่งเปรียบเทียบรุ่นนี้กับรุ่นอิ่มตัวที่มีของการทดสอบของความดีของพอดีสอดคล้องกันโดยใช้กระจาย สิ่งนี้จะเหมาะสมหรือไม่ สิ่งที่ฉันได้อ่านเกี่ยวกับความเบี่ยงเบนส่วนใหญ่นั้นนำไปใช้กับ GLMs ซึ่งไม่ใช่สิ่งที่ฉันมี หากการทดสอบแบบเบี่ยงเบนมีความเหมาะสมสมมติฐานใดที่จำเป็นต้องมีเพื่อให้การทดสอบมีผลχ2n−1χn−12\chi^2_{n-1} อัปเดต: สำหรับx&gt;1,a&gt;0ในกรณีนี้ช่วยได้f=x−1ax2+1√f=x−1ax2+1f = …

2
มีความดีของแอนเดอร์สันที่รักการทดสอบพอดีสำหรับชุดข้อมูลสองชุดหรือไม่?
ฉันรู้ว่า ad.test () สามารถใช้สำหรับทดสอบมาตรฐานได้ เป็นไปได้ไหมที่จะรับ ad.test เพื่อเปรียบเทียบการแจกแจงจากตัวอย่างข้อมูลสองชุด? x &lt;- rnorm(1000) y &lt;- rgev(2000) ad.test(x,y) ฉันจะทำการทดสอบ Anderson-Darling กับ 2 ตัวอย่างได้อย่างไร

1
วิธีการวาดกราฟที่พอดีและกราฟที่แท้จริงของการกระจายแกมม่าในหนึ่งแปลง?
โหลดแพ็คเกจที่จำเป็น library(ggplot2) library(MASS) สร้าง 10,000 หมายเลขที่พอดีกับการแจกแจงแกมม่า x &lt;- round(rgamma(100000,shape = 2,rate = 0.2),1) x &lt;- x[which(x&gt;0)] วาดฟังก์ชันความหนาแน่นของความน่าจะเป็นถ้าเราไม่รู้ว่าการกระจายตัว x พอดีกับอะไร t1 &lt;- as.data.frame(table(x)) names(t1) &lt;- c("x","y") t1 &lt;- transform(t1,x=as.numeric(as.character(x))) t1$y &lt;- t1$y/sum(t1[,2]) ggplot() + geom_point(data = t1,aes(x = x,y = y)) + theme_classic() จากกราฟเราสามารถเรียนรู้ว่าการแจกแจงของ x นั้นเหมือนกับการแจกแจงแกมม่าดังนั้นเราใช้fitdistr()ในแพ็คเกจMASSเพื่อรับพารามิเตอร์ของรูปร่างและอัตราการกระจายแกมม่า fitdistr(x,"gamma") ## output ## shape …

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

4
ฉันสามารถคำนวณเพียร์สันสถิติทดสอบสำหรับการขาดความพอดีกับรูปแบบการถดถอยโลจิสติกใน R?
อัตราส่วนความน่าจะเป็น (การเบี่ยงเบน aka)สถิติและการทดสอบแบบไม่พอดี (หรือความดีของความพอดี) นั้นค่อนข้างตรงไปตรงมาที่จะได้รับแบบจำลองการถดถอยแบบโลจิสติก (พอดีกับการใช้งาน) ในอาร์ ง่ายที่จะให้จำนวนเซลล์บางส่วนสิ้นสุดต่ำพอที่การทดสอบจะไม่น่าเชื่อถือ วิธีหนึ่งในการตรวจสอบความน่าเชื่อถือของการทดสอบอัตราส่วนความน่าจะเป็นสำหรับการขาดความพอดีคือการเปรียบเทียบสถิติการทดสอบและP- value กับการทดสอบไคสแควร์ของ Pearson (หรือ ) การทดสอบแบบไม่พอดีG2G2G^2glm(..., family = binomial)χ2χ2\chi^2 ทั้งglmวัตถุและsummary()วิธีการรายงานสถิติการทดสอบสำหรับการทดสอบไคสแควร์ของเพียร์สันสำหรับการขาดความพอดี ในการค้นหาของฉันสิ่งเดียวที่ฉันคิดไว้คือchisq.test()ฟังก์ชั่น (ในstatsแพ็คเกจ): เอกสารประกอบของมันบอกว่า " chisq.testทำการทดสอบตารางฉุกเฉินแบบไคสแควร์และการทดสอบความดีแบบพอดี" อย่างไรก็ตามเอกสารประกอบกระจัดกระจายในวิธีการทดสอบดังกล่าว: ถ้าxเป็นเมทริกซ์ที่มีหนึ่งแถวหรือคอลัมน์หรือถ้าxเป็นเวกเตอร์และyไม่ได้ให้ไว้จะทำการทดสอบความดี - พอดี ( xถือว่าเป็นตารางฉุกเฉินหนึ่งมิติ) รายการของxต้องเป็นจำนวนเต็มที่ไม่เป็นลบ ในกรณีนี้สมมติฐานที่ทดสอบคือความน่าจะเป็นของประชากรเท่ากับpหรือไม่เท่ากันทั้งหมดหากpไม่ได้รับ ฉันคิดว่าคุณสามารถใช้yส่วนประกอบของglmวัตถุสำหรับข้อโต้แย้งของx chisq.testอย่างไรก็ตามคุณไม่สามารถใช้fitted.valuesองค์ประกอบของglmวัตถุสำหรับการpโต้แย้งchisq.testเพราะคุณจะได้รับข้อผิดพลาด: " probabilities must sum to 1." อย่างน้อยฉันจะ (ใน R) คำนวณสถิติการทดสอบPearsonสำหรับการขาดความฟิตโดยไม่ต้องทำตามขั้นตอนด้วยตนเองได้อย่างไรχ2χ2\chi^2

2
วิธีการประเมินความดีของความพอดีสำหรับฟังก์ชั่นการเอาตัวรอด
ฉันเป็นนักวิเคราะห์การรอดชีวิตคนใหม่แม้ว่าฉันจะมีความรู้ในการจำแนกและการถดถอย สำหรับการถดถอยเรามีสถิติ MSE และ R กำลังสอง แต่เราจะบอกได้อย่างไรว่าแบบจำลองการเอาชีวิตรอด A นั้นเหนือกว่าแบบจำลองการเอาชีวิตรอด B นอกเหนือจากกราฟฟิค (KM curve) บางชนิด? หากเป็นไปได้โปรดอธิบายความแตกต่างด้วยตัวอย่าง (เช่น rpart package ใน R) คุณจะแสดงให้เห็นได้อย่างไรว่าต้นไม้การอยู่รอดของ CART หนึ่งต้นนั้นดีกว่าต้นไม้การอยู่รอดของ CART อีกต้น สามารถใช้การวัดใดได้บ้าง

3
การทดสอบทางสถิติเพื่อดูว่าความสัมพันธ์เป็นแบบเชิงเส้นหรือไม่เชิงเส้น
ฉันมีชุดข้อมูลตัวอย่างดังนี้: Volume &lt;- seq(1,20,0.1) var1 &lt;- 100 x2 &lt;- 1000000 x3 &lt;- 30 x4 = sqrt(x2/pi) H = x3 - Volume r = (x4*H)/(H + Volume) Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r)) Power &lt;- jitter(Power, factor = 1, amount = 0.1) plot(Volume,Power) จากรูปสามารถบอกได้ว่าระหว่างความสัมพันธ์ 'ปริมาตร' และ 'พลัง' บางช่วงนั้นเป็นเส้นตรงจากนั้นเมื่อ 'ปริมาณ' ค่อนข้างน้อยความสัมพันธ์จะกลายเป็นไม่เป็นเชิงเส้น …

2
ความเหมาะสมของการกระจายแบบปัวซอง
การทดสอบทางสถิติที่รู้จักกันดีคืออะไรเพื่อวัดความดีของตัวแปรสุ่มที่สังเกตได้เพื่อการแจกแจงปัวซอง? ฉันรู้ว่าการทดสอบ Kolmogorov-Smirnov นั้นเป็นแบบนั้นมีคนอื่นอีกไหม?

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.