คำถามติดแท็ก hypothesis-testing

การทดสอบสมมติฐานจะประเมินว่าข้อมูลไม่สอดคล้องกับสมมติฐานที่กำหนดแทนที่จะเป็นผลของความผันผวนแบบสุ่มหรือไม่

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

4
ทดสอบความแตกต่างอย่างมีนัยสำคัญในอัตราส่วนของตัวแปรสุ่มแบบกระจาย
เกี่ยวข้องกับการวิเคราะห์อัตราส่วนของตัวแปรและวิธีการกำหนดอัตราส่วนของตัวแปรที่มีการแจกแจงแบบปกติสองแบบหรือค่าผกผันของค่าใดค่าหนึ่ง . สมมติว่าฉันมีตัวอย่างจำนวนหนึ่งจากการแจกแจงแบบสุ่มอย่างต่อเนื่องที่แตกต่างกันสี่แบบซึ่งเราสามารถถือว่าเป็นเรื่องปกติได้ ในกรณีของฉันสิ่งเหล่านี้สอดคล้องกับตัวชี้วัดประสิทธิภาพของระบบไฟล์สองระบบที่แตกต่างกัน (เช่น ext4 และ XFS) ทั้งที่มีและไม่มีการเข้ารหัส ตัวอย่างเช่นเมตริกอาจเป็นจำนวนไฟล์ที่สร้างขึ้นต่อวินาทีหรือเวลาแฝงเฉลี่ยสำหรับการดำเนินการกับไฟล์บางอย่าง เราสามารถสรุปได้ว่าตัวอย่างทั้งหมดที่ได้จากการแจกแจงเหล่านี้จะเป็นผลบวกอย่างแน่นอน ขอเรียกกระจายเหล่านี้ที่และ\}Perffstype,encryptionPerffstype,encryption\textrm{Perf}_{fstype,encryption}fstype∈{xfs,ext4}fstype∈{xfs,ext4}fstype \in \{xfs,ext4\}encryption∈{crypto,nocrypto}encryption∈{crypto,nocrypto}encryption \in \{crypto,nocrypto\} ตอนนี้สมมติฐานของฉันคือการเข้ารหัสทำให้ระบบไฟล์ช้าลงโดยปัจจัยที่ใหญ่กว่าระบบอื่น มีการทดสอบอย่างง่าย ๆ สำหรับสมมติฐานE[Perfxfs,crypto]E[Perfxfs,nocrypto]&lt;E[Perfext4,crypto]E[Perfext4,nocrypto]E[Perfxfs,crypto]E[Perfxfs,nocrypto]&lt;E[Perfext4,crypto]E[Perfext4,nocrypto]\frac{E[\textrm{Perf}_{xfs,crypto}]}{E[\textrm{Perf}_{xfs,nocrypto}]} < \frac{E[\textrm{Perf}_{ext4,crypto}]}{E[\textrm{Perf}_{ext4,nocrypto}]} ?

3
อะไรอาจเป็นคำจำกัดความที่ชัดเจนและใช้งานได้จริงสำหรับ“ ครอบครัวของสมมุติฐาน” (เทียบกับอัตราความผิดพลาดตามลำดับของครอบครัว)
เมื่อพยายามประเมินสิ่งที่ถือเป็นครอบครัวของสมมุติฐานในการทดลอง / โครงการ / การวิเคราะห์ฉันพบว่า "มีจุดประสงค์คล้ายกัน" และ "คล้ายกันในเนื้อหา" ที่ให้ไว้เป็นแนวทางในการกำหนดครอบครัว แต่สิ่งเหล่านี้ค่อนข้างเปิดกว้างสำหรับการตีความ พูดน้อยที่สุด) เห็นได้ชัดว่าถ้าในระหว่างการวิเคราะห์ฉันทำการทดสอบหลายวิธีในกลุ่มและแยกชุดการทดสอบความเป็นเนื้อเดียวกันของสัดส่วนที่ว่าฉันจะไม่รวมทุกอย่างเข้าด้วยกันเป็นสมมุติฐานตระกูลเดี่ยว อย่างไรก็ตามถ้าฉันมีการทดสอบกลุ่มที่เกี่ยวข้องกันหลายชุดกระบวนการเกณฑ์ใดที่นำพวกเขามารวมกันในครอบครัว (หรือแยกพวกมันออกเป็นครอบครัวแยก) สมาชิกทุกคนในครอบครัวควรมีตัวแปรตอบกลับที่เหมือนกันหรือไม่? ถ้าฉันมีตัวแปรตอบกลับต่างกัน แต่มีชุดคดีเดียวกันที่เกี่ยวข้องพวกนั้นทั้งหมดจะรวมอยู่ในครอบครัวของสมมติฐานหรือไม่?

5
การแก้ไขการเปรียบเทียบหลายรายการจำเป็นสำหรับการเปรียบเทียบแบบหลายทาง / ไม่เป็นทางการหรือไม่?
ฉันมีคำถามเชิงปรัชญาเกี่ยวกับเมื่อจำเป็นต้องแก้ไขการเปรียบเทียบหลายรายการ ฉันกำลังวัดสัญญาณที่เปลี่ยนแปลงเวลาอย่างต่อเนื่อง (ที่จุดเวลาแบบแยก) เหตุการณ์ที่แยกต่างหากเกิดขึ้นเป็นครั้งคราวและฉันต้องการที่จะสร้างหากเหตุการณ์เหล่านี้มีผลกระทบอย่างมีนัยสำคัญต่อสัญญาณที่วัดได้ ดังนั้นฉันสามารถรับสัญญาณค่าเฉลี่ยที่ติดตามเหตุการณ์และโดยปกติฉันสามารถเห็นผลกระทบบางอย่างที่นั่นด้วยจุดสูงสุดที่แน่นอน ถ้าฉันเลือกเวลาของช่วงสูงสุดนั้นและจะพูดว่า t-test เพื่อตรวจสอบว่ามันสำคัญหรือไม่เมื่อเหตุการณ์ไม่เกิดขึ้นฉันต้องทำการแก้ไขเปรียบเทียบหลายรายการหรือไม่ แม้ว่าฉันจะทำการทดสอบหนึ่งครั้งเท่านั้น (คำนวณ 1 ค่า) ในการตรวจสอบด้วยสายตาครั้งแรกของฉันฉันเลือกสำหรับหนึ่งที่มีผลกระทบที่ใหญ่ที่สุดจาก (พูด) 15 คะแนนเวลาล่าช้าหลังการโพสต์ที่แตกต่างกันที่ฉันวางแผน ดังนั้นฉันจำเป็นต้องทำการแก้ไขเปรียบเทียบหลายรายการสำหรับการทดสอบ 15 รายการที่ฉันไม่เคยทำมาก่อนหรือไม่ หากฉันไม่ได้ใช้การตรวจสอบด้วยภาพ แต่เพิ่งทำการทดสอบที่แต่ละเหตุการณ์ล่าช้าและเลือกค่าสูงสุดฉันต้องแก้ไขให้ถูกต้อง ฉันสับสนเล็กน้อยว่าฉันต้องการหรือไม่ถ้าการเลือก 'ความล่าช้าที่ดีที่สุด' ถูกทำขึ้นโดยเกณฑ์อื่นนอกเหนือจากการทดสอบตัวเอง (เช่นการเลือกด้วยภาพค่าเฉลี่ยสูงสุด ฯลฯ )

2
ทดสอบความแตกต่างของ quantile-Q ระหว่างกลุ่มหรือไม่?
สำหรับตัวแปร Y บางตัวที่แบ่งออกเป็น 3 กลุ่ม (X) ฉันต้องการเปรียบเทียบกลุ่มและสำหรับสมมติฐานที่ว่าควอนไทล์ 90% นั้นเหมือนกันระหว่างทั้งสามกลุ่ม ฉันสามารถใช้การทดสอบอะไรได้บ้าง ทางเลือกหนึ่งที่ฉันคิดว่าใช้การถดถอยแบบควอไทล์มีทางเลือกอื่น ๆ ฉันคิดว่าถ้าฉันต้องการเปรียบเทียบค่ามัธยฐานฉันสามารถใช้การทดสอบ kruskal วอลลิส (แม้ว่ามันจะขึ้นอยู่กับอันดับ แต่ถ้าฉันจำได้อย่างถูกต้องมันจะให้ผลลัพธ์ที่เหมือนกันเมื่อการกระจายตัวที่เหลือเป็นสมมาตร) ขอบคุณ

4
เหตุใดจึงต้องมีการทดสอบแบบ t เนื่องจากเรามีการทดสอบ z
ใครสามารถให้คำอธิบายว่าทำไมการทดสอบแบบทดสอบ "เกิดขึ้น"? ฉันถูกสอนให้ใช้การทดสอบ t เมื่อคุณไม่ทราบค่าเบี่ยงเบนมาตรฐานของประชากร (เช่นคุณรู้ค่าเบี่ยงเบนมาตรฐานของตัวอย่างของคุณ) แต่ฉันไม่แน่ใจว่าทำไมจึงทำให้แตกต่างจากการทดสอบ z .

1
การอนุมานในตัวแบบเชิงเส้นที่มีความต่างกันแบบเชิงเงื่อนไข
สมมติว่าฉันสังเกตเวกเตอร์ตัวแปรอิสระ x⃗ x→\vec{x} และ Z⃗ z→\vec{z} และตัวแปรตาม Yyy. ฉันต้องการให้พอดีกับรูปแบบของแบบฟอร์ม: Y=x⃗ ⊤β1→+ σก.(Z⃗ ⊤β2→) ϵ,y=x→⊤β1→+σg(z→⊤β2→)ϵ,y = \vec{x}^{\top}\vec{\beta_1} + \sigma g\left(\vec{z}^{\top} \vec{\beta_2}\right) \epsilon, ที่ไหน ก.gg เป็นฟังก์ชันที่มีค่าเป็นบวกสองเท่า σσ\sigma เป็นพารามิเตอร์การปรับขนาดที่ไม่รู้จักและ εϵ\epsilon เป็นหน่วยสุ่มแปรปรวนแบบเกาส์ค่าศูนย์ค่าเฉลี่ย (สันนิษฐานว่าเป็นอิสระจาก x⃗ x→\vec{x} และ Z⃗ z→\vec{z}) นี่คือการตั้งค่าการทดสอบของ heteroskedasticity ของ Koenker (อย่างน้อยก็เท่าที่ฉันเข้าใจ) ฉันมี nnn จากการสังเกตของ x⃗ ,Z⃗ x→,z→\vec{x}, \vec{z} และ Yyyและฉันต้องการประเมิน β1→β1→\vec{\beta_1} และ …

4
วิธีการทดสอบไคสแควร์หลังการทดสอบหลายตารางในตาราง 2 X 3
ชุดข้อมูลของฉันประกอบด้วยการเสียชีวิตโดยรวมหรือการอยู่รอดของสิ่งมีชีวิตที่ไซต์สามประเภททั้งฝั่งกลางและกลาง ตัวเลขในตารางด้านล่างแสดงถึงจำนวนเว็บไซต์ 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 ฉันต้องการทราบว่า # ของเว็บไซต์ที่มีอัตราการตาย 100% มีความสำคัญตามประเภทของไซต์หรือไม่ ถ้าฉันใช้ไคสแควร์ 2 x 3 ฉันจะได้ผลลัพธ์ที่สำคัญ มีการเปรียบเทียบแบบคู่หลังที่ฉันสามารถเรียกใช้หรือฉันควรใช้ ANOVA จิสติกส์หรือการถดถอยด้วยการแจกแจงแบบทวินามหรือไม่ ขอบคุณ!

1
อะไรคือความแตกต่างในทางปฏิบัติและการตีความระหว่างทางเลือกและการถดถอยโลจิสติก?
คำถามล่าสุดเกี่ยวกับทางเลือกในการถดถอยโลจิสติกใน Rให้ผลหลากหลายของคำตอบรวมถึง randomForest, gbm, rpart, bayesglm และโมเดลเสริมทั่วไป อะไรคือความแตกต่างในทางปฏิบัติและการตีความระหว่างวิธีการเหล่านี้กับการถดถอยโลจิสติก พวกเขาตั้งสมมติฐานอะไรบ้าง (หรือไม่ทำให้) สัมพันธ์กับการถดถอยโลจิสติกส์? เหมาะสำหรับการทดสอบสมมติฐานหรือไม่? เป็นต้น

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

2
จะทดสอบได้อย่างไรว่าค่าความชันในโมเดลเชิงเส้นเท่ากับค่าคงที่หรือไม่?
สมมติว่าเรามีรูปแบบการถดถอยเชิงเส้นอย่างง่ายและต้องการทดสอบสมมติฐานกับทางเลือกทั่วไปZ=aX+bYZ=aX+bYZ = aX + bYH0:a=b=12H0:a=b=12H_0: a=b=\frac{1}{2} ฉันคิดว่าหนึ่งสามารถใช้การประมาณการของและและต่อไปใช้Z -test ที่จะได้รับช่วงความเชื่อมั่นทั่ว\ frac {1} {2} ตกลงไหมa^a^\hat{a}SE(a^)SE(a^)SE(\hat{a})ZZZ1212\frac{1}{2} คำถามอื่น ๆ ที่เกี่ยวข้องอย่างยิ่งกับคำถามนี้ สมมติว่าเรามีตัวอย่าง{(x1,y1,z1),…,(xn,yn,zn)}{(x1,y1,z1),…,(xn,yn,zn)}\{(x_1,y_1,z_1),\ldots ,(x_n,y_n,z_n) \}และเราคำนวณχ2χ2\chi^2สถิติ ∑i=1n(zi−xi+yi2)2xi+yi2.∑i=1n(zi−xi+yi2)2xi+yi2.\begin{equation} \sum_{i=1}^n \frac{(z_i-\frac{x_i+y_i}{2})^2}{\frac{x_i+y_i}{2}}. \end{equation} สามารถใช้สถิติเหล่านี้เพื่อทดสอบสมมติฐานว่างได้หรือไม่

2
เปรียบเทียบสองอัลกอริทึมทางพันธุกรรม
ฉันมีการใช้งานของอัลกอริทึมทางพันธุกรรมสองอย่างซึ่งควรจะทำงานอย่างเท่าเทียมกัน อย่างไรก็ตามเนื่องจากข้อ จำกัด ทางเทคนิคที่ไม่สามารถแก้ไขผลลัพธ์ของพวกเขาไม่เหมือนกันได้รับการป้อนข้อมูลเดียวกัน ฉันยังต้องการแสดงให้เห็นว่าไม่มีความแตกต่างด้านประสิทธิภาพที่สำคัญ ฉันมีการวิ่ง 20 ครั้งโดยมีการกำหนดค่าเดียวกันสำหรับอัลกอริทึมแต่ละตัวโดยใช้การสุ่มหมายเลขเริ่มต้นแตกต่างกัน สำหรับการวิ่งและการสร้างแต่ละครั้งการออกกำลังกายข้อผิดพลาดขั้นต่ำ ของบุคคลที่ดีที่สุดในประชากรนั้นถูกบันทึกไว้ อัลกอริทึมใช้กลไกการรักษาแบบชนชั้นสูงดังนั้นความแข็งแรงของบุคคลที่ดีที่สุดจึงลดลงแบบซ้ำซาก การวิ่งประกอบด้วย 1000 รุ่นดังนั้นฉันมี 1,000 ค่าต่อการรัน ฉันไม่สามารถรับข้อมูลเพิ่มเติมได้เนื่องจากการคำนวณมีราคาแพงมาก ฉันควรใช้การทดสอบแบบไหน วิธีง่าย ๆ น่าจะเป็นการเปรียบเทียบข้อผิดพลาดในรุ่นสุดท้าย (อีกครั้งฉันจะใช้แบบทดสอบแบบใด) แต่ก็อาจคิดเปรียบเทียบพฤติกรรมการคอนเวอร์เจนซ์โดยทั่วไป
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.