คำถามติดแท็ก statistical-significance

นัยสำคัญทางสถิติหมายถึงความน่าจะเป็นที่ถ้าในประชากรที่ตัวอย่างนี้ถูกดึงออกมาผลที่แท้จริงคือ 0 (หรือค่าที่ตั้งสมมติฐานไว้บางส่วน) สถิติทดสอบที่มากหรือสุดขั้วเกินกว่าที่จะเกิดขึ้นในกลุ่มตัวอย่าง

3
การทดสอบทางสถิติเพื่อตรวจสอบเมื่ออนุกรมเวลาสองชุดที่คล้ายกันเริ่มแตก
จากชื่อฉันต้องการทราบว่ามีการทดสอบทางสถิติที่สามารถช่วยฉันระบุความแตกต่างที่สำคัญระหว่างอนุกรมเวลาสองชุดที่คล้ายกันได้หรือไม่ โดยเฉพาะเมื่อดูรูปด้านล่างฉันต้องการตรวจสอบว่าซีรีย์เริ่มเบี่ยงเบนเวลา t1 คือเมื่อความแตกต่างระหว่างพวกเขาเริ่มมีนัยสำคัญ ยิ่งกว่านั้นฉันจะตรวจจับเมื่อความแตกต่างระหว่างซีรีย์กลับมามีความหมายไม่มาก มีการทดสอบทางสถิติที่มีประโยชน์ในการทำเช่นนี้หรือไม่?

2
นอกเหนือจาก Durbin-Watson แล้วการทดสอบสมมติฐานใดบ้างที่สามารถสร้างผลลัพธ์ที่สรุปไม่ได้?
สถิติทดสอบ Durbin-Watsonสามารถนอนในภูมิภาคที่สรุปไม่ได้ที่มันเป็นไปไม่ได้อย่างใดอย่างหนึ่งที่จะปฏิเสธหรือล้มเหลวที่จะปฏิเสธสมมติฐาน (ในกรณีนี้ศูนย์อัต) การทดสอบทางสถิติอื่นใดที่สามารถให้ผลลัพธ์ที่ "สรุปไม่ได้"? มีคำอธิบายทั่วไป (การโบกมือเป็นไร) เพราะเหตุใดชุดทดสอบนี้จึงไม่สามารถทำการตัดสินใจไบนารี "ปฏิเสธ" / "ไม่สามารถปฏิเสธ" ได้? มันจะเป็นโบนัสถ้ามีใครสามารถพูดถึงผลกระทบของการตัดสินใจเชิงทฤษฎีซึ่งเป็นส่วนหนึ่งของคำตอบของพวกเขาในแบบสอบถามหลัง - การมีหมวดหมู่เพิ่มเติมของข้อสรุป (ใน) หมายความว่าเราต้องพิจารณาค่าใช้จ่ายของ Type I และ Type II ข้อผิดพลาดในวิธีที่ซับซ้อนมากขึ้น?

3
glm ใน R - pvalue ใดที่แสดงให้เห็นถึงความดีของแบบเต็มรูปแบบ?
ฉันกำลังเรียกใช้ glms ใน R (โมเดลเชิงเส้นเชิงเส้นทั่วไป) ฉันคิดว่าฉันรู้จัก pvalues ​​- จนกระทั่งฉันเห็นว่าการเรียกสรุปสำหรับ glm ไม่ได้ให้ตัวแทน pvalue ที่เอาชนะคุณของโมเดลทั้งหมด - อย่างน้อยก็ไม่ได้อยู่ในตำแหน่งที่โมเดลเชิงเส้นทำ ฉันสงสัยว่าสิ่งนี้จะได้รับเป็นค่าสำหรับการสกัดกั้นที่ด้านบนของตารางค่าสัมประสิทธิ์ ดังนั้นในตัวอย่างต่อไปนี้ในขณะที่ Wind.speed .. knots และ canopy_density อาจมีความสำคัญต่อตัวแบบเราจะรู้ได้อย่างไรว่าตัวแบบนั้นสำคัญหรือไม่ ฉันจะรู้ได้อย่างไรว่าจะเชื่อใจคุณค่าเหล่านี้หรือไม่ ฉันถูกสงสัยหรือไม่ว่า Pr (> | z |) สำหรับ (Intercept) แสดงถึงความสำคัญของตัวแบบ? รุ่นนี้มีความหมายหรือไม่? ขอบคุณ! ฉันควรทราบว่าการใช้การทดสอบแบบ F จะไม่ทำให้เกิดความเสียหายเนื่องจากฉันได้รับข้อความแสดงข้อผิดพลาดที่บอกว่าการทดสอบแบบ F ในครอบครัวแบบทวินามนั้นไม่เหมาะสม Call: glm(formula = Empetrum_bin ~ Wind.speed..knots. + canopy_density, family = …

1
เป็นไปได้ไหมที่แสดงว่ารถยนต์ถูกใช้เป็นอาวุธสังหาร?
ฉันได้ยินเรื่องราวเมื่อเร็ว ๆ นี้ที่มีคนพูดว่าถ้าพวกเขาต้องการที่จะฆ่าใครสักคน (และหนีไปด้วย) พวกเขาจะทำมันด้วยรถของพวกเขา พวกเขาอ้างถึงสถิติต่าง ๆ เกี่ยวกับจำนวนผู้เสียชีวิตที่เกี่ยวข้องกับรถยนต์ (รวมถึงรถติดคนเดินเท้า) ควบคู่ไปกับสถิติเพิ่มเติมเกี่ยวกับจำนวนคนขับที่ถูกตัดสินโทษต่ออาชญากรรมประเภทใด ... blah, blah, blah คำถามของฉันคือสิ่งนี้: เป็นไปได้หรือไม่ที่จะแสดงให้เห็นว่ารถยนต์ใช้ (ทางสถิติ) เป็นอาวุธในการฆาตกรรม? กล่าวอีกนัยหนึ่งฉันตระหนักว่ามันเป็นไปไม่ได้ที่จะแสดงให้เห็นว่าจริง ๆ แล้วอุบัติเหตุทางรถยนต์ที่คนขับรถคันเดียวเป็นความพยายามหรือการกระทำที่มุ่งมั่น ค่อนข้างฉันสงสัยว่าวิธีการอาจจะจินตนาการซึ่งสามารถแสดงให้เห็นว่าร้อยละของ 'อุบัติเหตุ' เหล่านั้นจริง ๆ แล้วในทุกโอกาสไม่ใช่อุบัติเหตุเลย ...

3
การทดสอบทางสถิติเพื่อเปรียบเทียบความแม่นยำของอุปกรณ์ทั้งสอง
ฉันกำลังเปรียบเทียบอุปกรณ์ควบคุมอุณหภูมิสองอย่างที่ออกแบบมาเพื่อรักษาอุณหภูมิของร่างกายที่ 37 องศาในผู้ป่วยที่ได้รับยาสลบ อุปกรณ์ถูกติดตั้งกับผู้ป่วย 500 คนก่อตัวเป็นสองกลุ่ม กลุ่ม A (ผู้ป่วย 400 ราย) - อุปกรณ์ 1, กลุ่ม B (ผู้ป่วย 100 ราย) - อุปกรณ์ 2 ผู้ป่วยแต่ละรายมีการวัดอุณหภูมิของพวกเขาทุกๆ 36 ชั่วโมงเป็นเวลา 36 ชั่วโมงให้ข้อมูล 18,000 จุดกับทั้งสองกลุ่ม ฉันต้องตรวจสอบว่าอุปกรณ์ใดควบคุมอุณหภูมิร่างกายของผู้ป่วยอย่างแม่นยำมากขึ้นในช่วง 36 ชั่วโมง ฉันได้สร้างกราฟเส้นที่เข้าร่วมกับค่ามัธยฐาน ณ จุดแต่ละครั้งด้วยบาร์ควอไทล์และดูเหมือนว่าจะมีความแตกต่าง ฉันควรวิเคราะห์ข้อมูลเพื่อพิสูจน์ความแตกต่างทางสถิติอย่างไร

1
เหตุใดข้อผิดพลาดที่ไม่ได้กระจายทั่วไปทำให้ความถูกต้องของข้อความสำคัญของเราไม่เป็นจริง
มีการสันนิษฐานว่าเป็นเรื่องปกติเมื่อพิจารณารูปแบบของ OLS และนั่นคือข้อผิดพลาดที่ได้รับการกระจายตามปกติ ฉันเรียกดูผ่านการตรวจสอบข้ามและดูเหมือนว่า Y และ X ไม่จำเป็นต้องเป็นปกติเพื่อให้ข้อผิดพลาดเป็นปกติ คำถามของฉันคือสาเหตุที่เมื่อเรามีข้อผิดพลาดที่ไม่ได้กระจายทั่วไปความถูกต้องของข้อความสำคัญของเราถูกบุกรุก ทำไมช่วงความมั่นใจจะกว้างหรือแคบเกินไป

4
การทดสอบ t จะมีนัยสำคัญทางสถิติได้อย่างไรหากความแตกต่างเฉลี่ยเกือบ 0
ฉันกำลังพยายามเปรียบเทียบข้อมูลจากประชากร 2 คนเพื่อบอกว่าความแตกต่างระหว่างการรักษานั้นมีนัยสำคัญทางสถิติหรือไม่ ดูเหมือนว่าชุดข้อมูลจะกระจายตามปกติโดยมีความแตกต่างน้อยมากระหว่างสองชุด ความแตกต่างเฉลี่ยคือ 0.00017 ฉันทำการทดสอบแบบจับคู่โดยคาดหวังว่าฉันจะไม่ปฏิเสธสมมติฐานว่างที่ไม่ต่างกันระหว่างค่าเฉลี่ยอย่างไรก็ตามค่า t ที่คำนวณได้ของฉันนั้นสูงกว่าค่า t วิกฤตมาก

2
วิธีเปรียบเทียบค่าเฉลี่ยของสองตัวอย่างที่มีข้อมูลตรงกับการแจกแจงแบบเอ็กซ์โพเนนเชียล
ฉันมีสองตัวอย่างของข้อมูลตัวอย่างพื้นฐานและตัวอย่างการรักษา สมมติฐานคือตัวอย่างการรักษามีค่าเฉลี่ยสูงกว่าตัวอย่างพื้นฐาน ตัวอย่างทั้งสองมีรูปแบบเลขชี้กำลัง เนื่องจากข้อมูลมีขนาดค่อนข้างใหญ่ฉันจึงมีเพียงค่าเฉลี่ยและจำนวนองค์ประกอบสำหรับแต่ละตัวอย่าง ณ เวลาที่ฉันจะทำการทดสอบ ฉันจะทดสอบสมมติฐานนั้นได้อย่างไร ฉันเดาว่ามันง่ายสุด ๆ และฉันได้พบการอ้างอิงหลายอย่างเกี่ยวกับการใช้การทดสอบ F แต่ฉันไม่แน่ใจว่าพารามิเตอร์แมป

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
ความถี่อัลลีลที่สังเกตเห็นมีค่าน้อยกว่าที่คาดการณ์ไว้หรือไม่
คำถาม : ฉันจะสร้างการทดสอบเพื่อตรวจสอบได้อย่างไรว่า "ภูเขา" - ความถี่ทั้งหมด (รูปที่ 1) ที่สังเกตได้นั้นลดลงอย่างมีนัยสำคัญในภูเขากลางถึงภาคใต้มากกว่าที่ทำนายไว้ (รูปที่ 2) โดยรูปแบบการเลือกเชิงนิเวศ ( ดูรายละเอียดด้านล่าง ) ปัญหา : ความคิดเริ่มต้นของฉันคือการถดถอยส่วนที่เหลือของแบบจำลองกับละติจูด: ลองจิจูดและระดับความสูง (ซึ่งส่งผลเฉพาะการทำงานร่วมกันระหว่างละติจูดและลองจิจูดเป็นสำคัญ) ปัญหาคือสิ่งที่เหลืออยู่ (รูปที่ 3) อาจสะท้อนถึงการเปลี่ยนแปลงที่ไม่ได้อธิบายโดยแบบจำลองและ / หรือว่าเป็นสิ่งที่เกิดขึ้นทางชีวภาพเช่นอัลลีลไม่มีเวลาที่จะแพร่กระจายไปทางทิศใต้ถึงศักยภาพหรือมีอุปสรรคบางอย่างต่อการไหลของยีน หากคุณเปรียบเทียบความถี่ที่สังเกตได้ (รูปที่ 1) กับที่คาดหวัง (รูปที่ 2) มีความแตกต่างอย่างชัดเจนโดยเฉพาะอย่างยิ่งในภาคกลางถึงภูเขาทางตอนใต้ของสวีเดนและนอร์เวย์ ฉันยอมรับว่าตัวแบบอาจไม่สามารถอธิบายการเปลี่ยนแปลงทั้งหมดได้ แต่ฉันสามารถทดสอบแบบมีเหตุผลเพื่อสำรวจความคิดที่ว่าอัลลีลภูเขาไม่ถึงศักยภาพในใจกลางภูเขาทางตอนใต้หรือไม่ พื้นหลัง: ฉันมีเครื่องหมาย AFLP bi-allelic ซึ่งการกระจายความถี่ดูเหมือนว่าเกี่ยวข้องกับภูเขา (และละติจูด: ลองจิจูด) เมื่อเทียบกับที่อยู่อาศัยระดับต่ำบนคาบสมุทรสแกนดิเนเวีย (รูปที่ 1) "ภูเขา" - อัลลีลเกือบคงที่ในภาคเหนือซึ่งเป็นภูเขา มันเกือบจะหายไปหรือคงที่สำหรับ "ที่ราบลุ่ม" …

3
วิธีการเปรียบเทียบความแม่นยำของแบบจำลองที่แตกต่างกันสองแบบโดยใช้นัยสำคัญทางสถิติ
ฉันกำลังทำงานกับการทำนายอนุกรมเวลา ฉันมีสองชุดข้อมูลและ\} ฉันมีสามรูปแบบการทำนาย:M3 ทั้งหมดของรูปแบบเหล่านี้จะได้รับการฝึกฝนโดยใช้ตัวอย่างในชุดข้อมูลและประสิทธิภาพการทำงานของพวกเขาจะวัดโดยใช้กลุ่มตัวอย่างในชุดข้อมูลD2สมมติว่าตัวชี้วัดประสิทธิภาพคือ MSE (หรืออย่างอื่น) ค่า MSE ของแบบจำลองเหล่านั้นเมื่อวัดสำหรับชุดข้อมูลมีและMSE_3ฉันจะทดสอบได้อย่างไรว่าการปรับปรุงโมเดลหนึ่งเหนืออีกโมเดลหนึ่งนั้นมีนัยสำคัญทางสถิติD 1 = { x1, x2, . . . . xn}D1={x1,x2,....xn}D1=\{x_1, x_2,....x_n\}D 2 = { xn+ 1 , xn+ 2 , xn+ 3 , . . . , xn+ k }D2={xn+1,xn+2,xn+3,....,xn+k}D2=\{x_n+1, x_n+2, x_n+3,...., x_n+k\}M1 , M2 , M3M1,M2,M3M1, M2, M3D 1D1D1D 2D2D2D …

1
ทดสอบสัดส่วนและตัวจําแนกไบนารี
ฉันมีเครื่องผลิตชิ้นส่วนต้นแบบ ในการทดสอบครั้งแรกเครื่องผลิตชิ้นส่วนและลักษณนามไบนารีบอกฉันว่าd 1ส่วนมีข้อบกพร่อง ( d 1 &lt; N 1มักจะวันที่1 / N 1 &lt; 0.01และN 1 ≈ 10 4 ) และN 1 - d 1ชิ้นส่วนเป็นสิ่งที่ดียังไม่มีข้อความ1N1N_1d1d1d_1d1&lt; N1d1&lt;N1d_1 < N_1d1/ N1&lt; 0.01d1/N1&lt;0.01d_1/N_1<0.01ยังไม่มีข้อความ1≈ 104N1≈104N_1\approx10^4ยังไม่มีข้อความ1- d1N1−d1N_1-d_1 จากนั้นช่างเทคนิคจะทำการเปลี่ยนแปลงบางอย่างในเครื่องเพื่อลดจำนวนชิ้นส่วนที่บกพร่อง ในการทดสอบที่สองและต่อไปนี้การปรับเปลี่ยนเครื่องผลิตชิ้นส่วนและลักษณนามไบนารีเดียวกัน (แตะต้อง) บอกผมว่าd 2ส่วนมีข้อบกพร่องอยู่แล้ววันที่2 / N 2ค่อนข้างคล้ายกับd 1 / N 1ยังไม่มีข้อความ2N2N_2d2d2d_2d2/ N2d2/N2d_2/N_2d1/ N1d1/N1d_1/N_1 ช่างต้องการทราบว่าการเปลี่ยนแปลงของเขามีประสิทธิภาพหรือไม่ สมมติว่าตัวแยกประเภทสมบูรณ์แบบ (ความไวของมันคือ 100% และความเฉพาะเจาะจงของมันคือ …

3
เกณฑ์สำหรับสัมประสิทธิ์สหสัมพันธ์เพื่อระบุนัยสำคัญทางสถิติของสหสัมพันธ์ในเมทริกซ์สหสัมพันธ์
ฉันได้คำนวณเมทริกซ์สหสัมพันธ์ของชุดข้อมูลซึ่งมีจุดข้อมูล 455 จุดแต่ละจุดมี 14 ลักษณะ ดังนั้นมิติของเมทริกซ์สหสัมพันธ์จึงเท่ากับ 14 x 14 ฉันสงสัยว่ามีเกณฑ์สำหรับค่าของสัมประสิทธิ์สหสัมพันธ์ซึ่งชี้ให้เห็นว่ามีความสัมพันธ์อย่างมีนัยสำคัญระหว่างสองของลักษณะเหล่านั้น ฉันมีค่าอยู่ระหว่าง -0.2 ถึง 0.85 และฉันคิดว่าสิ่งสำคัญคือสิ่งที่สูงกว่า 0.7 มีค่าทั่วไปสำหรับค่าสัมประสิทธิ์สหสัมพันธ์ซึ่งควรได้รับการพิจารณาสำหรับเกณฑ์หรือเป็นเพียงบริบทขึ้นอยู่กับชนิดข้อมูลที่ฉันกำลังตรวจสอบ?

1
ใช้ kurtosis เพื่อประเมินความสำคัญขององค์ประกอบจากการวิเคราะห์องค์ประกอบอิสระ
ในค่าลักษณะเฉพาะ PCA กำหนดลำดับของส่วนประกอบ ใน ICA ฉันใช้ kurtosis เพื่อรับการสั่งซื้อ มีวิธีการใดบ้างที่ได้รับการยอมรับในการประเมินจำนวน (เนื่องจากฉันมีคำสั่งซื้อ) ของส่วนประกอบที่แตกต่างจากความรู้ก่อนหน้าเกี่ยวกับสัญญาณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.