คำถามติดแท็ก hypothesis-testing

การทดสอบสมมติฐานจะประเมินว่าข้อมูลไม่สอดคล้องกับสมมติฐานที่กำหนดแทนที่จะเป็นผลของความผันผวนแบบสุ่มหรือไม่

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
เราสามารถเปรียบเทียบความสัมพันธ์ระหว่างกลุ่มโดยการเปรียบเทียบความชันถดถอยได้หรือไม่?
ในคำถามนี้พวกเขาถามวิธีเปรียบเทียบ Pearson r สำหรับกลุ่มอิสระสองกลุ่ม (เช่นเพศชายและหญิง) ตอบและแสดงความคิดเห็นแนะนำสองวิธี: ใช้สูตรที่รู้จักกันดีของฟิชเชอร์โดยใช้ "z-tranformation" ของ r; ใช้การเปรียบเทียบความชัน (สัมประสิทธิ์การถดถอย) หลังสามารถทำได้อย่างง่ายดายเพียงแค่ผ่านโมเดลเชิงเส้นอิ่มตัว: Y= a + b X+ c G + dXGY=a+bX+cG+dXGY = a + bX + cG + dXGที่ไหน XXX และ YYY เป็นตัวแปรที่มีความสัมพันธ์และ GGGเป็นตัวแปรดัมมี่ (0 vs 1) ที่ระบุถึงสองกลุ่ม ขนาดของddd (ค่าสัมประสิทธิ์การโต้ตอบ) คือความแตกต่างของสัมประสิทธิ์ bbb หลังจากรูปแบบ Y=a+bXY=a+bXY = a + bX ดำเนินการในสองกลุ่มเป็นรายบุคคลและ …

2
การทดสอบตามฤดูกาลของอนุกรมเวลา
การทดสอบฤดูกาลที่ง่ายที่สุดสำหรับอนุกรมเวลาคืออะไร? เฉพาะเจาะจงมากขึ้นฉันต้องการทดสอบว่าspecific time series the seasonal componentมีความหมายหรือไม่ แพ็คเกจที่แนะนำใน Python / R คืออะไร?

2
จะทดสอบอย่างไรว่า
สมมติว่าฉันมีสามกลุ่มอิสระด้วยค่าเฉลี่ย μ1, μ2, μ3μ1, μ2, μ3\mu_1,~ \mu_2,~\mu_3 ตามลำดับ ฉันจะทดสอบได้อย่างไร μ1&lt;μ2&lt;μ3μ1&lt;μ2&lt;μ3\mu_1 < \mu_2 <\mu_3 หรือไม่ใช้ n1, n2, n3n1, n2, n3n_1,~n_2,~n_3 ตัวอย่างจากแต่ละกลุ่ม? ฉันต้องการทราบวิธีการทั่วไปบางอย่างไม่ใช่การคำนวณแบบละเอียด ฉันไม่สามารถหาวิธีตั้งสมมติฐานได้H0H0H_0 และ H1H1H_1.

2
เราสามารถปฏิเสธสมมติฐานว่างที่มีช่วงความมั่นใจที่เกิดจากการสุ่มตัวอย่างมากกว่าสมมติฐานว่างได้หรือไม่?
ฉันได้รับการสอนว่าเราสามารถสร้างการประมาณค่าพารามิเตอร์ในรูปแบบของช่วงความมั่นใจหลังจากการสุ่มตัวอย่างจากประชากร ตัวอย่างเช่นช่วงความเชื่อมั่น 95% ที่ไม่มีการละเมิดสมมติฐานควรมีอัตราความสำเร็จ 95% ของการบรรจุสิ่งที่พารามิเตอร์จริงที่เราประเมินอยู่ในประชากร กล่าวคือ สร้างการประมาณจุดจากตัวอย่าง สร้างช่วงของค่าที่ในทางทฤษฎีมีโอกาส 95% ในการเก็บค่าจริงที่เราพยายามประเมิน อย่างไรก็ตามเมื่อหัวข้อได้เปลี่ยนเป็นการทดสอบสมมติฐานขั้นตอนต่าง ๆ ได้อธิบายไว้ดังต่อไปนี้: สมมติว่าพารามิเตอร์บางตัวเป็นสมมติฐานว่าง สร้างการแจกแจงความน่าจะเป็นของความน่าจะเป็นที่จะได้รับการประเมินจุดต่าง ๆ เนื่องจากสมมติฐานว่างนี้เป็นจริง ปฏิเสธสมมติฐานว่างถ้าจุดประเมินที่เราได้รับนั้นจะเกิดขึ้นน้อยกว่า 5% ของเวลาถ้าสมมุติฐานว่างเป็นจริง คำถามของฉันคือ: จำเป็นหรือไม่ที่จะต้องสร้างช่วงความเชื่อมั่นของเราโดยใช้สมมติฐานว่างเพื่อปฏิเสธค่าว่าง? ทำไมไม่เพียงแค่ทำขั้นตอนแรกและรับค่าประมาณของพารามิเตอร์จริง (ไม่ได้ใช้ค่าที่เราตั้งสมมติฐานไว้ในการคำนวณช่วงความเชื่อมั่น) แล้วปฏิเสธสมมติฐานว่างถ้ามันไม่ได้อยู่ในช่วงนี้? ดูเหมือนว่าจะมีเหตุผลเทียบเท่ากับฉันอย่างสังหรณ์ใจ แต่ฉันกลัวว่าฉันขาดอะไรบางอย่างที่เป็นพื้นฐานเพราะอาจมีเหตุผลที่สอนวิธีนี้

4
ฉันจะตรวจสอบว่าสองสหสัมพันธ์มีความแตกต่างอย่างมีนัยสำคัญได้อย่างไร
ฉันต้องการพิจารณาว่าชุดข้อมูลสองชุดใด (B1, B2) ดีกว่าสัมพันธ์ (pearsons r) กับชุดอื่น (A) ไม่มีข้อมูลในชุดข้อมูลทั้งหมด ฉันจะทราบได้อย่างไรว่าความสัมพันธ์ที่เกิดขึ้นมีความแตกต่างอย่างมีนัยสำคัญหรือไม่? เช่นค่า 8426 มีทั้ง A และ B1, r = 0.74 8798 มีอยู่ทั้ง A และ B2, r = 0.72 ฉันคิดว่าคำถามนี้อาจช่วยได้ แต่ก็ยังไม่ได้รับคำตอบ: จะรู้ได้อย่างไรว่าระบบหนึ่งดีกว่าอีกระบบหนึ่งอย่างมาก

6
การใช้ค่า p เพื่อคำนวณความน่าจะเป็นของสมมติฐานที่เป็นจริง ต้องการอะไรอีก
คำถาม: ความเข้าใจผิดอย่างหนึ่งที่พบบ่อยของค่า p คือพวกมันเป็นตัวแทนของความน่าจะเป็นของสมมติฐานว่างเปล่าที่เป็นจริง ฉันรู้ว่าไม่ถูกต้องและฉันรู้ว่าค่า p แสดงถึงความน่าจะเป็นในการหาตัวอย่างมากเช่นนี้เนื่องจากสมมติฐานว่างเป็นจริง อย่างไรก็ตามอย่างสังหรณ์ใจคนหนึ่งควรจะได้รับมาจากคนหลัง ต้องมีเหตุผลว่าทำไมไม่มีใครทำเช่นนี้ ข้อมูลใดที่เราขาดหายไปซึ่ง จำกัด เราจากการได้รับความน่าจะเป็นของสมมติฐานที่เป็นจริงจากค่า p และข้อมูลที่เกี่ยวข้อง? ตัวอย่าง: สมมติฐานของเราคือ "วิตามินดีส่งผลต่ออารมณ์" (สมมติฐานว่างเปล่าว่าเป็น "ไม่มีผล") สมมติว่าเราทำการศึกษาทางสถิติที่เหมาะสมกับ 1,000 คนและค้นหาความสัมพันธ์ระหว่างอารมณ์และระดับวิตามิน สิ่งอื่น ๆ ที่เท่าเทียมกันค่า p-0.01 บ่งชี้ความเป็นไปได้ของสมมติฐานที่แท้จริงสูงกว่าค่า p-0.05 สมมุติว่าเราได้ค่า p เป็น 0.05 ทำไมเราไม่สามารถคำนวณความน่าจะเป็นจริงที่สมมติฐานของเราเป็นจริงได้ ข้อมูลอะไรที่เราขาดหายไป? คำศัพท์สำรองสำหรับนักสถิติประจำ: หากคุณยอมรับหลักฐานของคำถามของฉันคุณสามารถหยุดอ่านได้ที่นี่ ต่อไปนี้สำหรับผู้ที่ปฏิเสธที่จะยอมรับว่าสมมติฐานสามารถมีการตีความความน่าจะเป็น เรามาลืมคำศัพท์กันสักครู่ แทน... สมมติว่าคุณกำลังเดิมพันกับเพื่อนของคุณ เพื่อนของคุณแสดงการศึกษาทางสถิตินับพันเกี่ยวกับวิชาที่ไม่เกี่ยวข้อง สำหรับการศึกษาแต่ละครั้งคุณจะได้รับอนุญาตให้ดูที่ p-value ขนาดตัวอย่างและค่าเบี่ยงเบนมาตรฐานของตัวอย่าง สำหรับการศึกษาแต่ละครั้งเพื่อนของคุณเสนอโอกาสที่จะเดิมพันว่าสมมติฐานที่นำเสนอในการศึกษาเป็นจริง คุณสามารถเลือกที่จะเดิมพันหรือไม่ก็ได้ หลังจากที่คุณทำการเดิมพันสำหรับการศึกษาทั้งหมด 1,000 ครั้งแล้วออราเคิลก็ขึ้นไปหาคุณและบอกคุณว่าสมมติฐานใดถูกต้อง ข้อมูลนี้ช่วยให้คุณสามารถตัดสินการเดิมพัน …

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
พลังของการทดลองชิมชาเลดี้
ในการทดสอบที่มีชื่อเสียงของฟิชเชอร์สิ่งที่สังเกตได้คือจำนวนถ้วยเดาที่ถูกต้องkkk มีถ้วยสองแบบ AAA และ BBB. โดยปกติแล้วมันเป็นเรื่องที่น่าสนใจในการคำนวณภูมิภาคที่สำคัญเพื่อปฏิเสธสมมติฐานว่าง (ผู้หญิงคาดเดาแบบสุ่ม) ตามขนาดของการทดสอบαα\alpha. สิ่งนี้ทำได้อย่างง่ายดายโดยใช้การแจกแจงแบบไฮเพอร์เมตริกซ์ ในทำนองเดียวกันฉันสามารถคำนวณขนาดของการทดสอบที่กำหนดในพื้นที่วิกฤติ คำถามที่แตกต่างคือ: วิธีการคำนวณพลังของการทดสอบให้ตั้งสมมติฐานทางเลือก? สมมติว่าผู้หญิงสามารถเดาได้อย่างถูกต้องด้วยความน่าจะเป็นในถ้วยเดียวp = 90 %p=90%p=90\% (P( คาดเดาA |จริงA ) = P( เดา B |จริง B ) = 0.9P(guessA|trueA)=P(guess B|true B)=0.9P(\text{guess} A|\text{true} A)=P(\text{guess } B|\text{true } B)=0.9) พลังของการทดสอบคืออะไรสมมติว่าจำนวนถ้วยเท่ากับยังไม่มีข้อความ= 8N=8N=8 และจำนวนหนึ่งถ้วยทั้งหมด n = N/ 2=4n=N/2=4n=N/2=4? (น่าเสียดาย) ผู้หญิงรู้nnn. กล่าวอีกนัยหนึ่ง: การกระจายตัวของคืออะไร k =k=k=(จำนวนถ้วยที่ถูกต้องภายใต้สมมติฐานทางเลือก) …

7
หากผู้ป่วยทดสอบ 1,000 รายไม่ได้รับการรักษาให้หายขาดเราไม่สามารถพูดได้ว่าเรายอมรับสมมติฐานว่างหรือไม่
ในหลาย ๆ ที่ฉันได้อ่านว่าเราไม่สามารถพูดได้ว่าเรา "ยอมรับ" สมมติฐานว่าง แต่เราต้องบอกว่าเรา "ไม่สามารถปฏิเสธ" สมมติฐานว่างได้ แต่ฉันไม่เห็นว่าสแควร์สกับตัวอย่างง่ายๆนี้: สมมติว่าเรากำลังทดสอบยาที่ควรรักษาโรคเบาหวานได้อย่างสมบูรณ์ภายใน 24 ชั่วโมง เราลองใช้กับคนไข้ 1,000 คนและพวกเขาทั้งหมดยังเป็นเบาหวานหลังจากทานยา เห็นได้ชัดหรือไม่ว่ายานี้ไม่รักษาโรคเบาหวาน? นั่นคือเรายอมรับสมมติฐานว่างหรือไม่ แน่นอนฉันจะไม่เชื่อในยานี้ สมมติฐานที่ว่างเปล่า: ยาเสพติดไม่มีผลกระทบต่อผู้ป่วย สมมติฐานทางเลือก: ยารักษาโรคเบาหวาน

5
การทดสอบสมมติฐานปัวซองสำหรับสองพารามิเตอร์
ดังนั้นเพื่อความสนุกฉันกำลังรับข้อมูลการโทรจาก call center ที่ฉันทำงานและพยายามทำการทดสอบสมมติฐานกับพวกเขาโดยเฉพาะจำนวนการโทรที่ได้รับในหนึ่งสัปดาห์และใช้การกระจาย Poisson เพื่อให้เหมาะสม เนื่องจากหัวข้อของงานของฉันมีสองประเภทของสัปดาห์ให้เรียกหนึ่งของพวกเขาในสัปดาห์ที่ฉันตั้งสมมติฐานว่ามีการโทรมากขึ้นและนอกสัปดาห์ที่ฉันตั้งสมมติฐานมีน้อย ฉันมีทฤษฎีที่จากเมื่อสัปดาห์ที่แล้ว (เรียกมันว่า ) มีขนาดใหญ่กว่าของหนึ่งในช่วงนอกสัปดาห์ (เรียกว่า )λλ\lambdaλ1λ1\lambda_1λ2λ2\lambda_2 สมมติฐานที่ฉันต้องการทดสอบคือH0:λ1&gt;λ2,H1:λ1≤λ2H0:λ1&gt;λ2,H1:λ1≤λ2H_0: \lambda_1 > \lambda_2, H_1: \lambda_1 \leq \lambda_2 ฉันรู้วิธีทดสอบพารามิเตอร์หนึ่งตัว (เช่น ) แต่ก็ไม่แน่ใจว่าจะทำอย่างไร 2 เมื่อได้รับชุดข้อมูล สมมติว่าฉันใช้ข้อมูลสองสัปดาห์จากแต่ละและสำหรับนอกสัปดาห์และและสำหรับสัปดาห์ มีใครช่วยฉันหน่อยได้ไหมว่ารุ่นที่ง่ายกว่านี้ซึ่งฉันสามารถนำไปใช้กับชุดข้อมูลที่ใหญ่กว่าได้ ความช่วยเหลือใด ๆ ที่ชื่นชมขอบคุณH0:λ1&gt; 1 ,H1:λ1≤ 1H0:λ1&gt;1,H1:λ1≤1H_0: \lambda_1 > 1, H_1: \lambda_1 \leq 1 X1= 2X1=2X_1 = 2X2= 3X2=3X_2 = 3Y1= 2Y1=2Y_1 …

6
อะไรเป็นตัวอย่างที่ดีในการแสดงให้กับนักศึกษาระดับปริญญาตรี
ฉันจะสอนสถิติในฐานะผู้ช่วยสอนในครึ่งหลังของภาคการศึกษานี้ให้กับนักศึกษาระดับปริญญาตรี CS นักเรียนส่วนใหญ่เข้าชั้นเรียนไม่มีแรงจูงใจที่จะเรียนวิชานี้และรับเฉพาะวิชาที่จำเป็นเท่านั้น ฉันต้องการทำให้เรื่องน่าสนใจและมีประโยชน์ไม่ใช่แค่ชั้นเรียนที่พวกเขาเรียนรู้เพื่อรับ B + เพื่อผ่าน ในฐานะนักเรียนปริญญาเอกคณิตศาสตร์ที่บริสุทธิ์ฉันรู้เพียงเล็กน้อยเกี่ยวกับการประยุกต์ใช้ในชีวิตจริง ฉันต้องการขอใบสมัครเกี่ยวกับสถิติระดับปริญญาตรีในชีวิตจริง ตัวอย่างฉันกำลังมองหาเป็นคน (ในจิตวิญญาณ) เช่น: 1) การแสดงทฤษฎีขีด จำกัด กลางมีประโยชน์สำหรับข้อมูลตัวอย่างขนาดใหญ่บางอย่าง 2) จัดทำตัวอย่างโต้ตอบที่ทฤษฎีบทขีด จำกัด กลางใช้ไม่ได้ (กล่าวถึงทฤษฎีที่ตามหลังการแจกแจงโคชี) 3) แสดงให้เห็นว่าการทดสอบสมมติฐานทำงานอย่างไรในตัวอย่างชีวิตจริงที่มีชื่อเสียงโดยใช้ Z-test, t-test หรือบางอย่าง 4) แสดงให้เห็นว่าสมมติฐานเบื้องต้นที่เกินความจริงหรือผิดสามารถให้ผลลัพธ์ที่ผิดได้อย่างไร 5) แสดงให้เห็นว่า p-value และช่วงเวลาความเชื่อมั่นทำงานอย่างไรในกรณีที่รู้จักกันดีในชีวิตจริง 6) ทำนองเดียวกันประเภท I, ข้อผิดพลาดประเภท II, กำลังสถิติ, ระดับการปฏิเสธ , ฯลฯαα\alpha ปัญหาของฉันคือว่าในขณะที่ฉันมีตัวอย่างมากมายเกี่ยวกับความน่าจะเป็น (ทอยเหรียญ, ทอยลูกเต๋า, ทำลายนักการพนัน, martingales, สุ่มเดิน, เส้นขนานของนักโทษสามคน, ปัญหามอนตี้ฮอลล์, วิธีน่าจะเป็นในการออกแบบอัลกอริทึม …

1
คำถามเกี่ยวกับสมมติฐานทั่วไปของ t-test
สำหรับการทดสอบ t ตามข้อความส่วนใหญ่มีข้อสันนิษฐานว่าโดยทั่วไปข้อมูลประชากรจะถูกกระจายออกไป ฉันไม่เห็นว่าทำไม t-test ไม่เพียงต้องการให้การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างแจกจ่ายตามปกติไม่ใช่ประชากรใช่หรือไม่ หากเป็นกรณีที่การทดสอบ t ในที่สุดต้องการความเป็นมาตรฐานในการแจกแจงตัวอย่างประชากรก็จะมีลักษณะเหมือนการกระจายตัวใช่ไหม? ตราบใดที่มีขนาดตัวอย่างที่เหมาะสม นั่นไม่ใช่ทฤษฎีบทขีด จำกัด กลางหรือไม่? (ฉันหมายถึงที่นี่เพื่อทดสอบตัวอย่างหนึ่งตัวอย่างหรือเป็นอิสระ)

1
อะไรคือความแตกต่างระหว่าง "การทดสอบสมมติฐานทางสถิติที่ไม่มีสมมติฐาน" และแบบทดสอบอื่น ๆ
หัวข้อร้อนแรงล่าสุดของการอภิปรายเกี่ยวข้องกับวารสารห้ามการใช้ "ขั้นตอนการทดสอบทางสถิติสมมติฐานว่าง (NHSTPs)" จากบทความที่ส่งไปยังวารสาร ฉันเห็นคำนี้ที่นักเขียนบางคนใช้ แต่ฉันไม่เข้าใจว่าพวกเขากำลังพยายามสร้างความแตกต่างอะไร NHSTP นั้นแตกต่างจาก "การทดสอบสมมติฐาน" หรือ "การทดสอบนัยสำคัญ" หรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.