คำถามติดแท็ก hypothesis-testing

การทดสอบสมมติฐานจะประเมินว่าข้อมูลไม่สอดคล้องกับสมมติฐานที่กำหนดแทนที่จะเป็นผลของความผันผวนแบบสุ่มหรือไม่

3
การใช้คอมพิวเตอร์จำลองเพื่อเข้าใจแนวคิดทางสถิติในระดับบัณฑิตศึกษา
สวัสดีฉันกำลังเรียนหลักสูตรบัณฑิตศึกษาในสถิติและเราได้ครอบคลุมสถิติการทดสอบและแนวคิดอื่น ๆ อย่างไรก็ตามฉันมักจะสามารถใช้สูตรและพัฒนาสัญชาตญาณเกี่ยวกับวิธีการทำงาน แต่ฉันมักจะรู้สึกว่าถ้าฉันสำรองการศึกษาของฉันด้วยการทดลองจำลองฉันจะพัฒนาสัญชาตญาณเป็นปัญหาที่มือ . ดังนั้นฉันจึงคิดว่าจะเขียนแบบจำลองง่าย ๆ เพื่อให้เข้าใจแนวคิดบางอย่างที่เราพูดถึงในชั้นเรียนได้ดีขึ้น ตอนนี้ฉันสามารถใช้พูด Java เพื่อ: สร้างประชากรสุ่มโดยมีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน จากนั้นนำตัวอย่างเล็ก ๆ และลองพยายามคำนวณข้อผิดพลาด Type-I และ Type-II เชิงประจักษ์ ตอนนี้คำถามที่ฉันมีคือ: นี่เป็นวิธีที่ถูกต้องตามกฎหมายในการพัฒนาสัญชาตญาณหรือไม่? มีซอฟต์แวร์ให้ทำเช่นนี้SASหรือRไม่? นี่เป็นวินัยในสถิติที่เกี่ยวข้องกับการเขียนโปรแกรมเช่น: สถิติการทดลองหรือไม่, สถิติการคำนวณ? จำลอง?

5
ฉันสามารถทดสอบสมมติฐานหาข้อมูลปกติได้หรือไม่
ฉันมีการรวบรวมข้อมูลซึ่ง แต่เดิมฉันคิดว่ามันถูกแจกจ่ายตามปกติ จากนั้นฉันก็ดูมันและตระหนักว่าไม่ใช่เพราะส่วนใหญ่เป็นข้อมูลที่เบ้และฉันก็ทำการทดสอบ shapiro-wilks ด้วย ฉันยังต้องการวิเคราะห์โดยใช้วิธีการทางสถิติและฉันต้องการทดสอบสมมติฐานสำหรับความเบ้ ดังนั้นฉันอยากทราบว่ามีวิธีทดสอบความเป็นปรกติหรือไม่และถ้าเป็นไปได้ห้องสมุดที่ทำแบบทดสอบให้ฉัน

2
การหาจำนวนของ gaussians ในส่วนผสม จำกัด กับทฤษฎีบทของ Wilks?
สมมติว่าผมมีชุดของอิสระสังเกต univariate กันกระจายและสองสมมติฐานเกี่ยวกับวิธีการถูกสร้าง:xxxxxx H0H0H_0 : มาจากการแจกแจงแบบเกาส์เดียวโดยไม่ทราบค่าเฉลี่ยและความแปรปรวนxxx HAHAH_A : มาจากการผสมผสานของสอง Gaussians ที่ไม่ทราบค่าเฉลี่ยความแปรปรวนและสัมประสิทธิ์การผสมxxx หากฉันเข้าใจอย่างถูกต้องนี่เป็นแบบจำลองที่ซ้อนกันเนื่องจากแบบจำลองที่หมายถึงสามารถอธิบายได้ในแง่ของหากคุณ จำกัด พารามิเตอร์ของ Gaussians ทั้งสองให้เหมือนกันหรือ จำกัด สัมประสิทธิ์การผสมให้เป็นศูนย์สำหรับหนึ่งในสอง Gaussians H0H0H_0HAHAH_A ดังนั้นดูเหมือนว่าคุณจะสามารถใช้อัลกอริทึม EM เพื่อประเมินพารามิเตอร์ของแล้วใช้ทฤษฎีบทของวิลก์สเพื่อพิจารณาว่าโอกาสของข้อมูลภายใต้นั้นสูงกว่าของอย่างมีนัยสำคัญไม่ มีความเชื่อเล็กน้อยในข้อสันนิษฐานว่าอัลกอริทึม EM จะมาบรรจบกันกับความเป็นไปได้สูงสุดที่นี่ แต่เป็นสิ่งที่ฉันยินดีทำHAHAH_AHAHAH_AH0H0H_0 ฉันลองสิ่งนี้ในการจำลอง monte carlo โดยสมมติว่ามีอิสระมากกว่า 3 องศา H 0 (ค่าเฉลี่ยและความแปรปรวนสำหรับ Gaussian ที่สองและพารามิเตอร์การผสม) เมื่อฉันจำลองข้อมูลจาก H 0ฉันได้รับการแจกแจงแบบ P-value ที่ไม่สม่ำเสมอและได้รับการเสริมคุณค่าสำหรับค่า P ขนาดเล็ก (หาก EM ไม่ได้มาบรรจบกันกับความเป็นไปได้สูงสุดที่แท้จริงจะมีสิ่งตรงกันข้ามเกิดขึ้นแน่นอน) เกิดอะไรขึ้นกับการประยุกต์ใช้ทฤษฎีบทของวิลก์สที่สร้างอคตินี้HAHAH_AH0H0H_0H0H0H_0

2
ความเหมาะสมของ Wilcoxon ลงนามทดสอบระดับ
ฉันแหย่ไปรอบ ๆ ในจดหมายเหตุตรวจสอบความถูกต้องของ Cross และดูเหมือนจะไม่พบคำตอบสำหรับคำถามของฉัน คำถามของฉันมีดังต่อไปนี้: Wikipedia ให้ข้อสมมติฐานสามข้อที่จำเป็นสำหรับการทดสอบระดับวิลคอกซันที่ลงนาม (แก้ไขเล็กน้อยสำหรับคำถามของฉัน): ให้ Zi = Xi-Yi สำหรับ i = 1, ... , n ความแตกต่างของ Zi นั้นถือว่าเป็นอิสระ (a.) Zi แต่ละคนมาจากประชากรที่ต่อเนื่องกันและ (b.) Zi แต่ละคนมีความสมมาตรเกี่ยวกับค่ามัธยฐานทั่วไป ค่าที่ตัวแทน Xi และ Yi ถูกสั่ง ... ดังนั้นการเปรียบเทียบ 'มากกว่า', 'น้อยกว่า' และ 'เท่ากับ' มีประโยชน์ เอกสารประกอบสำหรับ? wilcox.test ใน R อย่างไรก็ตามดูเหมือนว่าบ่งชี้ว่า (2.b) เป็นสิ่งที่ทดสอบโดยขั้นตอนจริง: "... หากทั้ง …

2
พลังของการทดสอบการถดถอย F คืออะไร?
การทดสอบ F แบบคลาสสิกสำหรับชุดย่อยของตัวแปรในการถดถอยหลายชั้นมีรูปแบบ ที่SSE(R)คือผลรวมของความคลาดเคลื่อนกำลังสองภายใต้โมเดล 'ลดลง' ซึ่งทำรังอยู่ภายใน 'ใหญ่' รุ่นBและdfคือองศาอิสระของทั้งสองโมเดล ภายใต้สมมติฐานว่างว่าตัวแปรพิเศษในโมเดล 'ใหญ่' ไม่มีกำลังอธิบายเชิงเส้นสถิติจะถูกกระจายเป็น F กับdfR-dfBและdfBองศาอิสระF=(SSE(R)−SSE(B))/(dfR−dfB)SSE(B)/dfB,F=(SSE(R)−SSE(B))/(dfR−dfB)SSE(B)/dfB, F = \frac{(\mbox{SSE}(R) - \mbox{SSE}(B))/(df_R - df_B)}{\mbox{SSE}(B)/df_B}, SSE(R)SSE(R)\mbox{SSE}(R)BBBdfdfdfdfR−dfBdfR−dfBdf_R - df_BdfBdfBdf_B การกระจายตัวคืออะไรภายใต้ทางเลือก ฉันคิดว่ามันไม่ใช่แบบกึ่งกลาง F (ฉันหวังว่าจะไม่ใช่แบบไม่เป็นศูนย์กลางเป็นสองเท่า) แต่ฉันไม่สามารถค้นหาการอ้างอิงใด ๆ ว่าพารามิเตอร์ที่ไม่ใช่ศูนย์กลางคืออะไร ฉันจะคิดว่ามันขึ้นอยู่กับการถดถอยจริงค่าสัมประสิทธิ์และอาจจะเกี่ยวกับการออกแบบเมทริกซ์Xแต่นอกเหนือจากนั้นผมไม่แน่ใจว่าββ\betaXXX

3
ความแตกต่างระหว่างคะแนน Z และค่า p คืออะไร?
ในอัลกอริธึม motif ของเครือข่ายดูเหมือนว่าเป็นเรื่องธรรมดาที่จะส่งคืนทั้งค่าpและค่าคะแนน Zสำหรับสถิติ: "เครือข่ายอินพุตมีสำเนา X ของกราฟย่อย G" กราฟย่อยจะถือว่าเป็นบรรทัดฐานถ้ามันเป็นที่พอใจ p-value <A, คะแนน Z> B และ X> C สำหรับผู้ใช้ที่กำหนด (หรือชุมชนที่กำหนด) A, B และ C สิ่งนี้กระตุ้นให้เกิดคำถาม: คำถาม : p-value และ Z-score ต่างกันอย่างไร และคำถามย่อย: คำถาม : มีสถานการณ์ที่ p-value และ Z-score ของสถิติเดียวกันอาจแนะนำสมมุติฐานตรงกันข้ามหรือไม่? เงื่อนไขที่หนึ่งและสองที่ระบุไว้ข้างต้นเป็นเงื่อนไขเดียวกันหรือไม่?

3
วิธีการตรวจสอบที่หนึ่งคือการศึกษาที่ดีขึ้นเมื่อพวกเขาให้ผลลัพธ์ที่ขัดแย้งกัน?
คุณมักจะเจอเจอกับสื่อต่าง ๆ ที่สรุปผลการวิจัยในทิศทางตรงกันข้าม สิ่งเหล่านี้อาจเกี่ยวข้องกับการทดสอบยาตามใบสั่งแพทย์ใหม่หรือประโยชน์ของสารอาหารที่เฉพาะเจาะจงหรือสิ่งอื่นใดสำหรับเรื่องนั้น เมื่อการศึกษาสองแบบนั้นมาถึงผลลัพธ์ที่ขัดแย้งกันคุณจะบอกได้อย่างไรว่าหนึ่งในสองนั้นใกล้เคียงกับความจริงมากที่สุด

2
p-values“ เสรี”
คำถามของฉันค่อนข้างมีความหมาย เมื่อเมธอดสร้างค่า p สูงเป็นประจำจะเรียกว่าการอนุรักษ์ คุณจะเรียกสิ่งที่ตรงกันข้ามนั่นคือวิธีการที่มีอัตราการพิมพ์ผิดพลาดสูงหรือไม่?

1
R / mgcv: เพราะเหตุใดผลิตภัณฑ์ te () และ ti () เทนเซอร์จึงให้พื้นผิวที่แตกต่างกัน
mgcvแพคเกจสำหรับการRมีสองฟังก์ชั่นสำหรับการปฏิสัมพันธ์กระชับเมตริกซ์ผลิตภัณฑ์: และte() ti()ฉันเข้าใจการแบ่งขั้นพื้นฐานของการใช้แรงงานระหว่างคนทั้งสอง (ปรับให้เหมาะสมกับการทำงานแบบไม่เป็นเชิงเส้นเปรียบเทียบกับการย่อยสลายการโต้ตอบนี้เป็นผลกระทบหลักและการโต้ตอบ) สิ่งที่ฉันไม่เข้าใจคือสาเหตุte(x1, x2)และti(x1) + ti(x2) + ti(x1, x2)อาจให้ผลลัพธ์ที่แตกต่าง (เล็กน้อย) MWE (ดัดแปลงมาจาก?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
จะเลือกระหว่างการทดสอบการลงชื่อกับการทดสอบการจัดอันดับของวิลคอกซันได้อย่างไร
ฉันพยายามเลือกหนึ่งจากการทดสอบทั้งสองนี้เพื่อวิเคราะห์ข้อมูลที่จับคู่ ไม่มีใครรู้กฎของหัวแม่มือเกี่ยวกับที่จะเลือกโดยทั่วไป?

2
การทดสอบแบบฟิชเชอร์มีการกระจายแบบใด
ในงานของฉันฉันได้เห็นการทดสอบที่แม่นยำของฟิชเชอร์หลายครั้งและฉันสงสัยว่ามันเหมาะกับข้อมูลของฉันมากแค่ไหน เมื่อดูที่หลายแหล่งฉันเข้าใจวิธีคำนวณสถิติ แต่ไม่เคยเห็นคำอธิบายที่ชัดเจนและเป็นทางการของสมมติฐานว่าง ใครสามารถช่วยอธิบายหรือแนะนำฉันให้อธิบายอย่างเป็นทางการเกี่ยวกับการแจกแจงที่สันนิษฐานได้? จะขอบคุณสำหรับคำอธิบายในแง่ของค่าในตารางฉุกเฉิน

2
เป็นไปได้หรือไม่ที่จะยอมรับสมมติฐานทางเลือก
ฉันรู้คำถามที่เกี่ยวข้องหลายที่นี่ (เช่นสมมติฐานการทดสอบคำศัพท์ null รอบ , มันเป็นไปได้ที่จะพิสูจน์สมมติฐาน? ) แต่ผมไม่ทราบว่าคำตอบที่ชัดเจนสำหรับคำถามของฉันด้านล่าง สมมติว่าการทดสอบสมมติฐานที่เราต้องการทดสอบว่าเหรียญนั้นยุติธรรมหรือไม่ เรามีสองสมมติฐาน: H0:p(head)=0.5H0:p(head)=0.5H_0: p(head)=0.5 H1:p(head)≠0.5H1:p(head)≠0.5H_1: p(head)\neq0.5 สมมติว่าเราใช้ระดับนัยสำคัญ 5% มีสองกรณีที่เป็นไปได้: เมื่อเราได้รับข้อมูลและพบว่าค่า p น้อยกว่า 0.05 เราจะพูดว่า "ด้วยระดับนัยสำคัญ 5% เราจะปฏิเสธ "H0H0H_0 p-value มากกว่า 0.05 จากนั้นเราพูดว่า "ด้วยระดับนัยสำคัญ 5% เราไม่สามารถปฏิเสธ "H0H0H_0 คำถามของฉันคือ: ในกรณีที่ 1 ถูกต้องหรือไม่ที่จะพูดว่า "เรายอมรับ "H1H1H_1 อย่างสังหรณ์ใจและจากสิ่งที่ฉันได้เรียนรู้ในอดีตฉันรู้สึกว่า "การยอมรับ" อะไรก็ตามที่เป็นผลมาจากการทดสอบสมมติฐานนั้นไม่ถูกต้องเสมอไป ในอีกกรณีหนึ่งเนื่องจากสหภาพในของครอบคลุม "พื้นที่" ทั้งหมด "ปฏิเสธ " และ "ยอมรับH0H0H_0H1H1H_1H0H0H_0 …

4
การทดสอบทางสถิติที่รวมความไม่แน่นอนของการวัด
สมมติว่าฉันได้รับการวัดมวลสองกลุ่ม (เป็น mg) ซึ่งเรียกว่า y1 และ y2 ฉันต้องการทดสอบเพื่อดูว่าตัวอย่างทั้งสองนั้นมาจากประชากรที่มีวิธีการต่างกันหรือไม่ ตัวอย่างเช่นนี้ (ใน R): y1 <- c(10.5,2.9,2.0,4.4,2.8,5.9,4.2,2.7,4.7,6.6) y2 <- c(3.8,4.3,2.8,5.0,9.3,6.0,7.6,3.8,6.8,7.9) t.test(y1,y2) ฉันได้ค่า p - 0.3234 และอย่างมีนัยสำคัญที่ระดับ 0.05 ไม่ปฏิเสธสมมติฐานว่างว่าทั้งสองกลุ่มนั้นมาจากประชากรที่มีค่าเฉลี่ยเท่ากัน ตอนนี้ฉันได้รับความไม่แน่นอนสำหรับการวัดแต่ละครั้ง: u1 <- c(2.3,1.7,1.7,1.7,2.0,2.2,2.1,1.7,2.3,2.2) u2 <- c(2.4,1.8,1.6,2.3,2.5,1.8,1.9,1.5,2.3,2.3) โดยที่ u1 [1] คือความไม่แน่นอนมาตรฐานรวมในการวัด y1 [1] (และอื่น ๆ ) ฉันจะรวมความไม่แน่นอนเหล่านี้เข้ากับการทดสอบทางสถิติได้อย่างไร

1
ทดสอบคุณสมบัติมาร์คอฟในอนุกรมเวลา
รับ (ปฏิบัติ) เวลาชุดกับX T ∈ { 1 , . . , n }จะมีการทดสอบทางสถิติสำหรับการทดสอบด้วย null สมมติฐานที่ว่าP ( X T | X T - 1 , X T - 2 , . . . , X 1 ) = P ( X T | X T - 1 ) ( เช่นคุณสมบัติมาร์คอฟ)?Xเสื้อXเสื้อX_tXเสื้อ∈ { …

5
วิธีใดที่จะแสดงวิธีการวิเคราะห์สองวิธีที่เทียบเท่ากัน
ฉันมีวิธีการวิเคราะห์ที่แตกต่างกันสองวิธีที่สามารถวัดความเข้มข้นของโมเลกุลที่เฉพาะเจาะจงในเมทริกซ์ (เช่นวัดปริมาณของเกลือในน้ำ) วิธีการสองวิธีนั้นแตกต่างกันและแต่ละวิธีมีข้อผิดพลาดของตัวเอง มีวิธีใดที่จะแสดงทั้งสองวิธีนั้นเท่ากัน (หรือไม่) ฉันคิดว่าการพล็อตผลลัพธ์จากตัวอย่างจำนวนหนึ่งที่วัดโดยทั้งสองวิธีบนกราฟกระจายเป็นขั้นตอนแรกที่ดี แต่มีวิธีการทางสถิติที่ดีหรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.