คำถามติดแท็ก hypothesis-testing

การทดสอบสมมติฐานจะประเมินว่าข้อมูลไม่สอดคล้องกับสมมติฐานที่กำหนดแทนที่จะเป็นผลของความผันผวนแบบสุ่มหรือไม่

5
การสะกดคำที่ถูกต้อง (ตัวพิมพ์ใหญ่, ตัวเอียง, ยัติภังค์) ของ“ p-value”?
ฉันรู้ว่าสิ่งนี้เป็นเรื่องอื้อฉาวและน่าเบื่อ แต่ในฐานะนักวิจัยในสาขานอกสถิติด้วยการศึกษาอย่างเป็นทางการในสถิติที่ จำกัด ฉันมักจะสงสัยว่าฉันเขียน "p-value" ถูกต้องหรือไม่ โดยเฉพาะ: "p" ควรจะเป็นตัวพิมพ์ใหญ่หรือไม่ "p" ควรจะเป็นตัวเอียงหรือไม่ (หรือในแบบอักษรคณิตศาสตร์ใน TeX?) ควรมีเครื่องหมายขีดคั่นระหว่าง "p" และ "value" หรือไม่? อีกวิธีหนึ่งไม่มีวิธีการเขียน "p-value" ที่เหมาะสม "และ dolt ใด ๆ จะเข้าใจสิ่งที่ฉันหมายถึงถ้าฉันวาง" p "ถัดจาก" value "ในการเปลี่ยนแปลงตัวเลือกเหล่านี้

6
ฉันจะทดสอบได้อย่างไรว่าตัวแปรต่อเนื่องสองตัวนั้นมีความเป็นอิสระ
สมมติว่าฉันมีตัวอย่างจากการจัดจำหน่ายร่วมกันของและYฉันจะทดสอบสมมติฐานที่และเป็นอิสระได้อย่างไร( Xn, วายn) , n = 1 .. N(Xn,Yn),n=1..N(X_n,Y_n), n=1..NY X YXXXYYYXXXYYY ไม่มีข้อสมมติฐานใด ๆ เกี่ยวกับการแจกแจงแบบร่วมหรือส่วนเพิ่มของและ (อย่างน้อยที่สุดของมาตรฐานร่วมทั้งหมดเนื่องจากในกรณีนั้นความเป็นอิสระนั้นเหมือนกับความสัมพันธ์เป็น )Y 0XXXYYY000 ไม่มีการสันนิษฐานเกี่ยวกับลักษณะของความสัมพันธ์ที่เป็นไปได้ระหว่างและ ; มันอาจไม่ใช่แบบเชิงเส้นดังนั้นตัวแปรจะไม่สัมพันธ์กัน ( ) แต่ขึ้นอยู่กับการมีส่วนร่วมสูง ( )YXXXYYYr = 0r=0r=0ผม= HI=HI=H ฉันเห็นสองแนวทาง: ถังทั้งสองตัวแปรและใช้ฟิชเชอร์การทดสอบที่แน่นอนหรือG-ทดสอบ Pro: ใช้การทดสอบทางสถิติที่มีชื่อเสียง คอนดิชั่น: ขึ้นอยู่กับการ binning ประเมินการพึ่งพาของและ : (นี้เป็นสำหรับอิสระและและเมื่อพวกเขาสมบูรณ์ตรวจสอบแต่ละอื่น ๆ )Y I ( X ; Y )XXXYYYI(X;Y)H(X,Y)I(X;Y)H(X,Y)\frac{I(X;Y)}{H(X,Y)}XY1000XXXYYY111 Pro: สร้างตัวเลขที่มีความหมายทางทฤษฎีที่ชัดเจน คอนดิชั่น: …

7
ไคสแควร์กำลังทำการทดสอบด้านเดียวเสมอหรือไม่?
บทความที่ตีพิมพ์ ( pdf ) มี 2 ประโยคเหล่านี้: นอกจากนี้การรายงานที่ผิดอาจเกิดจากการใช้กฎที่ไม่ถูกต้องหรือขาดความรู้ในการทดสอบทางสถิติ ตัวอย่างเช่นยอดรวม df ใน ANOVA อาจถูกใช้เป็นข้อผิดพลาด df ในการรายงานการทดสอบหรือผู้วิจัยอาจแบ่งค่า p ที่รายงานของการหรือสองเพื่อให้ได้ค่าด้านเดียวในขณะที่ค่าของการหรือเป็นการทดสอบด้านเดียวแล้วχ 2 F p p χ 2 FFFFχ2χ2\chi^2FFFppppppχ2χ2\chi^2FFF ทำไมพวกเขาถึงพูดอย่างนั้น? การทดสอบไคสแควร์เป็นการทดสอบสองด้าน (ฉันได้ถามผู้เขียนคนหนึ่ง แต่ไม่มีการตอบสนอง) ฉันกำลังมองอะไร

5
การอนุมานทางสถิติเมื่อกลุ่มตัวอย่าง“ เป็น” ประชากร
ลองนึกภาพคุณต้องรายงานจำนวนผู้สมัครที่ทำแบบทดสอบรายปี ดูเหมือนว่าค่อนข้างยากที่จะอนุมาน% ของความสำเร็จที่สังเกตได้เช่นในประชากรที่กว้างขึ้นเนื่องจากความจำเพาะของประชากรเป้าหมาย ดังนั้นคุณอาจพิจารณาว่าข้อมูลเหล่านี้แสดงถึงประชากรทั้งหมด ผลการทดสอบแสดงให้เห็นว่าสัดส่วนของเพศชายและเพศหญิงแตกต่างกันจริงหรือไม่? การทดสอบเปรียบเทียบสัดส่วนที่สังเกตและสัดส่วนทางทฤษฎีดูเหมือนว่าถูกต้องหรือไม่เนื่องจากคุณพิจารณาประชากรทั้งหมด (ไม่ใช่ตัวอย่าง)?

2
ทำไมการทดสอบสมมติฐานบ่อย ๆ จึงลำเอียงในการปฏิเสธสมมติฐานว่างด้วยตัวอย่างที่มีขนาดใหญ่เพียงพอ?
ฉันแค่อ่านบทความนี้เกี่ยวกับปัจจัย Bayes สำหรับปัญหาที่ไม่เกี่ยวข้องอย่างสมบูรณ์เมื่อฉันสะดุดกับข้อนี้ การทดสอบสมมติฐานด้วย Bayes factor นั้นแข็งแกร่งกว่าการทดสอบสมมติฐานบ่อยๆเนื่องจากรูปแบบ Bayesian หลีกเลี่ยงอคติการเลือกรูปแบบประเมินหลักฐานที่สนับสนุนสมมติฐานว่างรวมถึงความไม่แน่นอนของแบบจำลองและช่วยให้แบบจำลองที่ไม่ซ้อนกันต้องถูกเปรียบเทียบ มีตัวแปรตามเหมือนกัน) นอกจากนี้การทดสอบที่มีนัยสำคัญบ่อยครั้งกลายเป็นความลำเอียงในการปฏิเสธสมมติฐานว่างด้วยขนาดตัวอย่างที่มีขนาดใหญ่เพียงพอ [เน้นเพิ่ม] ผมเคยเห็นการเรียกร้องนี้มาก่อนในคาร์ล Friston 2012 กระดาษใน NeuroImageที่เขาเรียกมันว่าการเข้าใจผิดของการอนุมานคลาสสิก ฉันมีปัญหาเล็กน้อยในการค้นหาบัญชีการสอนอย่างแท้จริงว่าทำไมเรื่องนี้จึงควรเป็นจริง โดยเฉพาะฉันสงสัยว่า: ทำไมสิ่งนี้เกิดขึ้น วิธีการป้องกันมัน ความล้มเหลวนั้นวิธีการตรวจสอบ

7
ทำไม“ สำคัญทางสถิติ” ไม่เพียงพอ?
ฉันเสร็จสิ้นการวิเคราะห์ข้อมูลและได้รับ "ผลลัพธ์ที่มีนัยสำคัญทางสถิติ" ซึ่งสอดคล้องกับสมมติฐานของฉัน อย่างไรก็ตามนักเรียนในสถิติบอกว่านี่เป็นข้อสรุปก่อนวัยอันควร ทำไม? จำเป็นต้องมีสิ่งอื่นอีกไหมในรายงานของฉัน?

3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

1
วิธีการตีความ type I, type II และ type III ANOVA และ MANOVA
คำถามหลักของฉันคือวิธีการตีความเอาท์พุท (ค่าสัมประสิทธิ์ F, P) เมื่อดำเนินการวิเคราะห์ความแปรปรวนแบบที่ 1 (เรียงลำดับ)? ปัญหาการวิจัยเฉพาะของฉันซับซ้อนกว่าเล็กน้อยดังนั้นฉันจะแบ่งตัวอย่างเป็นส่วน ๆ ก่อนอื่นถ้าฉันสนใจผลของความหนาแน่นของแมงมุม (X1) ต่อการเจริญเติบโตของพืช (Y1) และฉันปลูกต้นกล้าในเปลือกและความหนาแน่นของแมงมุมที่จัดการแล้วฉันสามารถวิเคราะห์ข้อมูลด้วยการวิเคราะห์ความแปรปรวนแบบง่ายหรือเชิงเส้น ถ้าเช่นนั้นฉันจะใช้ Type I, II หรือ III Sum of Squares (SS) สำหรับ ANOVA ของฉัน ในกรณีของฉันฉันมี 4 ซ้ำของ 5 ระดับความหนาแน่นดังนั้นฉันสามารถใช้ความหนาแน่นเป็นปัจจัยหรือเป็นตัวแปรต่อเนื่อง ในกรณีนี้ฉันชอบที่จะตีความว่ามันเป็นตัวแปรอิสระ (ทำนาย) อย่างต่อเนื่อง ใน RI อาจเรียกใช้สิ่งต่อไปนี้: lm1 <- lm(y1 ~ density, data = Ena) summary(lm1) anova(lm1) การใช้งานฟังก์ชั่น anova …

6
แรงจูงใจสำหรับระยะทาง Kolmogorov ระหว่างการแจกแจง
มีหลายวิธีในการวัดความคล้ายคลึงกันของการแจกแจงความน่าจะเป็นสองแบบ ในบรรดาวิธีการที่ได้รับความนิยม (ในแวดวงที่แตกต่างกัน) คือ: ระยะ Kolmogorov: ระยะทางระหว่างฟังก์ชันการกระจาย; ระยะทาง Kantorovich-Rubinstein: ความแตกต่างสูงสุดระหว่างความคาดหวังของ wrt ทั้งสองของการแจกแจงฟังก์ชันกับค่าคงที่ Lipschitz 111ซึ่งกลายเป็นระยะทางL1L1L^1ระหว่างฟังก์ชันการแจกแจง ล้อมรอบ-Lipschitz ระยะทาง: เช่นระยะ KR แต่ฟังก์ชั่นนอกจากนี้ยังจะต้องมีค่าสัมบูรณ์ที่มากที่สุด1111 สิ่งเหล่านี้มีข้อดีและข้อเสียต่างกัน การบรรจบกันในความหมายของ 3. จริง ๆ แล้วสอดคล้องกับการบรรจบกันในการกระจาย; การบรรจบกันในความหมายของ 1 หรือ 2 นั้นโดยทั่วไปแข็งแกร่งขึ้นเล็กน้อย (โดยเฉพาะถ้าXn=1nXn=1nX_n=\frac{1}{n}มีความน่าจะเป็น111จากนั้นXnXnX_nจะแปลงเป็น000ในการแจกแจง แต่ไม่ใช่ในระยะ Kolmogorov อย่างไรก็ตามหากการกระจายขีด จำกัด นั้นต่อเนื่องดังนั้นพยาธิวิทยานี้จะไม่เกิดขึ้น) จากมุมมองของความน่าจะเป็นเบื้องต้นหรือทฤษฎีการวัด 1. มีความเป็นธรรมชาติมากเพราะมันเปรียบเทียบความน่าจะเป็นของการอยู่ในบางชุด ในทางกลับกันมุมมองความน่าจะเป็นที่ซับซ้อนมากขึ้นมีแนวโน้มที่จะมุ่งเน้นไปที่ความคาดหวังมากกว่าความน่าจะเป็น นอกจากนี้จากมุมมองของการวิเคราะห์การทำงานระยะทางเช่น 2 หรือ 3 ขึ้นอยู่กับความเป็นคู่กับพื้นที่ฟังก์ชั่นบางอย่างน่าสนใจมากเพราะมีเครื่องมือทางคณิตศาสตร์จำนวนมากสำหรับการทำงานกับสิ่งต่าง ๆ อย่างไรก็ตามความประทับใจของฉัน (แก้ไขฉันถ้าฉันผิด!) คือในสถิติระยะทาง Kolmogorov …

4
ทำไมนักสถิติบอกว่าผลลัพธ์ที่ไม่สำคัญหมายความว่า“ คุณไม่สามารถปฏิเสธโมฆะ” ได้เมื่อเทียบกับการยอมรับสมมติฐานว่าง
การทดสอบทางสถิติแบบดั้งเดิมเช่นการทดสอบตัวอย่างสองตัวอย่างให้ความสำคัญกับการพยายามกำจัดสมมติฐานที่ไม่มีความแตกต่างระหว่างฟังก์ชั่นของสองตัวอย่างอิสระ จากนั้นเราเลือกระดับความเชื่อมั่นและบอกว่าหากความแตกต่างของค่าเฉลี่ยอยู่เกินระดับ 95% เราสามารถปฏิเสธสมมติฐานว่างได้ ถ้าไม่ใช่เรา "ไม่สามารถปฏิเสธสมมติฐานว่างได้" นี่ดูเหมือนจะบอกเป็นนัยว่าเราไม่สามารถยอมรับได้เช่นกัน หมายความว่าเราไม่แน่ใจว่าสมมุติฐานว่างเป็นจริงหรือไม่? ตอนนี้ฉันต้องการออกแบบการทดสอบโดยที่สมมติฐานของฉันคือหน้าที่ของสองตัวอย่างนั้นเหมือนกัน (ซึ่งตรงกันข้ามกับการทดสอบสถิติแบบดั้งเดิมโดยที่สมมติฐานนั้นคือทั้งสองตัวอย่างนั้นแตกต่างกัน) สมมุติฐานว่างของฉันกลายเป็นว่าทั้งสองตัวอย่างต่างกัน ฉันจะออกแบบการทดสอบได้อย่างไร? มันจะง่ายเหมือนการบอกว่าถ้า p-value น้อยกว่า 5% เราสามารถยอมรับสมมติฐานที่ว่าไม่มีความแตกต่างอย่างมีนัยสำคัญ?

3
เมื่อรวม p-values ​​ทำไมไม่เฉลี่ยเพียงค่าเฉลี่ย
ฉันเพิ่งเรียนรู้เกี่ยวกับวิธีการของฟิชเชอร์ในการรวมค่า p นี่คือความจริงที่ว่าตามตัวอักษรตามตัวอักษร - ตามตัวอักษร p- ตามตัวอักษรกระจายและ ซึ่งฉันคิดว่าเป็นอัจฉริยะ แต่คำถามของฉันคือทำไมไปทางที่ซับซ้อนนี้ และทำไมไม่ (มีอะไรผิดปกติ) เพียงแค่ใช้ค่าเฉลี่ยของค่า p และใช้ทฤษฎีบทขีด จำกัด กลาง? หรือค่ามัธยฐาน? ฉันพยายามที่จะเข้าใจความเป็นอัจฉริยะของ RA Fisher หลังโครงการอันยิ่งใหญ่นี้−2∑i=1nlogXi∼χ2(2n), given X∼Unif(0,1)−2∑i=1nlog⁡Xi∼χ2(2n), given X∼Unif(0,1)-2\sum_{i=1}^n{\log X_i} \sim \chi^2(2n), \text{ given } X \sim \text{Unif}(0,1)

5
เหตุใดการเปรียบเทียบหลายรายการจึงมีปัญหา
ฉันพบว่ามันยากที่จะเข้าใจว่าอะไรคือปัญหาของการเปรียบเทียบหลาย ๆอย่าง ด้วยการเปรียบเทียบง่าย ๆ ว่ากันว่าคนที่จะทำการตัดสินใจหลายอย่างจะทำผิดพลาดมากมาย ดังนั้นการระมัดระวังอย่างระมัดระวังจึงถูกนำมาใช้เช่นการแก้ไข Bonferroni เพื่อที่จะสร้างความน่าจะเป็นที่บุคคลนี้จะทำผิดพลาดใด ๆ น้อยที่สุดเท่าที่จะทำได้ แต่ทำไมเราใส่ใจว่าบุคคลนั้นทำผิดพลาดใด ๆ ในทุกการตัดสินใจของเขา / เธอหรือไม่แทนที่จะเป็นเปอร์เซ็นต์ของการตัดสินใจที่ผิด ให้ฉันพยายามอธิบายสิ่งที่ทำให้ฉันสับสนด้วยการเปรียบเทียบอื่น สมมติว่ามีผู้พิพากษาสองคนคนหนึ่งอายุ 60 ปีและอีกคนอายุ 20 ปี จากนั้นการแก้ไข Bonferroni จะบอกผู้ที่มีอายุ 20 ปีว่าจะอนุรักษ์นิยมที่สุดเท่าที่จะเป็นไปได้ในการตัดสินใจประหารชีวิตเพราะเขาจะทำงานต่อไปอีกหลายปีในฐานะผู้พิพากษาจะทำการตัดสินใจอีกหลายครั้งดังนั้นเขาจึงต้องระมัดระวัง แต่คนที่อายุ 60 ปีอาจจะเกษียณเร็ว ๆ นี้จะทำการตัดสินใจน้อยลงดังนั้นเขาจึงประมาทมากขึ้นเมื่อเทียบกับอีกคนหนึ่ง แต่ที่จริงแล้วผู้พิพากษาทั้งสองควรระมัดระวังหรืออนุรักษ์อย่างเท่าเทียมกันโดยไม่คำนึงถึงจำนวนการตัดสินใจทั้งหมดที่พวกเขาจะทำ ฉันคิดว่าสิ่งนี้คล้ายคลึงกันมากหรือน้อยแปลว่าปัญหาจริงที่มีการใช้การแก้ไข Bonferroni ซึ่งฉันพบว่าใช้ง่าย

3
การทดสอบความเท่าเทียมกันของสัมประสิทธิ์จากการถดถอยสองแบบที่แตกต่างกัน
นี่ดูเหมือนจะเป็นปัญหาพื้นฐาน แต่ฉันเพิ่งรู้ว่าจริง ๆ แล้วฉันไม่รู้วิธีทดสอบความเท่าเทียมของสัมประสิทธิ์จากการถดถอยสองแบบที่แตกต่างกัน มีใครบ้างไหมที่ให้แสงนี้? อีกอย่างเป็นทางการเช่นสมมติว่าฉันวิ่งต่อไปนี้สองถดถอย: และ ที่หมายถึงเมทริกซ์การออกแบบของการถดถอยและเวกเตอร์ของสัมประสิทธิ์ในการถดถอย . โปรดทราบว่าและอาจแตกต่างกันมากที่มีขนาดแตกต่างกัน ฯลฯ ฉันสนใจในตัวอย่างหรือไม่{21}ปี2 = X 2 β 2 + ε 2 X ฉันฉันβ ฉันฉันX 1 X 2 β 11 ≠ β 21Y1= X1β1+ ϵ1y1=X1β1+ϵ1 y_1 = X_1\beta_1 + \epsilon_1 Y2= X2β2+ ϵ2y2=X2β2+ϵ2 y_2 = X_2\beta_2 + \epsilon_2 XผมXiX_iผมiiβผมβi\beta_iผมiiX1X1X_1X2X2X_2β^11≠β^21β^11≠β^21\hat\beta_{11} \neq \hat\beta_{21} หากสิ่งเหล่านี้มาจากการถดถอยแบบเดียวกันนี่จะไม่สำคัญ …

8
ฉันจะทดสอบได้อย่างไรว่าตัวอย่างที่ได้รับมาจากการแจกแจงปัวซอง
ฉันรู้ว่าการทดสอบภาวะปกติ แต่ฉันจะทดสอบ "Poisson-ness" ได้อย่างไร? ฉันมีตัวอย่างจำนวนเต็ม 1000 จำนวนที่ไม่เป็นลบซึ่งฉันสงสัยว่านำมาจากการแจกแจงแบบปัวซองและฉันต้องการทดสอบสิ่งนั้น

4
การทดสอบแบบเบส์สองตัวอย่างที่เทียบเท่ากับแบบเบย์
ฉันไม่ได้กำลังมองหาวิธีแบบพลักแอนด์เพลย์อย่างดีที่สุดในอาร์ แต่เป็นคำอธิบายทางคณิตศาสตร์ของวิธีเบย์บางอย่างที่ฉันสามารถใช้เพื่อทดสอบความแตกต่างระหว่างค่าเฉลี่ยของตัวอย่างสองตัวอย่าง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.