คำถามติดแท็ก hypothesis-testing

การทดสอบสมมติฐานจะประเมินว่าข้อมูลไม่สอดคล้องกับสมมติฐานที่กำหนดแทนที่จะเป็นผลของความผันผวนแบบสุ่มหรือไม่

2
การทดสอบสมมติฐานและความสำคัญของอนุกรมเวลา
การทดสอบความสำคัญตามปกติเมื่อค้นหาประชากรสองคนคือ t-test, paired t-test หากเป็นไปได้ นี่ถือว่าการกระจายเป็นปกติ มีข้อสมมติฐานที่ทำให้เข้าใจง่ายที่คล้ายกันที่สร้างการทดสอบนัยสำคัญสำหรับอนุกรมเวลาหรือไม่? โดยเฉพาะเรามีประชากรหนูสองตัวที่ค่อนข้างเล็กซึ่งกำลังได้รับการปฏิบัติแตกต่างกันและเราทำการวัดน้ำหนักสัปดาห์ละครั้ง กราฟทั้งสองแสดงฟังก์ชั่นที่เพิ่มขึ้นอย่างราบรื่นด้วยกราฟหนึ่งกราฟเหนืออีกแน่นอน เราจะหาปริมาณ "ความชัดเจน" ในบริบทนี้ได้อย่างไร สมมติฐานว่างควรเป็นว่าน้ำหนักของประชากรทั้งสอง "ทำงานในลักษณะเดียวกัน" เมื่อเวลาผ่านไป เราจะกำหนดรูปแบบนี้ในรูปแบบง่าย ๆ ที่เป็นเรื่องธรรมดา (เช่นเดียวกับการแจกแจงแบบปกติทั่วไป) ด้วยพารามิเตอร์จำนวนเล็กน้อยเท่านั้น เมื่อเราทำเช่นนั้นแล้วเราจะวัดความสำคัญหรือสิ่งที่คล้ายคลึงกับค่า p ได้อย่างไร แล้วการจับคู่เมาส์จับคู่ลักษณะให้ได้มากที่สุดโดยแต่ละคู่มีตัวแทนหนึ่งคนจากประชากรสองคนแต่ละคน ฉันยินดีต้อนรับตัวชี้ไปยังหนังสือหรือบทความที่เกี่ยวข้องที่เขียนได้ดีและเข้าใจได้ง่ายเกี่ยวกับอนุกรมเวลา ฉันเริ่มเป็นคนโง่เขลา ขอบคุณสำหรับความช่วยเหลือของคุณ. David Epstein

1
เหตุใด t-test และ ANOVA จึงให้ค่า p แตกต่างกันสำหรับการเปรียบเทียบสองกลุ่ม
ในบทความ Wikipedia เกี่ยวกับANOVAมันบอกว่า ในรูปแบบที่ง่ายที่สุด ANOVA จัดให้มีการทดสอบทางสถิติว่าค่าเฉลี่ยของหลาย ๆ กลุ่มมีค่าเท่ากันหรือไม่และดังนั้นจึงทำให้การทดสอบ t-test เป็นมากกว่าสองกลุ่ม ความเข้าใจของฉันเกี่ยวกับเรื่องนี้คือ ANOVA นั้นเหมือนกับ t-test เมื่อเปรียบเทียบกับกลุ่มสองกลุ่ม อย่างไรก็ตามในตัวอย่างง่าย ๆ ของฉันด้านล่าง (ใน R) การวิเคราะห์ความแปรปรวนและการทดสอบ t ให้ค่า p ที่เหมือนกัน แต่แตกต่างกันเล็กน้อย มีใครอธิบายได้บ้างไหม x1=rnorm(100,mean=0,sd=1) x2=rnorm(100,mean=0.5,sd=1) y1=rnorm(100,mean=0,sd=10) y2=rnorm(100,mean=0.5,sd=10) t.test(x1,x2)$p.value # 0.0002695961 t.test(y1,y2)$p.value # 0.8190363 df1=as.data.frame(rbind(cbind(x=x1,type=1), cbind(x2,type=2))) df2=as.data.frame(rbind(cbind(x=y1,type=1), cbind(y2,type=2))) anova(lm(x~type,df1))$`Pr(>F)`[1] # 0.0002695578 anova(lm(x~type,df2))$`Pr(>F)`[1] # 0.8190279

2
ค่า P ในการทดสอบแบบสองหางพร้อมการแจกแจงโมฆะแบบอสมมาตร
สถานการณ์ของฉันเป็นดังนี้: ฉันต้องการผ่านการศึกษา Monte-Carlo เพื่อเปรียบเทียบค่าpppของการทดสอบที่แตกต่างกันสองรายการสำหรับนัยสำคัญทางสถิติของพารามิเตอร์ที่ประมาณไว้ (null คือ "ไม่มีผล - พารามิเตอร์เป็นศูนย์" และทางเลือกโดยนัยคือ " พารามิเตอร์ไม่ใช่ศูนย์ ") การทดสอบAเป็นมาตรฐาน"อิสระสองตัวอย่าง t-test สำหรับความเท่าเทียมกันของวิธีการ"โดยมีความแปรปรวนเท่ากันภายใต้ null ทดสอบBฉันสร้างเองแล้ว ที่นี่การแจกแจงโมฆะที่ใช้คือการแจกแจงแบบไม่ต่อเนื่องทั่วไปแบบอสมมาตร แต่ฉันได้พบความคิดเห็นต่อไปนี้ในRohatgi & Saleh (2001, 2nd ed, p. 462) "ถ้าการกระจายไม่สมมาตรที่ppp -value ไม่ได้กำหนดไว้อย่างดีในกรณีที่สองด้านแม้จะเขียนหลายคนแนะนำให้สองเท่าด้านเดียวppp -value" ผู้เขียนไม่ได้พูดถึงเรื่องนี้เพิ่มเติมและพวกเขาไม่แสดงความคิดเห็นใน "คำแนะนำของผู้เขียนหลายคน" เพื่อเพิ่มค่า - valueด้านเดียว ppp(นี้จะสร้างคำถาม "คู่ppp -value ของที่ด้านข้างหรือไม่และทำไมด้านนี้และไม่อื่น ๆ ?) ฉันไม่สามารถค้นหาความคิดเห็นความเห็นหรือผลลัพธ์อื่น ๆ ในเรื่องทั้งหมดนี้ได้ ฉันเข้าใจว่าด้วยการกระจายแบบอสมมาตรถึงแม้ว่าเราสามารถพิจารณาช่วงเวลาแบบสมมาตรรอบ ๆ สมมุติฐานว่างเกี่ยวกับค่าของพารามิเตอร์เราจะไม่ได้ความสมมาตรปกติอันดับที่สองนั่นคือการจัดสรรมวลความน่าจะเป็น แต่ฉันไม่เข้าใจว่าทำไมจึงทำให้ ค่าppp …

6
จะอธิบายการทดสอบสมมติฐานสำหรับวัยรุ่นในเวลาน้อยกว่า 10 นาทีได้อย่างไร
เป็นเวลากว่าหนึ่งปีแล้วที่ฉันได้ให้เวลาหนึ่งชั่วโมงกับ ทุกครั้งที่ฉันได้รับกลุ่มเด็กที่แตกต่างกันมาและฉันให้พวกเขาเรียน ชุดรูปแบบของชั้นเรียนคือเราทำการทดลองที่เด็ก 10 คน (ผู้ที่ชอบดื่มโคคา - โคล่า) จะได้รับถ้วยสองใบ เด็ก ๆ จะถูกขอให้ตรวจสอบตามรสชาติและกลิ่นซึ่งถ้วยมีเครื่องดื่มโคคาโคล่า จากนั้นฉันต้องอธิบายให้พวกเขารู้วิธีตัดสินใจว่าเด็ก ๆ จะเดาหรือว่าพวกเขา (หรืออย่างน้อยก็พอพวกเขา) มีความสามารถในการลิ้มรสความแตกต่าง 10 ใน 10 ประสบความสำเร็จดีพอหรือไม่ แล้ว 7 จาก 10 ล่ะ แม้หลังจากให้คลาสนี้หลายสิบครั้ง (ในรูปแบบที่แตกต่างกัน) ฉันก็ยังไม่รู้สึกว่าฉันรู้วิธีรับแนวคิดในแบบที่คลาสส่วนใหญ่จะได้รับ หากคุณมีแนวคิดใด ๆ เกี่ยวกับแนวคิดของการทดสอบสมมติฐานสมมติฐานว่างสมมติฐานทางเลือกภูมิภาคที่ถูกปฏิเสธ ฯลฯ สามารถอธิบายได้อย่างง่าย ๆ (!) และวิธีที่เข้าใจง่าย - ฉันชอบที่จะรู้ว่า

1
การใช้ bootstrap ภายใต้ H0 เพื่อทำการทดสอบความแตกต่างของสองวิธี: การเปลี่ยนภายในกลุ่มหรือภายในกลุ่มตัวอย่าง
สมมติว่าฉันมีข้อมูลที่มีสองกลุ่มอิสระ: g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50, 81.74) group = rep (c ("g1", "g2"), c (length (g1.lengths), length (g2.lengths))) lengths = data.frame( lengths …

3
ในการทดสอบที่แม่นยำของฟิชเชอร์: การทดสอบใดที่เหมาะสมถ้าผู้หญิงไม่ทราบจำนวนถ้วยแรกของนม?
ในการทดลองชิมชาของผู้หญิงที่มีชื่อเสียงโดย RA Fisher ผู้หญิงคนนั้นได้รับแจ้งว่ามีนมถ้วยแรก / ถ้วยชาครั้งแรกกี่ตัว (4 ถ้วยต่อ 8 ถ้วย) สิ่งนี้จะเป็นการเคารพสมมติฐานทั้งหมดของการทดสอบที่แน่นอนของ Fisher ฉันคิดว่าจะทำแบบทดสอบนี้กับเพื่อนของฉัน แต่ความคิดนั้นทำให้ฉัน ถ้าผู้หญิงสามารถบอกความแตกต่างระหว่างนมคนแรกกับถ้วยชาครั้งแรกได้เธอก็ควรจะสามารถหาผลรวมทั้งหมดของถ้วยนมถ้วยแรกและถ้วยแรกได้เช่นกัน ดังนั้นนี่คือคำถาม: การทดสอบใดที่สามารถนำมาใช้ถ้า RA Fisher ไม่ได้แจ้งให้ผู้หญิงทราบถึงจำนวนถ้วยแรกและถ้วยแรก

3
การอ้างถึงผลลัพธ์ว่า "สำคัญมาก" ผิดหรือไม่?
ทำไมสถิติกีดกันเราจากผลหมายถึงว่า " สูงอย่างมีนัยสำคัญ" เมื่อ -value เป็นอย่างดีดังต่อไปนี้การชุมนุมαpppαα\alphaระดับพื้นดินของ ?0.050.050.05 เป็นความผิดพลาดหรือไม่ที่จะเชื่อใจในผลลัพธ์ที่มีโอกาส 99.9% ที่ไม่ใช่ข้อผิดพลาด Type I ( ) มากกว่าผลลัพธ์ที่ให้โอกาสนั้นเพียง 99% ( p = 0.01)p=0.001p=0.001p=0.001p=0.01p=0.01p=0.01 ) หรือไม่

1
หลังการทดสอบหลัง Kruskal-Wallis: การทดสอบของ Dunn หรือ Bonferroni แก้ไขการทดสอบ Mann-Whitney หรือไม่
ฉันมีตัวแปรแบบกระจายที่ไม่ใช่แบบเกาส์และต้องตรวจสอบว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างค่าของตัวแปรนี้ใน 5 กลุ่มที่แตกต่างกันหรือไม่ ฉันทำการวิเคราะห์ความแปรปรวนทางเดียวของ Kruskal-Wallis (ซึ่งมีนัยสำคัญมาก) และหลังจากนั้นฉันต้องตรวจสอบว่ากลุ่มใดมีความแตกต่างอย่างมีนัยสำคัญ เนื่องจากกลุ่มเรียงลำดับแล้ว (ค่าของตัวแปรในกลุ่มแรกควรต่ำกว่าค่าของตัวแปรในกลุ่มที่สองซึ่งควรต่ำกว่าค่าของตัวแปรในกลุ่มที่สามเป็นต้น บน) ฉันทำการทดสอบ 4 ครั้งเท่านั้น: Group 1 vs Group 2 Group 2 vs Group 3 Group 3 vs Group 4 Group 4 vs Group 5 ฉันทำการวิเคราะห์ด้วยวิธีที่ต่างกันสองวิธี ฉันเริ่มโดยใช้การทดสอบการเปรียบเทียบหลายอย่างของดันน์ แต่ไม่มีอะไรสำคัญเกิดขึ้น ในทางกลับกันถ้าฉันใช้การทดสอบ Mann-Whitney และแก้ไขจำนวนการทดสอบ (4) โดยใช้ Bonferroni การทดสอบ 3 ครั้งจะมีความสำคัญ มันหมายความว่าอะไร? ฉันควรเชื่อถือผลลัพธ์ใด

4
การเปลี่ยนสมมติฐานว่างในการถดถอยเชิงเส้น
ฉันมีข้อมูลบางอย่างที่มีความสัมพันธ์สูง ถ้าฉันใช้การถดถอยเชิงเส้นฉันจะได้เส้นการถดถอยที่มีความชันใกล้กับหนึ่ง (= 0.93) สิ่งที่ฉันอยากทำคือทดสอบว่าความชันนี้แตกต่างจาก 1.0 อย่างมากหรือไม่ ความคาดหวังของฉันคือมันไม่ได้เป็น กล่าวอีกนัยหนึ่งฉันต้องการเปลี่ยนสมมติฐานว่างของการถดถอยเชิงเส้นจากความชันที่ศูนย์เป็นความชันที่หนึ่ง นี่เป็นแนวทางที่สมเหตุสมผลหรือไม่? ฉันขอขอบคุณที่คุณสามารถรวมรหัส R ในคำตอบของคุณเพื่อให้ฉันสามารถใช้วิธีนี้ (หรือดีกว่าที่คุณแนะนำ!) ขอบคุณ

2
ทำไมการทดสอบไคสแควร์จึงใช้การนับที่คาดหวังเป็นความแปรปรวน
ในการพื้นฐานสำหรับการใช้สแควร์รูทของการนับที่คาดไว้เป็นส่วนเบี่ยงเบนมาตรฐาน (เช่นการนับที่คาดไว้เป็นความแปรปรวน) ของการแจกแจงปกติแต่ละรายการคืออะไร สิ่งเดียวที่ฉันจะได้พูดคุยเกี่ยวกับเรื่องนี้ก็คือhttp://www.physics.csbsju.edu/stats/chi-square.htmlและมันก็กล่าวถึงการแจกแจงปัวซองχ2χ2\chi^2 เป็นตัวอย่างง่ายๆของความสับสนของฉันจะเกิดอะไรขึ้นถ้าเราทดสอบว่ากระบวนการสองอย่างนั้นแตกต่างกันอย่างมากหรือไม่ซึ่งสร้างขึ้นมา 500 As และ 500 Bs ที่มีความแปรปรวนน้อยมากและอีกอันที่สร้าง 550 As และ 450 Bs 551 As และ 449 Bs)? ความแปรปรวนที่นี่ไม่ใช่ค่าที่คาดหวังอย่างชัดเจนไม่ใช่หรือ? (ฉันไม่ใช่นักสถิติดังนั้นกำลังมองหาคำตอบที่ไม่สามารถเข้าถึงได้โดยผู้เชี่ยวชาญ)

2
วิธีที่ถูกต้องในการทดสอบความแตกต่างอย่างมีนัยสำคัญระหว่างค่าสัมประสิทธิ์คืออะไร?
ฉันหวังว่าบางคนสามารถช่วยชี้ประเด็นความสับสนให้ฉันได้ ว่าฉันต้องการทดสอบว่าสัมประสิทธิ์การถดถอย 2 ชุดนั้นแตกต่างกันอย่างมีนัยสำคัญหรือไม่ด้วยการตั้งค่าต่อไปนี้: , มี 5 ตัวแปรอิสระyi=α+βxi+ϵiyi=α+βxi+ϵiy_i = \alpha + \beta x_i + \epsilon_i 2 กลุ่มโดยมีขนาดเท่ากันโดยประมาณ (แม้ว่าอาจแตกต่างกัน)n1,n2n1,n2n_1, n_2 การถดถอยที่คล้ายกันหลายพันครั้งจะเกิดขึ้นพร้อมกันดังนั้นการแก้ไขสมมติฐานบางอย่างจึงต้องทำ วิธีการหนึ่งที่แนะนำให้ฉันคือการใช้การทดสอบ Z: Z=b1−b2(√SEb21+SEb22)Z=b1−b2(SEb12+SEb22)Z = \frac{b_1 - b_2}{\sqrt(SEb_1^2 + SEb_2^2)} อีกสิ่งที่ฉันได้เห็นข้อเสนอแนะในบอร์ดนี้คือการแนะนำตัวแปรจำลองสำหรับการจัดกลุ่มและเขียนแบบจำลองใหม่เป็น: โดยที่ gคือตัวแปรการจัดกลุ่มซึ่งเขียนเป็น 0, 1yi=α+βxi+δ(xigi)+ϵiyi=α+βxi+δ(xigi)+ϵiy_i = \alpha + \beta x_i + \delta(x_ig_i) + \epsilon_igก.g คำถามของฉันคือวิธีการทั้งสองนี้มีวิธีการที่แตกต่างกัน (เช่นสมมติฐานที่แตกต่างกันทำมีความยืดหยุ่น)? มีความเหมาะสมมากกว่าอีกอย่างหรือไม่? ฉันคิดว่ามันค่อนข้างธรรมดา แต่การชี้แจงใด ๆ จะได้รับการชื่นชมอย่างมาก

3
การทดสอบข้อมูลที่สร้างแบบสุ่มกับการกระจายที่ต้องการ
ฉันได้เขียนโปรแกรมที่สร้างข้อมูลแบบสุ่ม หากโปรแกรมทำงานอย่างถูกต้องข้อมูลนั้นควรเป็นไปตามการแจกแจงความน่าจะเป็นที่ทราบ ฉันต้องการรันโปรแกรมทำการคำนวณผลและคิดค่า p ก่อนใครบอกว่า: ฉันเข้าใจว่าการทดสอบสมมติฐานไม่สามารถตรวจพบเมื่อโปรแกรมทำงานอย่างถูกต้อง สามารถตรวจพบได้เมื่อทำงานไม่ถูกต้องในวิธีเฉพาะ (และถึงตอนนั้นการทดสอบ "ควร" ล้มเหลว X% ของเวลาขึ้นอยู่กับระดับความสำคัญที่คุณเลือก ... ) ดังนั้นฉันพยายามทำความเข้าใจว่าเครื่องมือใดที่เหมาะสม โดยเฉพาะอย่างยิ่ง: ฉันสามารถสร้างข้อมูลสุ่มได้มากเท่าที่ต้องการ สิ่งที่ฉันต้องทำก็คือปล่อยให้โปรแกรมทำงานนานพอ ดังนั้นฉันจึงไม่ จำกัด ขนาดตัวอย่างเฉพาะใด ๆ ฉันสนใจในเทคนิคที่สร้างค่า p ดังนั้นการจ้องมองที่กราฟและพูดว่า "ใช่ที่ดูเหมือนเชิงเส้นเชิงเส้น" ไม่ใช่ตัวเลือกที่น่าสนใจ เว้นแต่จะมีวิธีการใส่ตัวเลขจำนวนมากลงใน "ความไร้ประโยชน์" ของกราฟ ;-) สิ่งที่ฉันรู้จนถึงตอนนี้: ฉันได้เห็นสามประเภทหลักของการทดสอบที่กล่าวถึงซึ่งดูเหมือนว่าพวกเขาจะสามารถใช้งานได้: [เพียร์สัน] การทดสอบไคสแควร์, การทดสอบ Kolmogorov-Smirnov และการทดสอบ Anderson-Darling ปรากฏว่าการทดสอบไคสแควร์เป็นที่เหมาะสมสำหรับต่อเนื่องกระจายในขณะที่อีกสองคนที่มีความเหมาะสมมากขึ้นสำหรับการอย่างต่อเนื่องกระจาย (?) แหล่งข้อมูลหลายแห่งระบุว่าการทดสอบโฆษณานั้น "ดีกว่า" กว่าการทดสอบ KS แต่ไม่สามารถระบุรายละเอียดเพิ่มเติมได้ ในที่สุดการทดสอบทั้งหมดเหล่านี้น่าจะตรวจพบ "วิธีที่แตกต่าง" ของการเบี่ยงเบนจากการแจกแจงโมฆะที่ระบุ แต่ฉันไม่รู้จริง …

3
สถิติเชิงพรรณนามีค่า p หรือไม่?
ฉันถูกขอให้ค้นหาค่า p สำหรับสถิติเชิงพรรณนา อย่างไรก็ตามฉันเข้าใจว่าค่า p ใช้สำหรับสถิติการทดสอบ ถ้าฉันไม่เข้าใจผิดค่า p คือความน่าจะเป็นในการสังเกตค่ามากที่สุดเท่าที่สถิติการทดสอบหากสมมติฐานว่างเป็นจริง

2
การทดสอบทางสถิติสามารถคืนค่า p เป็นศูนย์ได้หรือไม่?
ฉันไม่ได้หมายถึงค่าที่ใกล้เคียงกับศูนย์ (ปัดเศษเป็นศูนย์ด้วยซอฟต์แวร์สถิติบางตัว) แต่จะมีค่าเป็นศูนย์อย่างแท้จริง ถ้าเป็นเช่นนั้นหมายความว่าความน่าจะเป็นที่จะได้รับข้อมูลที่สมมติว่าสมมติฐานว่างเป็นจริงหรือไม่เช่นกัน (ตัวอย่างบางส่วน) ของการทดสอบทางสถิติที่สามารถส่งกลับผลลัพธ์ของการเรียงลำดับนี้คืออะไร? แก้ไขประโยคที่สองเพื่อลบวลี "ความน่าจะเป็นของสมมติฐานว่าง"

3
“ สถิติทดสอบ” เป็นค่าหรือตัวแปรสุ่มหรือไม่
ตอนนี้ฉันเป็นนักเรียนที่เรียนวิชาสถิติเป็นครั้งแรก ฉันสับสนกับคำว่า "สถิติการทดสอบ" ในต่อไป (ฉันเห็นนี้ในตำราบาง) ดูเหมือนว่าจะมีค่าเฉพาะคำนวณจากตัวอย่างที่เฉพาะเจาะจง t = ¯ x - μ 0เสื้อเสื้อtt = x¯¯¯- μ0s / n--√เสื้อ=x¯-μ0s/n t=\frac{\overline{x} - \mu_0}{s / \sqrt{n}} อย่างไรก็ตามในต่อไปนี้ (ฉันเห็นสิ่งนี้ในหนังสือเรียนเล่มอื่น ๆ ) ดูเหมือนว่าจะเป็นตัวแปรสุ่ม T = ¯ X - μ 0TTTT= X¯¯¯¯- μ0S/ n--√T=X¯-μ0S/n T=\frac{\overline{X} - \mu_0}{S / \sqrt{n}} ดังนั้นคำว่า "สถิติการทดสอบ" หมายถึงค่าเฉพาะหรือตัวแปรสุ่มหรือทั้งสองอย่าง ?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.