@PeterFlom ได้กล่าวแล้วว่าการศึกษาสถานการณ์จำลองไม่สามารถครอบคลุมสถานการณ์และความเป็นไปได้ทั้งหมดดังนั้นจึงไม่สามารถนำไปสู่คำตอบที่ชัดเจน อย่างไรก็ตามฉันยังพบว่ามีประโยชน์ในการสำรวจปัญหาเช่นนี้โดยการจำลองสถานการณ์ (เช่นนี้เป็นประเภทของการออกกำลังกายที่ฉันต้องการใช้เมื่อแนะนำแนวคิดของการศึกษาสถานการณ์จำลองมอนติคาร์โลกับนักเรียน) ลองทำสิ่งนี้กัน ฉันจะใช้ R เพื่อสิ่งนี้
รหัส
n1 <- 33
n2 <- 45
mu1 <- 0
mu2 <- 0
sd1 <- 1
sd2 <- 1
iters <- 100000
p1 <- p2 <- p3 <- p4 <- p5 <- rep(NA, iters)
for (i in 1:iters) {
### normal distributions
x1 <- rnorm(n1, mu1, sd1)
x2 <- rnorm(n2, mu2, sd2)
p1[i] <- t.test(x1, x2)$p.value
### both variables skewed to the right
x1 <- (rchisq(n1, df=1) - 1)/sqrt(2) * sd1 + mu1
x2 <- (rchisq(n2, df=1) - 1)/sqrt(2) * sd2 + mu2
p2[i] <- t.test(x1, x2)$p.value
### both variables skewed to the left
x1 <- -1 * (rchisq(n1, df=1) - 1)/sqrt(2) * sd1 + mu1
x2 <- -1 * (rchisq(n2, df=1) - 1)/sqrt(2) * sd2 + mu2
p3[i] <- t.test(x1, x2)$p.value
### first skewed to the left, second skewed to the right
x1 <- -1 * (rchisq(n1, df=1) - 1)/sqrt(2) * sd1 + mu1
x2 <- (rchisq(n2, df=1) - 1)/sqrt(2) * sd2 + mu2
p4[i] <- t.test(x1, x2)$p.value
### first skewed to the right, second skewed to the left
x1 <- (rchisq(n1, df=1) - 1)/sqrt(2) * sd1 + mu1
x2 <- -1 * (rchisq(n2, df=1) - 1)/sqrt(2) * sd2 + mu2
p5[i] <- t.test(x1, x2)$p.value
}
print(round((apply(cbind(p1, p2, p3, p4, p5), 2, function(p) mean(p <= .05))), 3))
คำอธิบาย
ก่อนอื่นเรากำหนดขนาดกลุ่ม ( n1
และn2
), กลุ่มที่แท้จริงหมายถึง ( mu1
และmu2
) และค่าเบี่ยงเบนมาตรฐานที่แท้จริง ( sd1
และsd2
)
จากนั้นเราจะกำหนดจำนวนการวนซ้ำเพื่อเรียกใช้และตั้งค่าเวกเตอร์เพื่อเก็บค่า p ใน
จากนั้นฉันจำลองข้อมูลภายใต้ 5 สถานการณ์:
- การแจกแจงทั้งสองเป็นเรื่องปกติ
- การแจกแจงทั้งสองจะเอียงไปทางขวา
- การแจกแจงทั้งสองจะเอียงไปทางซ้าย
- การแจกแจงครั้งแรกเอียงไปทางซ้าย, ครั้งที่สองไปทางขวา
- การแจกแจงครั้งแรกเอียงไปทางขวา, ครั้งที่สองไปทางซ้าย
โปรดทราบว่าฉันใช้การแจกแจงแบบไคสแควร์เพื่อสร้างการแจกแจงแบบเบ้ ด้วยระดับความอิสระหนึ่งระดับการแจกแจงแบบเบ้อย่างหนัก เนื่องจากค่าเฉลี่ยที่แท้จริงและความแปรปรวนของการแจกแจงแบบไคสแควร์ที่มีระดับความเป็นอิสระเท่ากับ 1 และ 2 ตามลำดับ ( ดูวิกิพีเดีย ) ฉันช่วยขายการแจกแจงเหล่านั้นเป็นครั้งแรกที่มีค่าเฉลี่ย 0 และส่วนเบี่ยงเบนมาตรฐาน 1 ต้องการค่าเฉลี่ยจริงและส่วนเบี่ยงเบนมาตรฐาน (สามารถทำได้ในขั้นตอนเดียว แต่การทำเช่นนี้อาจชัดเจนกว่า)
ในแต่ละกรณีฉันใช้ t-test (เวอร์ชันของ Welch - แน่นอนว่าเราสามารถพิจารณารุ่นของนักเรียนที่ถือว่ามีความแปรปรวนเท่ากันในสองกลุ่ม) และบันทึกค่า p-value ให้กับเวกเตอร์ที่ตั้งค่าไว้ก่อนหน้านี้
ในที่สุดเมื่อการทำซ้ำทั้งหมดเสร็จสมบูรณ์ฉันคำนวณหาเวกเตอร์แต่ละความถี่ว่าค่า p-value เท่ากับหรือต่ำกว่า. 05 (เช่นการทดสอบคือ "นัยสำคัญ") นี่คืออัตราการปฏิเสธเชิงประจักษ์
ผลลัพธ์บางส่วน
จำลองตามที่อธิบายไว้ข้างต้นให้ผล:
p1 p2 p3 p4 p5
0.049 0.048 0.047 0.070 0.070
ดังนั้นเมื่อความเบ้ไปในทิศทางเดียวกันในทั้งสองกลุ่มอัตราความผิดพลาด Type I ดูเหมือนจะค่อนข้างใกล้เคียงกับการควบคุมที่ดี (กล่าวคือมันค่อนข้างใกล้กับชื่อ ) เมื่อความเบ้อยู่ในทิศทางตรงกันข้ามจะมีอัตราเงินเฟ้อเล็กน้อยในอัตราความผิดพลาด Type Iα=.05
หากเราเปลี่ยนรหัสเป็นmu1 <- .5
เราจะได้รับ:
p1 p2 p3 p4 p5
0.574 0.610 0.606 0.592 0.602
ดังนั้นเมื่อเปรียบเทียบกับกรณีที่การแจกแจงทั้งสองเป็นแบบปกติ (ตามที่คาดการณ์จากการทดสอบ) พลังจริง ๆ แล้วดูเหมือนจะสูงขึ้นเล็กน้อยเมื่อความเบ้อยู่ในทิศทางเดียวกัน! หากคุณประหลาดใจกับสิ่งนี้คุณอาจต้องทำการเรียกใช้ซ้ำสองสามครั้ง (แน่นอนว่าแต่ละครั้งจะได้ผลลัพธ์ที่แตกต่างกันเล็กน้อย) แต่รูปแบบจะยังคงอยู่
โปรดทราบว่าเราจะต้องระมัดระวังในการตีความค่าพลังเชิงประจักษ์ภายใต้สถานการณ์สองสถานการณ์ที่ความเบ้อยู่ในทิศทางตรงกันข้ามเนื่องจากอัตราความผิดพลาดประเภทที่ 1 นั้นไม่ได้ระบุค่อนข้างมาก (เป็นกรณีที่รุนแรงสมมติว่าฉันปฏิเสธเสมอว่าข้อมูลอะไร show; ฉันจะทดสอบด้วยกำลังสูงสุดเสมอ แต่แน่นอนว่าการทดสอบนั้นมีอัตราความผิดพลาด Type I ที่สูงเกินจริงด้วยเช่นกัน)
เราสามารถเริ่มสำรวจค่าที่หลากหลายสำหรับmu1
(และmu2
- แต่สิ่งที่สำคัญจริงๆคือความแตกต่างระหว่างทั้งสอง) และที่สำคัญกว่านั้นให้เริ่มเปลี่ยนค่าเบี่ยงเบนมาตรฐานที่แท้จริงของทั้งสองกลุ่ม (เช่นsd1
และsd2
) โดยเฉพาะทำให้ไม่เท่ากัน ฉันยังติดอยู่กับขนาดตัวอย่างที่กล่าวถึงโดย OP แต่แน่นอนว่าสามารถปรับได้เช่นกัน และแน่นอนความเบ้อาจมีรูปแบบอื่น ๆ มากมายกว่าที่เราเห็นในการแจกแจงแบบไคสแควร์ที่มีอิสระในระดับหนึ่ง ฉันยังคงคิดว่าการเข้าใกล้สิ่งต่าง ๆ ในลักษณะนี้มีประโยชน์แม้ว่าจะไม่สามารถให้คำตอบที่แน่นอนได้