ช่วงความเชื่อมั่นสำหรับไคสแควร์


10

ฉันพยายามหาวิธีแก้ปัญหาเพื่อเปรียบเทียบการทดสอบ "ดี - พอดี - แบบไค - สแควร์" แม่นยำยิ่งขึ้นฉันต้องการเปรียบเทียบผลลัพธ์จากการทดสอบอิสระสองครั้ง ในการทดลองเหล่านี้ผู้เขียนใช้ความดีแบบพอดีไคสแควร์เพื่อเปรียบเทียบการคาดเดาแบบสุ่ม (ความถี่ที่คาดหวัง) กับความถี่ที่สังเกตได้ การทดลองสองรายการมีจำนวนผู้เข้าร่วมเท่ากันและขั้นตอนการทดลองเหมือนกันมีเพียงสิ่งเร้าที่เปลี่ยนไป ผลการทดลองทั้งสองระบุว่าไคสแควร์อย่างมีนัยสำคัญ (exp. 1: X² (18) = 45; p <.0005 และ exp 2: X² (18) = 79; p <.0001)

ทีนี้สิ่งที่ฉันอยากทำคือทดสอบว่ามีความแตกต่างระหว่างสองผลลัพธ์นี้หรือไม่ ฉันคิดว่าวิธีแก้ปัญหาอาจใช้ช่วงความเชื่อมั่น แต่ฉันไม่รู้วิธีคำนวณช่วงความมั่นใจเหล่านี้กับผลลัพธ์เหล่านี้เท่านั้น หรืออาจเป็นการทดสอบเพื่อเปรียบเทียบขนาดเอฟเฟกต์ (Cohen's w)?

ใครมีทางออก?

ขอบคุณมาก!

FD


1
สวัสดี Florian ทำไมไม่ใช้การทดสอบการเปลี่ยนแปลงกับความแตกต่างระหว่างไคสแควร์?
Tal Galili

สวัสดีและขอบคุณสำหรับคำตอบของคุณ! เพียงเพราะฉันไม่รู้จักการทดสอบการเรียงสับเปลี่ยน เป็นไปได้ไหมที่จะทำการเปลี่ยนแปลงโดยมีค่าไคสแควร์สองค่าเท่านั้น (ฉันไม่มีข้อมูลดิบผลการค้นหาเท่านั้น) ขอขอบคุณอีกครั้ง :)
Florian

คำตอบ:


8

ข้อมูลที่ จำกัด มากที่คุณมีนั้นเป็นข้อ จำกัด ที่รุนแรง! อย่างไรก็ตามสิ่งต่าง ๆ ไม่ได้สิ้นหวังอย่างสิ้นเชิง

ภายใต้สมมติฐานเดียวกันที่นำไปสู่การแจกแจงแบบซีมโทติคสำหรับสถิติการทดสอบของการทดสอบความดี - พอดีพอดีในชื่อเดียวกันสถิติการทดสอบภายใต้สมมติฐานทางเลือกมี asymptotically, noncentral χ 2χ2χ2กระจาย ถ้าเราคิดทั้งสองสิ่งเร้าเป็น) อย่างมีนัยสำคัญและ b) มีผลเช่นเดียวกันสถิติการทดสอบที่เกี่ยวข้องจะมีเหมือนกัน asymptotic noncentral กระจาย เราสามารถใช้วิธีนี้ในการสร้างการทดสอบ - โดยทั่วไปโดยการประมาณพารามิเตอร์ noncentrality λและเห็นว่าสถิติการทดสอบที่อยู่ห่างไกลในหางของ noncentral χ 2 ( 18 , λ )χ2λχ2(18,λ^)การกระจาย (นั่นไม่ได้บอกว่าการทดสอบนี้จะมีพลังมาก)

เราสามารถประมาณค่าพารามิเตอร์ noncentrality ที่กำหนดจากสถิติการทดสอบสองรายการโดยการหาค่าเฉลี่ยและลบองศาอิสระ (วิธีการประมาณค่าช่วงเวลา) ให้ประมาณ 44 หรือโดยความเป็นไปได้สูงสุด:

x <- c(45, 79)
n <- 18

ll <- function(ncp, n, x) sum(dchisq(x, n, ncp, log=TRUE))
foo <- optimize(ll, c(30,60), n=n, x=x, maximum=TRUE)
> foo$maximum
[1] 43.67619

ข้อตกลงที่ดีระหว่างการประมาณค่าทั้งสองของเราไม่น่าแปลกใจจริง ๆ เนื่องจากมีจุดข้อมูลสองจุดและมีอิสระ 18 องศา ตอนนี้เพื่อคำนวณค่า p:

> pchisq(x, n, foo$maximum)
[1] 0.1190264 0.8798421

ดังนั้นค่า p ของเราคือ 0.12, ไม่เพียงพอที่จะปฏิเสธสมมุติฐานว่างว่าสิ่งเร้าทั้งสองเหมือนกัน

การทดสอบนี้จริงมี (ประมาณ) อัตราการปฏิเสธ 5% เมื่อพารามิเตอร์ noncentrality เหมือนกันหรือไม่ มันมีพลังหรือไม่? เราจะพยายามตอบคำถามเหล่านี้โดยการสร้างกราฟพลังงานดังนี้ อันดับแรกเรากำหนดค่าเฉลี่ยที่ค่าประมาณ 43.68 การกระจายทางเลือกสำหรับสองสถิติการทดสอบจะ noncentral χ 2กับ 18 องศาอิสระและพารามิเตอร์ noncentrality ( λ - δλχ2(λ-δ,λ+δ)δ=1,2,...,15δ และดูว่าการทดสอบของเราปฏิเสธบ่อยแค่ไหนพูดระดับความเชื่อมั่น 90% และ 95%

nreject05 <- nreject10 <- rep(0,16)
delta <- 0:15
lambda <- foo$maximum
for (d in delta)
{
  for (i in 1:10000)
  {
    x <- rchisq(2, n, ncp=c(lambda+d,lambda-d))
    lhat <- optimize(ll, c(5,95), n=n, x=x, maximum=TRUE)$maximum
    pval <- pchisq(min(x), n, lhat)
    nreject05[d+1] <- nreject05[d+1] + (pval < 0.05)
    nreject10[d+1] <- nreject10[d+1] + (pval < 0.10)
  }
}
preject05 <- nreject05 / 10000
preject10 <- nreject10 / 10000

plot(preject05~delta, type='l', lty=1, lwd=2,
     ylim = c(0, 0.4),
     xlab = "1/2 difference between NCPs",
     ylab = "Simulated rejection rates",
     main = "")
lines(preject10~delta, type='l', lty=2, lwd=2)
legend("topleft",legend=c(expression(paste(alpha, " = 0.05")),
                          expression(paste(alpha, " = 0.10"))),
       lty=c(1,2), lwd=2)

ซึ่งให้ดังต่อไปนี้:

ป้อนคำอธิบายรูปภาพที่นี่

เมื่อมองไปที่คะแนนสมมติฐานว่างจริง (ค่าแกน x = 0) เราจะเห็นว่าการทดสอบนั้นเป็นแบบอนุรักษ์นิยมซึ่งดูเหมือนว่าจะไม่ปฏิเสธว่าบ่อยครั้งเท่าที่ระดับจะบ่งบอกถึง อย่างที่เราคาดไว้มันไม่มีพลังมากนัก แต่ก็ดีกว่าไม่มีเลย ฉันสงสัยว่ามีการทดสอบที่ดีกว่านี้หรือไม่เนื่องจากข้อมูลที่คุณมีอยู่มีจำนวน จำกัด


ฉันเป็นมือใหม่ในสิ่งนี้ฉันขอให้คุณเรียกใช้สคริปต์ (ถ้าเป็นสคริปต์) จากคำตอบ jbowman ในกรณีของฉันลองรับ OR จาก 90% CI ฉันรู้สึกซาบซึ้งจริงๆถ้ามีใครในพวกคุณสามารถอธิบายให้ฉันได้และฉันใช้ PASW17

สวัสดี ash6 อันที่จริงมันเป็นสคริปต์สำหรับซอฟต์แวร์ R (สำหรับข้อมูลเพิ่มเติม: r-project.org ) ไม่ใช่ไวยากรณ์สำหรับ PASW17 ดังนั้นสคริปต์นี้สามารถเรียกใช้โดยตรงในคอนโซล R สคริปต์นี้ไม่ได้คำนวณช่วงความมั่นใจ แต่ให้ค่า p-value (ที่นี่อย่างแม่นยำ> pchisq (x, n, foo $ สูงสุด ==> [1] p-value = 0.1190264) ที่สอดคล้องกับการทดสอบความแตกต่างระหว่างการทดลอง 2 ครั้ง (ที่นี่ระหว่างสิ่งเร้าสองอย่างในกรณีของสมมุติฐานทางเลือก) และที่นี่เราไม่สามารถปฏิเสธสมมติฐานว่าง ๆ ที่การทดลองทั้งสองให้ผลลัพธ์แบบเดียวกัน
Florian

3

คุณสามารถรับ Cramer's V ซึ่งสามารถตีความได้ว่าเป็นสหสัมพันธ์แปลงให้เป็น Fisher's Z และจากนั้นช่วงความมั่นใจของมันนั้นตรงไปตรงมา (SE = 1 / sqrt (n-3): Z ± se * 1.96) หลังจากที่คุณได้จุดสิ้นสุดของ CI แล้วคุณสามารถแปลงกลับเป็น r

คุณได้พิจารณานำจำนวนการนับทั้งหมดของคุณไปไว้ในตารางฉุกเฉินด้วยมิติการทดสอบเพิ่มเติมหรือไม่


ฉันคิดว่ามันเป็นไปไม่ได้ที่จะใช้พีกับความดีของเพียร์สันที่พอดีไคสแควร์ (1 ตัวแปร) นั่นเป็นเหตุผลที่ฉันพูดถึง w ของโคเฮน แต่สูตรเป็น similars จริง ๆ (phi = X² / n และ w = sqrt (X² / n))! แต่ถ้าเป็นไปได้ในการคำนวณ phi ด้วยการทดสอบนี้และใช้การแปลง r กับ z คุณจะยินยอมให้เราอ้างอิงเพื่อเสนอราคาหรือไม่ เราต้องการใช้การทดสอบนี้ในบทความและผู้ตรวจสอบบางคนอาจเลือกที่จะมีสถิติมาก มันจะเป็นความช่วยเหลือที่ยอดเยี่ยมสำหรับเรา! เกี่ยวกับคำถามของคุณ: เราไม่มีข้อมูลดิบเฉพาะค่าX², df และ p จากบทความที่เผยแพร่ ขอบคุณมาก ๆ สำหรับความช่วยเหลือของคุณ!
Florian

ขออภัย ... ตั้งใจจะวาง Cramer's V ไม่ใช่ phi Cramer's V สามารถใช้เหมือน phi
จอห์น

และไม่ฉันไม่มีการอ้างอิง หากคุณมีเอฟเฟกต์ขนาดใหญ่มันจะไม่สำคัญถ้ามีอคติเล็กน้อยในการวัดนี้ หากคุณไม่มีเอฟเฟกต์ขนาดใหญ่ตรวจสอบให้แน่ใจว่าคุณไม่ได้ทำกระดูกใหญ่ขึ้นจาก "ความสำคัญ" ของการทดสอบใด ๆ
จอห์น
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.