การวิเคราะห์พลังงานสำหรับข้อมูลทวินามเมื่อสมมติฐานว่างคือ


10

ฉันต้องการทำการวิเคราะห์พลังงานสำหรับตัวอย่างเดียวจากข้อมูลทวินามด้วย , กับโดยที่คือสัดส่วนของความสำเร็จในประชากร ถ้าฉันสามารถใช้การประมาณแบบปกติกับทวินามหรือทดสอบ แต่ด้วยทั้งคู่จะล้มเหลว ฉันชอบที่จะรู้ว่าหากมีวิธีการวิเคราะห์นี้ ฉันขอขอบคุณข้อเสนอแนะความคิดเห็นหรือการอ้างอิงใด ๆ ขอบคุณมาก!H 1 : p = 0.001 p 0 < p < 1 χ 2 p = 0H0:p=0H1:p=0.001p0<p<1χ2p=0


ดังนั้นทำไมคุณไม่ใช้การทดสอบ Clopper-Pearson ที่แน่นอน
Stéphane Laurent

2
ฉันหวังว่าคุณจะมีตัวอย่างที่ยิ่งใหญ่จริงๆ ! มันจะยากที่จะทดสอบ
Peter Flom

คำตอบ:


13

คุณมีด้านเดียวสมมติฐานทางเลือกที่แน่นอนที่และ0 p 1 = 0.001 p 0 = 0p1>p0p1=0.001p0=0

  • ขั้นตอนแรกคือการระบุขีด จำกัดสำหรับจำนวนความสำเร็จเช่นว่าโอกาสที่จะได้รับความสำเร็จอย่างน้อยในตัวอย่างของขนาดต่ำมากภายใต้สมมติฐานว่าง (ตามอัตภาพ ) ในกรณีของคุณโดยไม่คำนึงถึงในการเลือกของคุณโดยเฉพาะสำหรับและ0ccnα=0.05c=1n1α>0
  • ขั้นตอนที่สองคือการหาความน่าจะเป็นที่จะได้รับความสำเร็จอย่างน้อยในตัวอย่างขนาดภายใต้สมมติฐานทางเลือก - นี่คือพลังของคุณ ที่นี่คุณต้องมีคงที่ซึ่งการแจกแจงแบบทวินามถูกระบุไว้อย่างสมบูรณ์cnnB(n,p1)

ขั้นตอนที่สองใน R กับ :n=500

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

เพื่อให้ทราบว่าการเปลี่ยนแปลงพลังงานกับขนาดตัวอย่างคุณสามารถวาดฟังก์ชันพลังงานได้: ป้อนคำอธิบายรูปภาพที่นี่

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

หากคุณต้องการทราบขนาดตัวอย่างที่คุณต้องการเพื่อให้ได้พลังงานอย่างน้อยที่กำหนดไว้ล่วงหน้าคุณสามารถใช้ค่าพลังงานที่คำนวณได้ข้างต้น สมมติว่าคุณต้องการพลังงานอย่างน้อย0.50.5

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

ดังนั้นคุณจึงจำเป็นต้องมีขนาดของกลุ่มตัวอย่างอย่างน้อยเพื่อให้บรรลุอำนาจของ0.56930.5


ตามpwr.p.testกำลัง 0.5 คุณต้องมีการสังเกตอย่างน้อย 677 ครั้ง แต่พลังงาน = 0.5 ต่ำมาก!
เจสสิก้า

@caracal คุณใช้การประมาณแบบปกติเพื่อให้ได้กราฟพลังงานของคุณหรือไม่? ฟังก์ชั่นพลังงานทวินามที่แน่นอนจะไม่ราบรื่น มันคือฟันเลื่อยซึ่งคุณสามารถดูได้ว่าแกนขนาดตัวอย่างนั้นถูกขยายหรือไม่ ฉันคุยเรื่องนี้ในบทความปี 2002 ของฉันใน American Statisticsian ซึ่งได้รับอนุญาตจาก Christine Liu นอกจากนี้ทวินามยังเอียงอย่างมากที่ p ต่ำมากซึ่ง n ต้องมีขนาดใหญ่เพื่อให้การประมาณค่าปกติทำงานได้ดี
Michael R. Chernick

2
@MichaelChernick ไม่นี่มาจากการแจกแจงทวินามไม่ใช่จากการประมาณปกติ แน่นอนว่าคุณพูดถูก - โดยทั่วไป - พลังสำหรับการทดสอบทวินามคือฟังก์ชั่นฟันเลื่อยที่ไม่ใช่แบบโมโนโทนิก แต่ทราบว่าเรามีกรณีพิเศษที่นี่กับ0 ซึ่งหมายความว่าพื้นที่ได้รับการยอมรับสำหรับสมมติฐานทางเลือกที่จะเริ่มต้นวันที่ 1 โดยไม่คำนึงถึงnด้วยเกณฑ์คง , คงอำนาจเป็นฟังก์ชัน inreasing อย่างเคร่งครัดของnp0=0nc=1p1=0.001n
caracal

@Jessica โปรดทราบว่าpwr.p.test()ใช้การประมาณปกติไม่ใช่การแจกแจงทวินามที่แน่นอน เพียงพิมพ์pwr.p.testเพื่อดูซอร์สโค้ด คุณจะพบการโทรเพื่อpnorm()แสดงว่ามีการใช้การประมาณ
caracal

1
@caracal ดังนั้นฉันสามารถดูได้ด้วยวิธีนี้: ภายใต้สมมติฐานว่างความน่าจะเป็นของความสำเร็จคือ 0 ดังนั้นถ้าคุณเคยเห็นความสำเร็จคุณสามารถปฏิเสธสมมติฐานว่างได้ นั่นคือเหตุผลที่คุณพูดว่า threshold เป็น 1 เพราะหากผลรวมทวินามเคยเป็น 1 คุณสามารถปฏิเสธด้วยข้อผิดพลาดประเภท 2 ที่ 0! ตอนนี้ภายใต้ทางเลือกความน่าจะเป็นที่จะประสบความสำเร็จครั้งแรกในการทดลองที่ n คือ (1-p) p ความน่าจะเป็นนี้จะเป็น 0 เมื่อ n ไปที่อนันต์ ดังนั้นกฎต่อเนื่องจะหยุดเมื่อ S = 1 มีกำลัง 1 สำหรับ p> 0 n1n
Michael R. Chernick

3

คุณสามารถตอบคำถามนี้ได้อย่างง่ายดายด้วยpwrแพ็คเกจในอาร์

คุณจะต้องกำหนดระดับนัยสำคัญกำลังไฟและขนาดเอฟเฟกต์ โดยทั่วไประดับนัยสำคัญถูกตั้งไว้ที่ 0.05 และตั้งค่ากำลังเป็น 0.8 พลังงานที่สูงขึ้นจะต้องมีการสังเกตเพิ่มเติม ระดับนัยสำคัญที่ต่ำกว่าจะลดพลังงาน

ขนาดของเอฟเฟกต์สำหรับสัดส่วนที่ใช้ในแพ็คเกจนี้คือ h ของโคเฮน ทางลัดสำหรับเอชขนาดเล็กมักจะเป็น 0.20 ทางลัดที่เกิดขึ้นจริงแตกต่างกันไปตามการใช้งานและอาจมีขนาดเล็กในกรณีของคุณ h ที่เล็กกว่าหมายถึงต้องมีการสังเกตเพิ่มเติม คุณบอกว่าทางเลือกของคุณคือ0.001 นั่นเล็กมากp=0.001

> ES.h(.001, 0)
[1] 0.0632561

แต่เรายังคงสามารถดำเนินการต่อไปได้

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

เมื่อใช้ค่าเหล่านี้คุณต้องมีการสังเกตการณ์อย่างน้อย 1,546 ครั้ง


1

ในกรณีเฉพาะของคุณมีวิธีแก้ไขปัญหาอย่างง่าย ๆ :

ภายใต้สมมติฐานว่างเฉพาะคุณไม่ควรสังเกตความสำเร็จ ดังนั้นทันทีที่คุณสังเกตหนึ่งความสำเร็จที่คุณสามารถมั่นใจได้ว่าPH0:p=0p0

ภายใต้ทางเลือกจำนวนการทดลองที่ต้องใช้เพื่อสังเกตความสำเร็จอย่างน้อย 1 ครั้งเป็นไปตามการกระจายทางเรขาคณิต ดังนั้นเพื่อให้ได้ขนาดตัวอย่างขั้นต่ำเพื่อให้ได้พลังงานคุณต้องหา k ที่เล็กที่สุดเช่นนั้นH1:p=0.0011β

1β1(1p)(k1)

ดังนั้นด้วยเพื่อให้ได้พลังงานคุณต้องมีอย่างน้อย 1610 ตัวอย่างp=0.00180


ในการอ่านความคิดเห็นต่อโซลูชันที่ 1 ฉันรู้ว่านี่เป็นวิธีแก้ปัญหาเดียวกับที่คุณได้รับหากเกาะติดเพื่อตอบคำถาม อย่างไรก็ตามมันไม่เคยเป็นอันตรายที่จะสะกดออกผลลัพธ์ทฤษฎีความน่าจะเป็นพื้นฐานบางอย่างโดยไม่จำเป็นต้องมาถึงที่นี่โดยสัญชาตญาณ
ลอย
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.