การวิเคราะห์กำลังไฟสำหรับการทดสอบ Kruskal-Wallis หรือ Mann-Whitney U โดยใช้ R?


14

เป็นไปได้ไหมที่จะทำการวิเคราะห์พลังงานสำหรับการทดสอบ Kruskal-Wallis และ Mann-Whitney U? ถ้าใช่จะมีแพ็คเกจ / ฟังก์ชั่น R ใดบ้างที่ใช้งานได้?


สิ่งนี้อาจมีประโยชน์: stats.stackexchange.com/questions/65808/…

ใน R. มีแพ็คเกจ pwr แต่มันไม่ได้ทำการทดสอบพลังของ Kruskal-Wallis
Hong Zhan

คำตอบ:


3

แน่นอนว่าเป็นไปได้ในการคำนวณพลังงาน

จะมีความเฉพาะเจาะจงมากขึ้น - ถ้าคุณตั้งสมมติฐานให้เพียงพอเพื่อให้ได้สถานการณ์ที่คุณสามารถคำนวณความน่าจะเป็นที่จะถูกปฏิเสธ (ในบางกรณี) คุณสามารถคำนวณพลังงานได้

ใน Wilcoxon-Mann-Whitney ถ้า (ตัวอย่าง) คุณถือว่ารูปร่างการแจกแจง (ทำสมมติฐานเกี่ยวกับรูปแบบการกระจายและทำการตั้งสมมติฐานบางอย่างเกี่ยวกับตาชั่ง (สเปรด)) และค่าเฉพาะของตำแหน่งหรือความแตกต่างในตำแหน่งที่ตั้ง คุณอาจคำนวณพลังเชิงพีชคณิตหรือการรวมเชิงตัวเลขได้ ความล้มเหลวที่คุณสามารถจำลองอัตราการปฏิเสธ

ตัวอย่างเช่นถ้าเราสมมติว่าการสุ่มตัวอย่างจากการด้วยการระบุตำแหน่งที่แตกต่าง (มาตรฐานสำหรับมาตราส่วนทั่วไป) จากนั้นกำหนดขนาดตัวอย่างเราสามารถจำลองชุดข้อมูลจำนวนมากที่สอดคล้องกับเงื่อนไขเหล่านั้นทั้งหมดและประเมินอัตราการปฏิเสธ ดังนั้นสมมติว่าเรามีสองตัวอย่างกระจาย (ครอบครัวตั้งขนาด) ที่มีขนาดหน่วย ( ) - โดยไม่สูญเสียของทั่วไป - และมีความแตกต่างที่ตั้ง 1 เราสามารถรับได้อีกครั้ง จากนั้นสำหรับขนาดตัวอย่างที่ระบุ - (พูด) - เราสามารถจำลองการสังเกตและด้วยเหตุนี้พลังงานสำหรับค่าเฉพาะนั้นของt5t5σ=1δ=μ2μ1=1μ1=0n1=6,n2=9δ/σ(เช่น ) นี่คือตัวอย่างรวดเร็วใน R:1

n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res)  # res will be logical ("TRUE" = reject); mean is rej rate

แบบจำลองสามแบบที่สร้างอัตราการปฏิเสธ 0.321, 0.321 และ 0.316; เห็นได้ชัดว่ากำลังอยู่ในบริเวณใกล้เคียง 0.32 (คุณสามารถคำนวณช่วงความมั่นใจจากการจำลองเหล่านั้นเพียงครั้งเดียวเนื่องจากจำนวนการปฏิเสธเป็นแบบทวินาม ) ในทางปฏิบัติฉันมักจะใช้แบบจำลองที่มีขนาดใหญ่กว่า แต่ถ้าคุณกำลังจำลองจำนวนมากของหรือคุณอาจไม่ต้องการไปมากกว่า 10,000 แบบจำลองสำหรับแต่ละคนnδ

ด้วยการทำตามค่าจำนวนมากของการเปลี่ยนตำแหน่งคุณสามารถรับเส้นโค้งพลังงานสำหรับชุดของสถานการณ์นั้น ๆ ได้หากการเปลี่ยนตำแหน่งนั้นเปลี่ยนไปหากคุณต้องการ

ในตัวอย่างขนาดใหญ่ที่เพิ่มเป็นสองเท่าและจะเป็นครึ่งหนึ่ง (และเพิ่มขึ้นที่กำหนด ) ดังนั้นคุณมักจะได้รับการประมาณค่าที่ดีที่n1n2σ2δ/σδnn1biδ=δiΦ1(1b)δδδnδ

P(Y2>Y1)

โปรดทราบว่าในขณะที่การทดสอบเหล่านี้ไม่มีการแจกแจง (สำหรับการแจกแจงแบบต่อเนื่อง) ภายใต้ค่า Null พฤติกรรมจะแตกต่างกันภายใต้สมมติฐานการกระจายที่แตกต่างกันสำหรับทางเลือก

สถานการณ์สำหรับ Kruskal-Wallis นั้นคล้ายคลึงกัน แต่คุณมีการเปลี่ยนตำแหน่งมากขึ้น (หรือสถานการณ์อื่น ๆ ที่คุณกำลังมองหา) เพื่อระบุ

พล็อตในคำตอบนี้แสดงการเปรียบเทียบของเส้นโค้งกำลังไฟสำหรับการทดสอบคู่ที่จับคู่กับกำลังงานจำลองสำหรับการทดสอบระดับที่ลงนามในขนาดตัวอย่างที่เฉพาะเจาะจงข้ามการเปลี่ยนตำแหน่งมาตรฐานที่หลากหลายสำหรับการสุ่มตัวอย่างจากการแจกแจงแบบปกติ การคำนวณที่คล้ายกันสามารถทำได้สำหรับ Mann-Whitney และ Kruskal-Wallis


1

ฉันมีคำถามเช่นเดียวกับคุณ หลังจากค้นหาแล้วฉันพบแพ็คเกจนี้: https://cran.r-project.org/web/packages/MultNonParam/MultNonParam.pdf

kwpower (nreps, shift, distname = c ("ปกติ", "logistic"), ระดับ = 0.05, mc = 0, taylor = FALSE)

nreps: ตัวเลขในแต่ละกลุ่ม

กะ: การชดเชยสำหรับประชากรต่าง ๆ ภายใต้สมมติฐานทางเลือก

distname: การแจกแจงของการสังเกตพื้นฐาน ปกติและโลจิสติกได้รับการสนับสนุนในปัจจุบัน

ระดับ: ระดับการทดสอบ

mc: 0 สำหรับการคำนวณแบบ asymptotic หรือบวกสำหรับการประมาณ mc เทย์เลอร์: ตรรกะการพิจารณาว่าเทย์เลอร์ซีรีส์ถูกใช้สำหรับความน่าจะเป็นหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.