เป็นไปได้ไหมที่จะทำการวิเคราะห์พลังงานสำหรับการทดสอบ Kruskal-Wallis และ Mann-Whitney U? ถ้าใช่จะมีแพ็คเกจ / ฟังก์ชั่น R ใดบ้างที่ใช้งานได้?
เป็นไปได้ไหมที่จะทำการวิเคราะห์พลังงานสำหรับการทดสอบ Kruskal-Wallis และ Mann-Whitney U? ถ้าใช่จะมีแพ็คเกจ / ฟังก์ชั่น R ใดบ้างที่ใช้งานได้?
คำตอบ:
แน่นอนว่าเป็นไปได้ในการคำนวณพลังงาน
จะมีความเฉพาะเจาะจงมากขึ้น - ถ้าคุณตั้งสมมติฐานให้เพียงพอเพื่อให้ได้สถานการณ์ที่คุณสามารถคำนวณความน่าจะเป็นที่จะถูกปฏิเสธ (ในบางกรณี) คุณสามารถคำนวณพลังงานได้
ใน Wilcoxon-Mann-Whitney ถ้า (ตัวอย่าง) คุณถือว่ารูปร่างการแจกแจง (ทำสมมติฐานเกี่ยวกับรูปแบบการกระจายและทำการตั้งสมมติฐานบางอย่างเกี่ยวกับตาชั่ง (สเปรด)) และค่าเฉพาะของตำแหน่งหรือความแตกต่างในตำแหน่งที่ตั้ง คุณอาจคำนวณพลังเชิงพีชคณิตหรือการรวมเชิงตัวเลขได้ ความล้มเหลวที่คุณสามารถจำลองอัตราการปฏิเสธ
ตัวอย่างเช่นถ้าเราสมมติว่าการสุ่มตัวอย่างจากการด้วยการระบุตำแหน่งที่แตกต่าง (มาตรฐานสำหรับมาตราส่วนทั่วไป) จากนั้นกำหนดขนาดตัวอย่างเราสามารถจำลองชุดข้อมูลจำนวนมากที่สอดคล้องกับเงื่อนไขเหล่านั้นทั้งหมดและประเมินอัตราการปฏิเสธ ดังนั้นสมมติว่าเรามีสองตัวอย่างกระจาย (ครอบครัวตั้งขนาด) ที่มีขนาดหน่วย ( ) - โดยไม่สูญเสียของทั่วไป - และมีความแตกต่างที่ตั้ง 1 เราสามารถรับได้อีกครั้ง จากนั้นสำหรับขนาดตัวอย่างที่ระบุ - (พูด) - เราสามารถจำลองการสังเกตและด้วยเหตุนี้พลังงานสำหรับค่าเฉพาะนั้นของ(เช่น ) นี่คือตัวอย่างรวดเร็วใน R:
n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res) # res will be logical ("TRUE" = reject); mean is rej rate
แบบจำลองสามแบบที่สร้างอัตราการปฏิเสธ 0.321, 0.321 และ 0.316; เห็นได้ชัดว่ากำลังอยู่ในบริเวณใกล้เคียง 0.32 (คุณสามารถคำนวณช่วงความมั่นใจจากการจำลองเหล่านั้นเพียงครั้งเดียวเนื่องจากจำนวนการปฏิเสธเป็นแบบทวินาม ) ในทางปฏิบัติฉันมักจะใช้แบบจำลองที่มีขนาดใหญ่กว่า แต่ถ้าคุณกำลังจำลองจำนวนมากของหรือคุณอาจไม่ต้องการไปมากกว่า 10,000 แบบจำลองสำหรับแต่ละคน
ด้วยการทำตามค่าจำนวนมากของการเปลี่ยนตำแหน่งคุณสามารถรับเส้นโค้งพลังงานสำหรับชุดของสถานการณ์นั้น ๆ ได้หากการเปลี่ยนตำแหน่งนั้นเปลี่ยนไปหากคุณต้องการ
ในตัวอย่างขนาดใหญ่ที่เพิ่มเป็นสองเท่าและจะเป็นครึ่งหนึ่ง (และเพิ่มขึ้นที่กำหนด ) ดังนั้นคุณมักจะได้รับการประมาณค่าที่ดีที่
โปรดทราบว่าในขณะที่การทดสอบเหล่านี้ไม่มีการแจกแจง (สำหรับการแจกแจงแบบต่อเนื่อง) ภายใต้ค่า Null พฤติกรรมจะแตกต่างกันภายใต้สมมติฐานการกระจายที่แตกต่างกันสำหรับทางเลือก
สถานการณ์สำหรับ Kruskal-Wallis นั้นคล้ายคลึงกัน แต่คุณมีการเปลี่ยนตำแหน่งมากขึ้น (หรือสถานการณ์อื่น ๆ ที่คุณกำลังมองหา) เพื่อระบุ
พล็อตในคำตอบนี้แสดงการเปรียบเทียบของเส้นโค้งกำลังไฟสำหรับการทดสอบคู่ที่จับคู่กับกำลังงานจำลองสำหรับการทดสอบระดับที่ลงนามในขนาดตัวอย่างที่เฉพาะเจาะจงข้ามการเปลี่ยนตำแหน่งมาตรฐานที่หลากหลายสำหรับการสุ่มตัวอย่างจากการแจกแจงแบบปกติ การคำนวณที่คล้ายกันสามารถทำได้สำหรับ Mann-Whitney และ Kruskal-Wallis
ฉันมีคำถามเช่นเดียวกับคุณ หลังจากค้นหาแล้วฉันพบแพ็คเกจนี้: https://cran.r-project.org/web/packages/MultNonParam/MultNonParam.pdf
kwpower (nreps, shift, distname = c ("ปกติ", "logistic"), ระดับ = 0.05, mc = 0, taylor = FALSE)
nreps: ตัวเลขในแต่ละกลุ่ม
กะ: การชดเชยสำหรับประชากรต่าง ๆ ภายใต้สมมติฐานทางเลือก
distname: การแจกแจงของการสังเกตพื้นฐาน ปกติและโลจิสติกได้รับการสนับสนุนในปัจจุบัน
ระดับ: ระดับการทดสอบ
mc: 0 สำหรับการคำนวณแบบ asymptotic หรือบวกสำหรับการประมาณ mc เทย์เลอร์: ตรรกะการพิจารณาว่าเทย์เลอร์ซีรีส์ถูกใช้สำหรับความน่าจะเป็นหรือไม่