การหาพลังต่อต้านทางเลือกในการยกระดับแบบเอ็กซ์โปเนนเชียลเป็นสิ่งที่ไม่ซับซ้อน
อย่างไรก็ตามฉันไม่ทราบว่าคุณควรใช้ค่าที่คำนวณได้จากข้อมูลของคุณเพื่อคำนวณว่าพลังงานนั้นอาจเป็นเช่นไร การคำนวณพลังงานแบบโพสต์เฉพาะกิจนั้นมีผลทำให้ข้อสรุปโต้กลับ (และอาจทำให้เข้าใจผิด)
พลังเช่นเดียวกับระดับนัยสำคัญเป็นปรากฏการณ์ที่คุณจัดการก่อนความจริง คุณต้องใช้ความเข้าใจเบื้องต้น (รวมถึงทฤษฎีการใช้เหตุผลหรือการศึกษาก่อนหน้านี้) เพื่อตัดสินใจเลือกชุดที่เหมาะสมในการพิจารณาและขนาดผลที่ต้องการ
นอกจากนี้คุณยังสามารถพิจารณาทางเลือกอื่น ๆ ได้หลากหลาย (เช่นคุณสามารถฝังเลขชี้กำลังภายในตระกูลแกมม่าเพื่อพิจารณาผลกระทบของกรณีที่มีความเบ้มากขึ้นหรือน้อยลง)
คำถามปกติที่คน ๆ หนึ่งอาจพยายามตอบโดยการวิเคราะห์พลังงานคือ:
1) อะไรคือพลังงานสำหรับขนาดตัวอย่างที่กำหนดที่ขนาดเอฟเฟกต์บางอย่างหรือชุดของขนาดเอฟเฟกต์ *
2) เมื่อกำหนดขนาดตัวอย่างและกำลังงานจะตรวจจับเอฟเฟกต์ขนาดใหญ่แค่ไหน?
3) เมื่อได้พลังงานที่ต้องการสำหรับขนาดของเอฟเฟกต์พิเศษขนาดตัวอย่างใดที่จำเป็นต้องใช้?
* (ที่นี่ 'ขนาดของเอฟเฟ็กต์' มีวัตถุประสงค์ทั่วไปและอาจเป็นตัวอย่างเช่นอัตราส่วนเฉพาะของวิธีการหรือความแตกต่างของค่าเฉลี่ยไม่จำเป็นต้องเป็นมาตรฐาน)
เห็นได้ชัดว่าคุณมีขนาดตัวอย่างดังนั้นคุณจึงไม่ได้ในกรณี (3) คุณอาจพิจารณากรณีและเหตุผล (2) หรือกรณี (1)
ฉันขอแนะนำเคส (1) (ซึ่งให้วิธีจัดการกับเคส (2))
ในการแสดงวิธีการกรณีและปัญหา (1) และดูว่าเกี่ยวข้องกับกรณี (2) ลองพิจารณาตัวอย่างที่เฉพาะเจาะจงด้วย:
เนื่องจากขนาดตัวอย่างแตกต่างกันเราต้องพิจารณากรณีที่การแพร่กระจายสัมพัทธ์ในตัวอย่างหนึ่งมีขนาดเล็กและใหญ่กว่า 1 (ถ้ามีขนาดเท่ากันการพิจารณาความสมมาตรทำให้สามารถพิจารณาด้านเดียวได้) อย่างไรก็ตามเนื่องจากขนาดค่อนข้างใกล้เคียงกันเอฟเฟกต์จึงมีขนาดเล็กมาก ไม่ว่าในกรณีใดให้แก้ไขพารามิเตอร์สำหรับตัวอย่างใดตัวอย่างหนึ่งและเปลี่ยนอีกตัวอย่าง
ดังนั้นสิ่งหนึ่งที่ทำคือ:
ก่อน:
choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1
วิธีทำการคำนวณ:
for each possible scale multiplier, kappa
repeat nsim times
generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
perform the test
compute the rejection rate across nsim tests at this kappa
ใน R ฉันทำสิ่งนี้:
alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s) # also below and at 1
rr = array(NA,length(s)) # to hold rejection rates
for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
)
plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last
abline(h=alpha,col=8,lty=2) # draw in alpha
ซึ่งให้กำลัง "โค้ง" ต่อไปนี้
แกน x อยู่ในระดับล็อกแกน y คืออัตราการปฏิเสธ
เป็นการยากที่จะบอกที่นี่ แต่จุดสีดำอยู่ทางด้านซ้ายสูงกว่าด้านขวาเล็กน้อย (นั่นคือมีพลังงานมากกว่าเล็กน้อยเมื่อกลุ่มตัวอย่างขนาดใหญ่มีขนาดเล็กกว่า)
การใช้ cdf ผกผันปกติเป็นการแปลงอัตราการปฏิเสธเราสามารถสร้างความสัมพันธ์ระหว่างอัตราการปฏิเสธการแปลงและ log kappa (kappa อยู่s
ในพล็อต แต่แกน x ถูกบันทึกการปรับขนาด) เกือบเป็นเส้นตรงมาก (ยกเว้นใกล้ 0 ) และจำนวนของการจำลองมีสูงพอที่เสียงรบกวนจะต่ำมาก - เราสามารถเพิกเฉยมันได้เพื่อจุดประสงค์ในปัจจุบัน
เราก็แค่ใช้การประมาณเชิงเส้น ด้านล่างนี้เป็นขนาดเอฟเฟกต์โดยประมาณสำหรับพลังงาน 50% และ 80% สำหรับขนาดตัวอย่างของคุณ:
ขนาดเอฟเฟกต์ในอีกด้านหนึ่ง (กลุ่มที่ใหญ่กว่ามีขนาดเล็กกว่า) จะเปลี่ยนจากเล็กน้อย (สามารถรับเอฟเฟกต์ขนาดเล็กลงเล็กน้อย) แต่มันสร้างความแตกต่างเล็กน้อยดังนั้นฉันจะไม่ใช้แรงงาน
ดังนั้นการทดสอบจะรับความแตกต่างอย่างมีนัยสำคัญ (จากอัตราส่วนของเครื่องชั่ง 1) แต่ไม่ใช่การทดสอบเล็กน้อย
ตอนนี้สำหรับความคิดเห็นบางส่วน: ฉันไม่คิดว่าการทดสอบสมมติฐานมีความเกี่ยวข้องโดยเฉพาะอย่างยิ่งกับคำถามพื้นฐานที่น่าสนใจ ( มันค่อนข้างคล้ายกันหรือไม่ ) และดังนั้นการคำนวณพลังงานเหล่านี้ไม่ได้บอกอะไรเราที่เกี่ยวข้องโดยตรงกับคำถามนั้น
ฉันคิดว่าคุณตอบคำถามที่มีประโยชน์มากขึ้นโดยการกำหนดสิ่งที่คุณคิดว่า "สำคัญเหมือนกัน" จริงหมายถึงการดำเนินการ การติดตามกิจกรรมทางสถิติอย่างมีเหตุผลควรนำไปสู่การวิเคราะห์ข้อมูลที่มีความหมาย