คำถามติดแท็ก power-analysis

การสอบถามเกี่ยวกับคุณภาพของการทดสอบทางสถิติโดยการคำนวณกำลังไฟฟ้า - ความน่าจะเป็นในการปฏิเสธสมมติฐานว่างเนื่องจากเป็นเท็จ - ภายใต้สถานการณ์บางอย่าง การวิเคราะห์พลังงานมักใช้เมื่อวางแผนการศึกษาเพื่อกำหนดขนาดตัวอย่างที่จำเป็นเพื่อให้ได้ระดับพลังงานที่กำหนด (เช่น80%) สำหรับขนาดเอฟเฟกต์ที่กำหนด ในหลาย ๆ สถานการณ์การคำนวณเชิงทฤษฎีนั้นเป็นเรื่องยากมากดังนั้นการวิเคราะห์พลังงานจึงทำได้โดยการจำลอง

4
การวิเคราะห์กำลังไฟสำหรับการถดถอยโลจิสติกอันดับ
ฉันกำลังมองหาโปรแกรม (ใน R หรือ SAS หรือสแตนด์อะโลนถ้าฟรีหรือต้นทุนต่ำ) ที่จะทำการวิเคราะห์พลังงานสำหรับการถดถอยโลจิสติกอันดับ

2
เมื่อไร (ถ้าเคย) มันเป็นความคิดที่ดีที่จะทำการวิเคราะห์พลังงานหลังฉาก?
ความเข้าใจของฉันคือว่าการวิเคราะห์พลังงานจะโพสต์เฉพาะกิจถ้าหากใช้ขนาดผลกระทบที่สังเกตได้เป็นขนาดผลกระทบประชากรเป้าหมาย

2
ฉันจะค้นหาความน่าจะเป็นของข้อผิดพลาด type II ได้อย่างไร
ฉันรู้ว่าข้อผิดพลาด Type II เป็นที่ที่ H1 เป็นจริง แต่ H0 ไม่ถูกปฏิเสธ คำถาม ฉันจะคำนวณความน่าจะเป็นของข้อผิดพลาด Type II ที่เกี่ยวข้องกับการแจกแจงแบบปกติที่ค่าเบี่ยงเบนมาตรฐานเป็นที่รู้จักได้อย่างไร

1
คุณสมบัติทางสถิติ '' ที่ต้องการ '' ของการทดสอบอัตราส่วนความน่าจะเป็นคืออะไร
ฉันกำลังอ่านบทความที่มีวิธีการทดสอบอย่างเต็มรูปแบบตามอัตราส่วนความน่าจะเป็น ผู้เขียนกล่าวว่าการทดสอบ LR กับทางเลือกด้านเดียวคือ UMP เขาดำเนินการโดยอ้างว่า "... ถึงแม้จะไม่สามารถแสดงให้เห็นว่ามีประสิทธิภาพมากที่สุด แต่การทดสอบ LR มักจะมีคุณสมบัติทางสถิติที่น่าพอใจ ฉันสงสัยว่าคุณสมบัติทางสถิติมีความหมายที่นี่ เนื่องจากผู้เขียนอ้างถึงคนที่ผ่านไปฉันถือว่าพวกเขาเป็นความรู้ทั่วไปในหมู่นักสถิติ คุณสมบัติที่พึงประสงค์เพียงอย่างเดียวที่ฉันสามารถหาได้คือการกระจายแบบไคม์สแควร์ asymptotic ของ (ภายใต้เงื่อนไขปกติ) โดยที่เป็นอัตราส่วน LR−2logλ−2log⁡λ-2 \log \lambdaλλ\lambda ฉันจะขอบคุณสำหรับการอ้างอิงถึงข้อความคลาสสิกที่หนึ่งสามารถอ่านเกี่ยวกับคุณสมบัติที่ต้องการ

2
พลังของการทดสอบการถดถอย F คืออะไร?
การทดสอบ F แบบคลาสสิกสำหรับชุดย่อยของตัวแปรในการถดถอยหลายชั้นมีรูปแบบ ที่SSE(R)คือผลรวมของความคลาดเคลื่อนกำลังสองภายใต้โมเดล 'ลดลง' ซึ่งทำรังอยู่ภายใน 'ใหญ่' รุ่นBและdfคือองศาอิสระของทั้งสองโมเดล ภายใต้สมมติฐานว่างว่าตัวแปรพิเศษในโมเดล 'ใหญ่' ไม่มีกำลังอธิบายเชิงเส้นสถิติจะถูกกระจายเป็น F กับdfR-dfBและdfBองศาอิสระF=(SSE(R)−SSE(B))/(dfR−dfB)SSE(B)/dfB,F=(SSE(R)−SSE(B))/(dfR−dfB)SSE(B)/dfB, F = \frac{(\mbox{SSE}(R) - \mbox{SSE}(B))/(df_R - df_B)}{\mbox{SSE}(B)/df_B}, SSE(R)SSE(R)\mbox{SSE}(R)BBBdfdfdfdfR−dfBdfR−dfBdf_R - df_BdfBdfBdf_B การกระจายตัวคืออะไรภายใต้ทางเลือก ฉันคิดว่ามันไม่ใช่แบบกึ่งกลาง F (ฉันหวังว่าจะไม่ใช่แบบไม่เป็นศูนย์กลางเป็นสองเท่า) แต่ฉันไม่สามารถค้นหาการอ้างอิงใด ๆ ว่าพารามิเตอร์ที่ไม่ใช่ศูนย์กลางคืออะไร ฉันจะคิดว่ามันขึ้นอยู่กับการถดถอยจริงค่าสัมประสิทธิ์และอาจจะเกี่ยวกับการออกแบบเมทริกซ์Xแต่นอกเหนือจากนั้นผมไม่แน่ใจว่าββ\betaXXX

4
การศึกษามีความหมายมากเกินไปหมายความว่าอย่างไร
การศึกษามีความหมายมากเกินไปหมายความว่าอย่างไร ความประทับใจของฉันคือมันหมายความว่าขนาดตัวอย่างของคุณมีขนาดใหญ่มากจนคุณมีอำนาจในการตรวจจับขนาดเอฟเฟกต์จิ๋ว ขนาดของเอฟเฟกต์เหล่านี้อาจมีขนาดเล็กจนพวกมันมีแนวโน้มที่จะเป็นผลมาจากความเอนเอียงเล็กน้อยในกระบวนการสุ่มตัวอย่างมากกว่าการเชื่อมต่อเชิงสาเหตุ (ไม่จำเป็นโดยตรง) ระหว่างตัวแปร นี่เป็นสัญชาตญาณที่ถูกต้องหรือไม่? ถ้าเป็นเช่นนั้นฉันไม่เห็นว่าเรื่องใหญ่คืออะไรตราบใดที่ผลลัพธ์ถูกตีความในแสงนั้นและคุณตรวจสอบด้วยตนเองและดูว่าขนาดของเอฟเฟกต์โดยประมาณนั้นใหญ่พอที่จะ "มีความหมาย" หรือไม่ ฉันพลาดอะไรไปรึเปล่า? มีข้อเสนอแนะที่ดีกว่าว่าจะทำอย่างไรในสถานการณ์นี้?

1
การวิเคราะห์พลังงานเพื่อการวิเคราะห์การเอาชีวิตรอด
ถ้าฉันสมมุติว่าลายเซ็นของยีนจะระบุตัวตนที่มีความเสี่ยงต่ำของการเกิดซ้ำนั่นคือลดลง 0.5 (อัตราส่วนอันตราย 0.5) อัตราการเกิดเหตุการณ์ใน 20% ของประชากรและฉันตั้งใจจะใช้ตัวอย่างจากการศึกษาแบบย้อนหลัง ขนาดตัวอย่างจะต้องมีการปรับสำหรับตัวเลขที่ไม่เท่ากันในสองกลุ่มสมมติฐาน? ตัวอย่างเช่นการใช้ Collett, D: Modeling Data Survival ในการวิจัยทางการแพทย์, Second Edition - 2nd Edition 2003 จำนวนทั้งหมดของเหตุการณ์ที่ต้องการ, d, สามารถพบได้โดยใช้, d=(Zα/2+Zβ/2)2p1p2(θR)2d=(Zα/2+Zβ/2)2p1p2(θR)2\begin{equation} d = \frac{(Z_{\alpha/2} + Z_{\beta/2})^2}{p_1 p_2 (\theta R)^2} \end{equation} โดยที่และเป็นจุดสูงสุดและตอนบนตามลำดับของการแจกแจงแบบปกติมาตรฐานZα/2Zα/2Z_{\alpha/2}Zβ/2Zβ/2Z_{\beta/2}α/2α/2\alpha/2β/2β/2\beta/2 สำหรับค่าเฉพาะ p1=0.20p1=0.20p_1 = 0.20 p2=1−p1p2=1−p1p_2 = 1 - p_1 θR=−0.693θR=−0.693\theta R = -0.693 α=0.05α=0.05\alpha = …

1
พารามิเตอร์ Noncentrality - มันคืออะไรมันทำอะไรอะไรจะเป็นค่าที่แนะนำ?
ฉันพยายามทำความเข้าใจเกี่ยวกับสถิติของฉันโดยเฉพาะอย่างยิ่งเกี่ยวกับการกำหนดขนาดตัวอย่างและการวิเคราะห์พลังงานทางสถิติ แต่ดูเหมือนว่ายิ่งฉันอ่านมากกว่าที่ฉันต้องอ่าน อย่างไรก็ตามฉันพบเครื่องมือที่เรียกว่าG * Powerซึ่งดูเหมือนว่าจะทำทุกอย่างที่ฉันต้องการ แต่ฉันมีปัญหาในการทำความเข้าใจพารามิเตอร์ Noncentrality มันคืออะไรมันทำอะไรทำอะไรจะเป็นค่าที่แนะนำ ฯลฯ ข้อมูลเกี่ยวกับวิกิพีเดีย ฯลฯ นั้นไม่สมบูรณ์หรือฉันไม่เข้าใจงาน ฉันกำลังดำเนินการชุดการทดสอบ z แบบสองหางหากนั่นคือความช่วยเหลือใด ๆ ps ทุกคนสามารถเพิ่มแท็กที่ดีกว่าให้กับคำถามนี้ได้ไหม

1
จำนวนของการจำลองที่จำเป็นสำหรับการวิเคราะห์ Monte Carlo
คำถามของฉันเกี่ยวกับการจำลองจำนวนที่ต้องการสำหรับวิธีการวิเคราะห์ Monte Carlo เท่าที่ฉันเห็นจำนวนการจำลองที่ต้องการสำหรับข้อผิดพลาดเปอร์เซ็นต์ที่อนุญาต (เช่น 5) คือ EEEn = { 100 ⋅ zค⋅ std ( x )E⋅ เฉลี่ย( x )}2,n={100⋅Zค⋅มาตรฐาน(x)E⋅ค่าเฉลี่ย(x)}2, n = \left\{\frac{100 \cdot z_c \cdot \text{std}(x)}{E \cdot \text{mean}(x)} \right\}^2 , โดยที่เป็นค่าเบี่ยงเบนมาตรฐานของการสุ่มตัวอย่างที่เกิดขึ้นและคือสัมประสิทธิ์ระดับความเชื่อมั่น (เช่น 95% คือ 1.96) ดังนั้นด้วยวิธีนี้จึงเป็นไปได้ที่จะตรวจสอบว่าค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของการจำลองแสดงถึงค่าเฉลี่ยจริงและค่าเบี่ยงเบนมาตรฐานที่ระดับความเชื่อมั่น 95%มาตรฐาน( x )มาตรฐาน(x)\text{std}(x)ZคZคz_cnnn ในกรณีของฉันฉันใช้ simualtion 7500 ครั้งและคำนวณหาค่าเฉลี่ยเคลื่อนที่และค่าเบี่ยงเบนมาตรฐานสำหรับแต่ละชุด 100 ตัวอย่างจากการจำลอง 7500 จำนวนการจำลองที่ต้องการที่ฉันได้รับน้อยกว่า 100 เสมอ …

1
การกำหนดขนาดตัวอย่างด้วยสัดส่วนและการแจกแจงทวินาม
ฉันกำลังพยายามเรียนรู้สถิติบางอย่างโดยใช้หนังสือ Biometry โดย Sokal และ Rohlf (3e) นี่คือแบบฝึกหัดในบทที่ 5 ซึ่งครอบคลุมความน่าจะเป็นการแจกแจงทวินามและการแจกแจงปัวซอง ฉันรู้ว่ามีสูตรสำหรับสร้างคำตอบสำหรับคำถามนี้: อย่างไรก็ตามสมการนี้ไม่ได้อยู่ในข้อความนี้ ฉันต้องการทราบวิธีการคำนวณขนาดตัวอย่างที่ทราบเฉพาะความน่าจะเป็นระดับความเชื่อมั่นที่ต้องการและการกระจายแบบทวินาม มีทรัพยากรใดบ้างที่ครอบคลุมหัวข้อนี้ที่ฉันสามารถชี้ได้ ฉันลองใช้ Google แล้ว แต่สิ่งที่ฉันเห็นมาแล้วต้องการข้อมูลที่ฉันไม่สามารถเข้าถึงได้ในปัญหานี้n = 4( หน้า-√- คิว√)2n=4(p−q)2 n = \frac 4 {( \sqrt{p} - \sqrt{q} )^2}

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
การวิเคราะห์พลังงานสำหรับข้อมูลทวินามเมื่อสมมติฐานว่างคือ
ฉันต้องการทำการวิเคราะห์พลังงานสำหรับตัวอย่างเดียวจากข้อมูลทวินามด้วย , กับโดยที่คือสัดส่วนของความสำเร็จในประชากร ถ้าฉันสามารถใช้การประมาณแบบปกติกับทวินามหรือทดสอบ แต่ด้วยทั้งคู่จะล้มเหลว ฉันชอบที่จะรู้ว่าหากมีวิธีการวิเคราะห์นี้ ฉันขอขอบคุณข้อเสนอแนะความคิดเห็นหรือการอ้างอิงใด ๆ ขอบคุณมาก!H 1 : p = 0.001 p 0 &lt; p &lt; 1 χ 2 p = 0H0:p=0H0:p=0H_0: p = 0H1:p=0.001H1:p=0.001H_1: p = 0.001ppp0&lt;p&lt;10&lt;p&lt;10 < p <1χ2χ2\chi^2p=0p=0p =0

2
พลังงานสำหรับการทดสอบตัวอย่างสองตัวอย่าง
ฉันพยายามที่จะเข้าใจการคำนวณพลังงานสำหรับกรณีของการทดสอบตัวอย่างอิสระสองรายการ (ไม่ได้สมมติความแปรปรวนเท่ากันดังนั้นฉันจึงใช้ Satterthwaite) นี่คือแผนภาพที่ฉันพบเพื่อช่วยให้เข้าใจกระบวนการ: ดังนั้นฉันจึงสันนิษฐานว่าให้สิ่งต่อไปนี้เกี่ยวกับประชากรสองคนและกำหนดขนาดตัวอย่าง: mu1&lt;-5 mu2&lt;-6 sd1&lt;-3 sd2&lt;-2 n1&lt;-20 n2&lt;-20 ฉันสามารถคำนวณค่าวิกฤตภายใต้ null ที่เกี่ยวข้องกับการมีความน่าจะเป็นหางส่วนบน 0.05: df&lt;-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) ) CV&lt;- qt(0.95,df) #equals 1.730018 แล้วคำนวณสมมติฐานทางเลือก (ซึ่งสำหรับกรณีนี้ฉันได้เรียนรู้คือ "การกระจายตัวทีไม่ใช่ศูนย์กลาง") ฉันคำนวณเบต้าในแผนภาพด้านบนโดยใช้การแจกแจงที่ไม่ใช่ศูนย์กลางและค่าวิกฤตที่พบข้างต้น นี่คือสคริปต์แบบเต็มใน R: #under alternative mu1&lt;-5 mu2&lt;-6 sd1&lt;-3 sd2&lt;-2 n1&lt;-20 n2&lt;-20 #Under null Sp&lt;-sqrt(((n1-1)*sd1^2+(n2-1)*sd2^2)/(n1+n2-2)) df&lt;-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) ) …

2
ขนาดตัวอย่างขั้นต่ำต่อคลัสเตอร์ในโมเดลเอฟเฟกต์แบบสุ่ม
มีเหตุผลสำหรับจำนวนของการสังเกตต่อกลุ่มในรูปแบบผลกระทบแบบสุ่ม? ฉันมีขนาดตัวอย่าง 1,500 กับ 700 คลัสเตอร์จำลองเป็นเอฟเฟกต์สุ่มที่แลกเปลี่ยนได้ ฉันมีตัวเลือกในการรวมกลุ่มเพื่อสร้างกลุ่มน้อยลง แต่มีขนาดใหญ่ขึ้น ฉันสงสัยว่าฉันจะเลือกขนาดตัวอย่างขั้นต่ำต่อคลัสเตอร์ได้อย่างไรเพื่อให้ได้ผลลัพธ์ที่มีความหมายในการทำนายเอฟเฟกต์แบบสุ่มสำหรับแต่ละคลัสเตอร์ มีกระดาษที่ดีที่อธิบายสิ่งนี้หรือไม่

2
คุณสามารถคำนวณพลังของการทดสอบ Kolmogorov-Smirnov ใน R ได้หรือไม่?
เป็นไปได้ไหมที่จะทำการวิเคราะห์พลังงานสำหรับการทดสอบ Kolmogorov Smirnov แบบ 2 ด้านใน R? ฉันกำลังทดสอบว่าการแจกแจงเชิงประจักษ์สองแบบนั้นแตกต่างกันหรือไม่โดยใช้ ks.test () และต้องการเพิ่มการวิเคราะห์พลังงาน ฉันไม่พบการวิเคราะห์พลังงานในตัวสำหรับการทดสอบ KS ใน R. คำแนะนำใด ๆ แก้ไข : นี่คือการแจกแจงแบบสุ่มที่สร้างขึ้นโดยประมาณใกล้เคียงกับข้อมูลของฉัน (ด้วยขนาดตัวอย่างจริงและอัตราการสลายตัวโดยประมาณสำหรับการแจกแจงแบบเอ็กซ์โปเนนเชียล) set.seed(100) x &lt;- rexp(64, rate=0.34) y &lt;- rexp(54,rate=0.37) #K-S test: Do x and y come from same distribution? ks.test(x,y) ข้อมูลเหล่านี้เป็นการวัดขนาดร่างกายในสองกลุ่มที่แตกต่างกัน ฉันต้องการแสดงให้เห็นว่าทั้งสองกลุ่มมีการกระจายตัวเหมือนกันเป็นหลัก แต่ถูกถามโดยผู้ทำงานร่วมกันว่าฉันมีอำนาจที่จะพูดแบบนั้นตามขนาดตัวอย่างหรือไม่ ฉันสุ่มมาจากการแจกแจงเอ็กซ์โพเนนเชียลที่นี่ แต่สิ่งเหล่านี้ใกล้เคียงกับข้อมูลจริง จนถึงตอนนี้ฉันได้บอกว่าไม่มีความแตกต่างอย่างมีนัยสำคัญในการแจกแจงเหล่านี้ตามการทดสอบ KS แบบสองด้าน ฉันได้วางแผนการแจกแจงสองแบบด้วย ฉันจะแสดงให้เห็นได้อย่างไรว่าฉันมีอำนาจในการสร้างคำสั่งดังกล่าวโดยพิจารณาจากขนาดตัวอย่างและอัตราการสลายตัวของ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.