คำถามติดแท็ก power-analysis

การสอบถามเกี่ยวกับคุณภาพของการทดสอบทางสถิติโดยการคำนวณกำลังไฟฟ้า - ความน่าจะเป็นในการปฏิเสธสมมติฐานว่างเนื่องจากเป็นเท็จ - ภายใต้สถานการณ์บางอย่าง การวิเคราะห์พลังงานมักใช้เมื่อวางแผนการศึกษาเพื่อกำหนดขนาดตัวอย่างที่จำเป็นเพื่อให้ได้ระดับพลังงานที่กำหนด (เช่น80%) สำหรับขนาดเอฟเฟกต์ที่กำหนด ในหลาย ๆ สถานการณ์การคำนวณเชิงทฤษฎีนั้นเป็นเรื่องยากมากดังนั้นการวิเคราะห์พลังงานจึงทำได้โดยการจำลอง

7
กฎของหัวแม่มือสำหรับขนาดตัวอย่างขั้นต่ำสำหรับการถดถอยหลายครั้ง
ภายในบริบทของข้อเสนอการวิจัยในสังคมศาสตร์ฉันถูกถามคำถามต่อไปนี้: ฉันได้ไปตลอด 100 + m (โดย m คือจำนวนผู้ทำนาย) เมื่อพิจารณาขนาดตัวอย่างขั้นต่ำสำหรับการถดถอยหลายครั้ง สิ่งนี้เหมาะสมหรือไม่ ฉันได้รับคำถามที่คล้ายกันบ่อยครั้งด้วยกฎง่ายๆ ฉันยังอ่านกฎของหัวแม่มืออย่างมากในตำราต่าง ๆ บางครั้งฉันสงสัยว่าความนิยมของกฎในแง่ของการอ้างอิงนั้นขึ้นอยู่กับมาตรฐานที่ตั้งไว้ต่ำเพียงใด อย่างไรก็ตามฉันยังตระหนักถึงคุณค่าของฮิวริสติกที่ดีในการทำให้การตัดสินใจง่ายขึ้น คำถาม: อะไรคือประโยชน์ของกฎง่ายๆสำหรับขนาดตัวอย่างที่เล็กที่สุดในบริบทของนักวิจัยประยุกต์ที่ออกแบบการศึกษาวิจัย? คุณจะแนะนำกฎทางเลือกแบบง่ายๆสำหรับขนาดตัวอย่างขั้นต่ำสำหรับการถดถอยหลายครั้งหรือไม่ อีกทางหนึ่งกลยุทธ์ทางเลือกใดที่คุณจะแนะนำสำหรับการกำหนดขนาดตัวอย่างขั้นต่ำสำหรับการถดถอยหลายครั้ง โดยเฉพาะอย่างยิ่งมันจะดีถ้ามีการกำหนดมูลค่าให้กับระดับที่กลยุทธ์ใด ๆ สามารถนำไปใช้ได้โดยผู้ที่ไม่ใช่นักสถิติ

2
การจำลองการวิเคราะห์กำลังถดถอยของโลจิสติกส์ - การทดลองที่ออกแบบมา
คำถามนี้เป็นคำถามในการตอบสนองต่อคำตอบที่ได้รับจาก @ Greg หิมะในเรื่องที่เกี่ยวกับคำถามที่Proc GLMPOWERผมถามเกี่ยวกับการวิเคราะห์การใช้พลังงานที่มีการถดถอยโลจิสติกและเอสเอ ถ้าฉันออกแบบการทดลองและวิเคราะห์ผลลัพธ์ในการถดถอยแบบลอจิสติกแบบแฟคทอเรียลฉันจะใช้การจำลอง (และที่นี่ ) เพื่อทำการวิเคราะห์พลังงานได้อย่างไร นี่คือตัวอย่างง่ายๆที่มีตัวแปรสองตัวตัวแรกใช้กับค่าที่เป็นไปได้สามค่าคือ {0.03, 0.06, 0.09} และตัวที่สองคือตัวบ่งชี้จำลอง {0,1} สำหรับแต่ละครั้งเราประเมินอัตราการตอบกลับสำหรับแต่ละชุดค่าผสม (จำนวนผู้ตอบ / จำนวนผู้ที่ทำการตลาด) นอกจากนี้เราต้องการให้มีการรวมกันครั้งแรกหลายเท่าของปัจจัยอื่น ๆ (ซึ่งถือได้ว่ามีค่าเท่ากัน) เนื่องจากชุดค่าผสมครั้งแรกนี้เป็นรุ่นทดลองและจริงของเรา นี่คือการตั้งค่าที่กำหนดไว้ในหลักสูตร SAS ที่กล่าวถึงในคำถามที่เชื่อมโยง รูปแบบที่จะใช้ในการวิเคราะห์ผลลัพธ์จะเป็นการถดถอยโลจิสติกโดยมีเอฟเฟกต์หลักและการโต้ตอบ (การตอบสนองคือ 0 หรือ 1) mod <- glm(response ~ Var1 + Var2 + I(Var1*Var2)) ฉันจะจำลองชุดข้อมูลที่ใช้กับรุ่นนี้เพื่อทำการวิเคราะห์พลังงานได้อย่างไร เมื่อฉันรันสิ่งนี้ผ่าน SAS Proc GLMPOWER(การใช้STDDEV =0.05486016 ซึ่งสอดคล้องกับsqrt(p(1-p))ตำแหน่ง p คือค่าเฉลี่ยถ่วงน้ำหนักของอัตราการตอบกลับที่แสดง): data …

5
ทำไมโพลทางการเมืองถึงมีขนาดตัวอย่างขนาดใหญ่เช่นนี้?
เมื่อฉันดูข่าวฉันสังเกตเห็นว่าการสำรวจของ Gallup สำหรับสิ่งต่าง ๆ เช่นการเลือกตั้งประธานาธิบดีมีขนาดตัวอย่างมากกว่า 1,000 ตัวอย่าง จากสิ่งที่ฉันจำได้จากสถิติของวิทยาลัยคือขนาดตัวอย่าง 30 เป็นตัวอย่าง "มีขนาดใหญ่มาก" ดูเหมือนว่าขนาดตัวอย่างที่มากกว่า 30 นั้นไม่มีจุดหมายเนื่องจากผลตอบแทนลดลง

1
การวิเคราะห์พลังงานเบื้องต้นนั้นไร้ประโยชน์หรือไม่?
ฉันเข้าร่วมการประชุมของสมาคมบุคลิกภาพและจิตวิทยาสังคมเมื่อสัปดาห์ที่แล้วซึ่งฉันเห็นการพูดคุยของ Uri Simonsohn กับสถานที่ตั้งว่าการใช้การวิเคราะห์พลังงานเบื้องต้นเพื่อกำหนดขนาดตัวอย่างนั้นไร้ประโยชน์เพราะผลลัพธ์นั้นอ่อนไหวต่อสมมติฐาน แน่นอนการเรียกร้องนี้ขัดกับสิ่งที่ฉันได้รับการสอนในชั้นเรียนวิธีการของฉันและต่อต้านคำแนะนำของนักวิธีการที่โดดเด่นหลายคน (สะดุดตาที่สุดโคเฮน 1992 ) ดังนั้น Uri จึงแสดงหลักฐานบางอย่างเกี่ยวกับการอ้างสิทธิ์ของเขา ฉันพยายามสร้างหลักฐานบางส่วนด้านล่างนี้ใหม่ สำหรับความเรียบง่ายให้จินตนาการสถานการณ์ที่คุณมีสองกลุ่มของการสังเกตและคาดเดาว่าขนาดของผล (วัดจากความแตกต่างของค่าเฉลี่ยมาตรฐาน) เป็น0.5การคำนวณพลังงานมาตรฐาน (ทำโดยใช้แพ็คเกจด้านล่าง) จะบอกให้คุณทราบว่าต้องใช้การสังเกตแบบเพื่อให้ได้พลังงาน 80% จากการออกแบบนี้0.5.5.5Rpwr128128128 require(pwr) size <- .5 # Note that the output from this function tells you the required observations per group # rather than the total observations required pwr.t.test(d = size, sig.level = …

2
การคำนวณขนาดตัวอย่างสำหรับแบบผสม
ฉันสงสัยว่ามีวิธีใดในการคำนวณขนาดตัวอย่างในโมเดลผสมหรือไม่ ฉันใช้lmerใน R เพื่อให้พอดีกับโมเดล (ฉันมีความลาดชันและจุดตัดแบบสุ่ม)

1
กำลังคำนวณทางสถิติ
เมื่อฉันเข้าใจแล้วฉันจำเป็นต้องรู้อย่างน้อยสามด้าน (จากสี่) ของการศึกษาที่ฉันเสนอเพื่อทำการวิเคราะห์พลังงาน ได้แก่ : ประเภทการทดสอบ - ฉันตั้งใจจะใช้ Pearson's r และ ANCOVA / Regression - GLM ระดับนัยสำคัญ (อัลฟา) - ฉันตั้งใจจะใช้ 0.05 ขนาดผลที่คาดหวัง - ฉันตั้งใจจะใช้ขนาดเอฟเฟกต์ขนาดกลาง (0.5) ขนาดตัวอย่าง ใครช่วยแนะนำเครื่องคิดเลขพลังงานออนไลน์ที่ดีที่ฉันสามารถใช้เพื่อทำการคำนวณพลังงานเบื้องต้น (สามารถทำ SPSS เบื้องต้นคำนวณพลังงาน?) ฉันเจอ GPower แล้ว แต่ฉันกำลังมองหาเครื่องมือที่ง่ายกว่านี้!

4
การวิเคราะห์พลังงานจำเป็นในสถิติแบบเบย์หรือไม่?
ฉันค้นคว้า Bayesian แล้วเมื่อไม่นานมานี้ หลังจากอ่านเกี่ยวกับปัจจัย Bayes ฉันถูกทิ้งสงสัยว่าการวิเคราะห์พลังงานเป็นสิ่งจำเป็นในมุมมองของสถิตินี้หรือไม่ เหตุผลหลักของฉันสำหรับการสงสัยว่านี่คือปัจจัยของเบย์จริง ๆ แล้วดูเหมือนจะเป็นอัตราส่วนความน่าจะเป็น เมื่อเป็นเช่น 25: 1 ดูเหมือนว่าฉันสามารถเรียกคืน ฉันอยู่ไกลไหม การอ่านอื่นใดที่ฉันสามารถทำได้เพื่อเรียนรู้เพิ่มเติม กำลังอ่านหนังสือเล่มนี้: รู้เบื้องต้นเกี่ยวกับสถิติแบบเบย์โดย WM Bolstad (Wiley-Interscience; 2nd ed., 2007)

1
ฟรีอินเทอร์เน็ตหรือทรัพยากรที่สามารถดาวน์โหลดได้สำหรับการคำนวณขนาดตัวอย่าง
วันนี้ผมสังเกตเห็นคำถามนี้และผมคิดว่ามันจะเป็นประโยชน์ถ้าเรามีหัวข้อว่าทรัพยากรที่ระบุไว้ว่าคนที่สามารถอำนวยความสะดวกการเข้าถึงสำหรับการวิเคราะห์พลังงาน / การคำนวณขนาดของกลุ่มตัวอย่างอาจจะคล้ายกับกระทู้นี้: ทรัพยากรสำหรับการเรียนรู้ R

4
เราจะพัฒนากฎการหยุดในการวิเคราะห์พลังงานของสองสัดส่วนอิสระได้อย่างไร
ฉันเป็นนักพัฒนาซอฟต์แวร์ที่ทำงานกับระบบทดสอบ A / B ฉันไม่มีภูมิหลังที่มั่นคง แต่ได้รับความรู้ในช่วงไม่กี่เดือนที่ผ่านมา สถานการณ์จำลองการทดสอบทั่วไปเกี่ยวข้องกับการเปรียบเทียบ URL สองรายการบนเว็บไซต์ เข้าชมผู้เข้าชมLANDING_URLแล้วจะถูกส่งต่อไปยังสุ่มอย่างใดอย่างหนึ่งหรือURL_CONTROL URL_EXPERIMENTALผู้เข้าชมเป็นตัวอย่างและเงื่อนไขแห่งชัยชนะจะเกิดขึ้นเมื่อผู้เข้าชมดำเนินการที่ต้องการบนไซต์นั้น นี่ถือเป็นการแปลงและอัตราของอัตราการแปลงคืออัตราการแปลง (โดยทั่วไปจะแสดงเป็นเปอร์เซ็นต์) อัตราการแปลงทั่วไปสำหรับ URL ที่ระบุคือบางสิ่งในขอบเขต 0.01% ถึง 0.08% เราทำการทดสอบเพื่อกำหนดว่า URL ใหม่เปรียบเทียบกับ URL เก่าอย่างไร ถ้าURL_EXPERIMENTALแสดงให้เห็นว่าดีกว่าURL_CONTROLเราแทนด้วยURL_CONTROLURL_EXPERIMENTAL เราได้พัฒนาระบบโดยใช้เทคนิคการทดสอบสมมติฐานอย่างง่าย ฉันใช้คำตอบของคำถาม CrossValidated อื่นที่นี่เพื่อพัฒนาระบบนี้ มีการตั้งค่าการทดสอบดังนี้: การประมาณการอัตราการแปลงCRE_CONTROLของURL_CONTROLถูกคำนวณโดยใช้ข้อมูลประวัติ อัตราการแปลงเป้าหมายที่ต้องการCRE_EXPERIMENTALของURL_EXPERIMENTALการตั้งค่า โดยทั่วไปจะใช้ระดับนัยสำคัญ 0.95 โดยทั่วไปจะใช้พลังงาน 0.8 เมื่อรวมกันค่าเหล่านี้ทั้งหมดจะถูกใช้เพื่อคำนวณขนาดตัวอย่างที่ต้องการ ฉันใช้ฟังก์ชัน R power.prop.testเพื่อให้ได้ขนาดตัวอย่างนี้ การทดสอบจะทำงานจนกว่าจะมีการเก็บตัวอย่างทั้งหมด ณ จุดนี้ช่วงความเชื่อมั่นสำหรับ CR_CONTROLและCR_EXPERIMENTALถูกคำนวณ หากพวกเขาไม่ทับซ้อนกันผู้ชนะสามารถประกาศได้ที่ระดับนัยสำคัญ 0.95 และพลังของ 0.8 ผู้ใช้การทดสอบของเรามีข้อกังวลหลักสองประการ: 1. …

2
พลังของการถดถอยโลจิสติกและการทดสอบทีเปรียบเทียบ
พลังของการถดถอยโลจิสติกและการทดสอบทีเทียบเท่าหรือไม่ ถ้าเป็นเช่นนั้นพวกเขาควรจะ "ความหนาแน่นของข้อมูลเทียบเท่า" โดยที่ฉันหมายถึงว่าการสังเกตที่สำคัญจำนวนเดียวกันให้ผลลัพธ์เดียวกันกับที่ได้รับค่าคงที่ของ. 05 พิจารณาสองกรณี: [การทดสอบสถิติพารามิเตอร์]: 30 การดึงออกมาจากการสังเกตแบบทวินามและค่าที่ได้จะเป็นค่าเฉลี่ย สิ่งนี้ทำได้ 30 ครั้งสำหรับกลุ่ม A (ซึ่งมีค่าทวินามเท่ากับ. 70 ที่เกิดขึ้น) และ 30 ครั้งสำหรับกลุ่ม B (ซึ่งมีราคาทวินามเท่ากับ. 75 ที่เกิดขึ้น) ผลตอบแทนนี้ 30 หมายถึงกลุ่มที่เป็นตัวแทนของสรุป 1,800 ดึงจากการกระจายทวินาม การทดสอบ t-58df ใช้เพื่อเปรียบเทียบค่าเฉลี่ย [การถดถอยโลจิสติก]: การถดถอยโลจิสติกจะดำเนินการกับความลาดชันรหัสจำลองที่เป็นตัวแทนของการเป็นสมาชิกกลุ่มและแต่ละ 1,800 วาด คำถามของฉันมีสองส่วน: เมื่อกำหนดค่าอัลฟ่าเป็น. 05 พลังของวิธีการเหล่านี้จะเหมือนหรือต่างกันหรือไม่ ทำไม? ฉันจะพิสูจน์ได้อย่างไร คำตอบสำหรับคำถามที่ 1 นั้นมีความอ่อนไหวต่อขนาดตัวอย่างที่จะเข้าสู่การทดสอบ t-size ขนาดตัวอย่างของแต่ละกลุ่มในการทดสอบ t-t ความน่าจะเป็นแบบทวินามพื้นฐานหรือปัจจัยอื่น ๆ ถ้าเป็นเช่นนั้นฉันจะรู้ได้อย่างไร …

2
ขนาดตัวอย่างที่ไม่เท่ากัน: เมื่อใดที่จะเรียกมันจะหยุดทำงาน
ฉันกำลังตรวจสอบบทความวารสารวิชาการและผู้เขียนได้เขียนสิ่งต่อไปนี้เป็นเหตุผลสำหรับการไม่รายงานสถิติเชิงอนุมาน (ฉันระบุลักษณะของทั้งสองกลุ่ม): รวม 25 แห่ง 2,349 (1.1%) ผู้ตอบแบบสอบถามรายงานX เรางดเว้นอย่างเหมาะสมจากการนำเสนอการวิเคราะห์ที่เปรียบเทียบกลุ่มXกับกลุ่มY (ผู้เข้าร่วมอื่น 2,324 คน) เนื่องจากผลลัพธ์เหล่านั้นอาจได้รับแรงผลักดันอย่างมากจากโอกาสด้วยผลลัพธ์ที่หายากนี้ คำถามของฉันคือผู้เขียนของการศึกษานี้เป็นธรรมในการขว้างปาในผ้าขนหนูที่เกี่ยวกับการเปรียบเทียบกลุ่ม? ถ้าไม่ฉันจะแนะนำอะไรให้พวกเขาบ้าง

2
การวิเคราะห์กำลังไฟสำหรับการทดสอบ Kruskal-Wallis หรือ Mann-Whitney U โดยใช้ R?
เป็นไปได้ไหมที่จะทำการวิเคราะห์พลังงานสำหรับการทดสอบ Kruskal-Wallis และ Mann-Whitney U? ถ้าใช่จะมีแพ็คเกจ / ฟังก์ชั่น R ใดบ้างที่ใช้งานได้?

3
การเพิ่มขนาดของกลุ่มตัวอย่างเป็นแบบไดนามิกหรือไม่หากระบุนิรนัย?
ฉันกำลังจะทำการศึกษาเกี่ยวกับข้อดีของการกระตุ้นหนึ่งเมื่อเปรียบเทียบกับการออกแบบภายในเรื่อง ฉันมีรูปแบบการเรียงสับเปลี่ยนที่ออกแบบมาเพื่อลดผลกระทบต่อลำดับของบางส่วนของการศึกษา รูปแบบการเรียงสับเปลี่ยนกำหนดว่าขนาดตัวอย่างสามารถหารด้วย 8 เพื่อกำหนดขนาดตัวอย่างฉันจะต้องเดาอย่างกล้าหาญ (เป็นประเพณีที่ดีในสาขาของฉัน) หรือคำนวณขนาดตัวอย่างสำหรับพลังงานที่ฉันต้องการ ปัญหาคือตอนนี้ฉันไม่ได้มีเงื่อนงำน้อยขนาดขนาดผลที่ฉันจะสังเกต (ยังเป็นประเพณีที่ดีในสาขาของฉัน) นั่นหมายความว่าการคำนวณพลังงานนั้นค่อนข้างยาก ในทางกลับกันการคาดเดาอย่างบ้าคลั่งอาจไม่ดีเพราะฉันสามารถออกตัวอย่างขนาดต่ำเกินไปหรือจ่ายเงินมากเกินไปแก่ผู้เข้าร่วมและใช้เวลามากเกินไปในห้องทดลอง จะเป็นการดีหรือไม่ที่จะกล่าวล่วงหน้าว่าฉันเพิ่มผู้เข้าร่วมเป็นกลุ่ม 8 คนจนกว่าฉันจะออกจากค่า p สองค่า? เช่น 0,05 <p <0,30 หรือคุณจะแนะนำวิธีอื่นฉันควรดำเนินการต่อหรือไม่

3
วิธีจำลองการวิเคราะห์พลังงานที่กำหนดเองของ lm model (โดยใช้ R)
ต่อไปนี้เป็นคำถามที่ผ่านมาเรามีที่นี่ ฉันอยากจะรู้ว่าใครเคยเจอหรือสามารถแบ่งปันรหัส R เพื่อทำการวิเคราะห์พลังงานแบบกำหนดเองตามการจำลองสำหรับตัวแบบเชิงเส้น? ต่อมาฉันอยากจะขยายไปยังรุ่นที่ซับซ้อนมากขึ้น แต่ดูเหมือนว่าจะเริ่มต้นได้ทันที ขอบคุณ

3
ขนาดตัวอย่างที่จำเป็นในการประมาณความน่าจะเป็นของ“ ความสำเร็จ” ในการทดลองใช้ Bernoulli
สมมติว่าเกมเสนอเหตุการณ์ที่เมื่อดำเนินการเสร็จแล้วอาจให้รางวัลหรือไม่ทำอะไรเลย กลไกที่แน่ชัดในการพิจารณาว่าการให้รางวัลนั้นไม่เป็นที่รู้จักหรือไม่ แต่ฉันคิดว่าจะใช้ตัวสร้างตัวเลขแบบสุ่มและหากผลลัพธ์นั้นมีค่ามากกว่าค่าฮาร์ดโค้ดบางตัวคุณจะได้รับรางวัล ถ้าฉันต้องการวิศวกรรมย้อนกลับโดยทั่วไปแล้วโปรแกรมเมอร์ใช้ค่าอะไรในการพิจารณาความถี่ที่ได้รับรางวัล (ประมาณ 15-30%) ฉันจะคำนวณจำนวนตัวอย่างที่ฉันต้องการได้อย่างไร ฉันเริ่มต้นด้วยส่วน "เครื่องมือประมาณความน่าจะเป็นจริง" ที่นี่: Checking_whether_a_coin_is_fairแต่ฉันไม่แน่ใจว่าฉันกำลังมุ่งหน้าไปทางที่ถูกต้อง ฉันได้รับผลลัพธ์จาก ~ 1,000 ตัวอย่างที่จำเป็นสำหรับข้อผิดพลาดสูงสุด 3% ที่ความมั่นใจ 95% ท้ายที่สุดนี่คือสิ่งที่ฉันพยายามแก้ไข: กิจกรรม # 1 ให้รางวัล 1.0R, X% ของเวลา กิจกรรม # 2 ให้รางวัล 1.4R กับ Y% ของเวลา ฉันต้องการประเมิน X & Y อย่างแม่นยำพอที่จะตัดสินว่ากิจกรรมใดมีประสิทธิภาพมากกว่า ขนาดตัวอย่างที่มีขนาดใหญ่เป็นปัญหาเนื่องจากฉันสามารถได้รับ 1 ตัวอย่างทุก ๆ 20 นาทีเท่านั้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.