คำถามติดแท็ก sample-size

แท็กนี้คลุมเครือมาก ใช้เมื่อคำถามเกี่ยวกับขนาดตัวอย่างและไม่มีดังต่อไปนี้มีความเหมาะสมมากกว่า: [ตัวอย่างเล็ก], [ข้อมูลขนาดใหญ่], [การวิเคราะห์พลังงาน], [พลังงาน], [underdetermined] หรือ [ไม่สมดุลคลาส]

1
Caret glmnet กับ cv.glmnet
ดูเหมือนจะมีความสับสนมากในการเปรียบเทียบการใช้glmnetภายในcaretเพื่อค้นหาแลมบ์ดาที่ดีที่สุดและใช้cv.glmnetในการทำงานเดียวกัน มีการตั้งคำถามมากมายเช่น: โมเดลการจำแนกประเภท train.glmnet vs. cv.glmnet วิธีที่เหมาะสมในการใช้ glmnet กับคาเร็ตคืออะไร? การตรวจสอบข้าม `glmnet 'โดยใช้` คาเร็ต' แต่ไม่ได้รับคำตอบซึ่งอาจเป็นเพราะความสามารถในการทำซ้ำของคำถาม ตามคำถามแรกฉันให้ตัวอย่างที่คล้ายกัน แต่มีคำถามเดียวกัน: ทำไม lambdas โดยประมาณแตกต่างกันอย่างไร library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to …

3
ทำไม / ควร (?) การสุ่มตัวอย่างเชิงสถิติทำงานเพื่อการเมือง (เช่น Gallup)
โพลออกมี (พูดกัลล์อัพ) ตัวอย่างผู้คนจำนวนน้อยอย่างไร้เหตุผลเมื่อเทียบกับขนาดของประชากร (เช่นอาจเป็นพันคนจากหลายร้อยล้าน) ตอนนี้ให้ฉันสุ่มตัวอย่างประชากรเป็นวิธีสำหรับการประเมินสถิติของประชากรทำให้รู้สึกเมื่อคุณมีเหตุผลที่ดีที่จะเชื่อว่ากลุ่มตัวอย่างเป็นตัวแทนของประชากร (หรือในทำนองเดียวกันของตัวอย่างอื่น ๆ ) ตัวอย่างเช่นการสุ่มตัวอย่างทำให้เข้าใจได้ง่ายสำหรับการศึกษาทางการแพทย์เพราะเรารู้ว่านิรนัยที่มนุษย์ทุกคนมีจีโนมค่อนข้างคล้ายคลึงกันและปัจจัยนี้ทำให้ร่างกายของพวกเขามีพฤติกรรมคล้ายกัน โปรดทราบว่านี่ไม่ใช่การมีเพศสัมพันธ์แบบหลวม ๆ - จีโนมเป็นปัจจัยกำหนดที่แข็งแกร่งมาก อย่างไรก็ตามฉันไม่เข้าใจว่าอะไรคือเหตุผลที่ใช้ขนาดตัวอย่างต่ำสำหรับสิ่งต่างๆเช่นการสำรวจทางการเมือง ฉันสามารถซื้อได้ว่าอาจจะ 80-90% ของผู้คนในพื้นที่ใกล้เคียงที่ได้รับคะแนนเสียงคล้ายกันสำหรับประธานาธิบดี (เนื่องจากภูมิหลังทางสังคมและเศรษฐกิจ / การศึกษาที่คล้ายกัน) แต่สิ่งนี้ดูเหมือนว่าแทบจะไม่ได้พิสูจน์ตัวอย่างที่มีจำนวนต่ำ มีตัวอักษรไม่มีเหตุผลที่น่าสนใจ (อย่างน้อยให้ฉัน) ทำไมผู้มีสิทธิเลือกตั้ง 1,000 สุ่มควรประพฤติเช่น 200 ล้านผู้มีสิทธิเลือกตั้งอื่น ๆ สำหรับฉันคุณต้องการอย่างน้อยต้องชอบ (พูด) 100 ×จำนวนนั้น ทำไม? ฉันสามารถคิดถึงเหตุผลมากมายเช่น: มี ~ 22,000 อันมีเพียงแค่ในรัฐแคลิฟอร์เนีย ผู้คนเติบโตขึ้นอย่างแตกต่างกันในภูมิหลังทางเศรษฐกิจและการศึกษาของพวกเขาที่โพลขนาด 1,000 คนดูเหมือนจะหัวเราะเยาะ คุณจะสรุปบริเวณทั้งหมดโดยมี <1 คนโดยเฉลี่ยได้อย่างไร โดยทั่วไปผู้คนไม่สามารถเปลี่ยนแปลงการตอบสนองต่อยาของร่างกาย แต่พวกเขาสามารถเปลี่ยนความคิดเห็นเกี่ยวกับการเมืองเพียงแค่คิดถึงมัน วิธีที่ฉันเห็นมันไม่มีปัจจัยบังคับใดที่คล้ายกับ DNA ในการแพทย์เมื่อคุณต้องรับมือกับการเมือง …

1
วิธีการกำหนดขนาดตัวอย่างที่จำเป็นสำหรับการวัด ANOVA ซ้ำแล้วซ้ำอีก?
ฉันต้องการความช่วยเหลือเกี่ยวกับ ANOVA การวัดซ้ำ เรากำลังตรวจสอบผลของการแทรกแซงเพื่อลดอัตราการติดเชื้อในกระแสเลือด (BSI) ในผู้ป่วยบางราย เราวางแผนที่จะรวบรวมข้อมูลอัตรา BSI เป็นรายเดือน 12 เดือนโดยไม่มีการแทรกแซงก่อนจากนั้น 12 เดือนด้วยการแทรกแซง เรากำลังคิดที่จะทำแบบอนุกรมเวลาหรือการวัด ANOVA ซ้ำ ๆ ฉันชอบอันที่ใหม่กว่าก่อนที่ฉันจะไม่มีความคิดมากที่จะทำในคำถามแรก (คำถามพิเศษ: คะแนนเวลาน้อยเกินไปใช่มั้ย) แต่มาถึงตรงนี้แล้ว ปัญหาอีกประการหนึ่งเราต้องแสดงวอร์ดกี่คนที่มีผลกระทบที่สำคัญทางสถิติของการแทรกแซงอัตรา BSI ฉันคิดว่าฉันจะทำ ANOVA สองอันหนึ่งรายการสำหรับ "ก่อนการแทรกแซง" ส่วนหนึ่งสำหรับ "ระหว่างการแทรกแซง" และฉันคิดว่า ANOVA "ก่อนการแทรกแซง" ไม่ควรมีการทดสอบ F-ratio ที่สำคัญ ฉันพิจารณาคำว่า "ขนาดตัวอย่าง" สองมิติไม่ว่าจะเป็นจำนวนหอผู้ป่วยหรือจำนวนการวัดซ้ำ

2
การทดสอบ Mann-Whitney U ด้วยขนาดตัวอย่างที่ไม่เท่ากัน
ฉันมีสองกลุ่มที่ไม่เท่ากัน (94 และ 52) และต้องการเรียกใช้การทดสอบ Mann-Whitney U เพื่อดูว่าคะแนนของพวกเขาในตัวแปรที่วัดได้แตกต่างกันหรือไม่ ฉันเห็นว่ามันโอเคที่จะทำอย่างไรกับ Kruskall-Wallis มันใช้กับ Mann-Whitney ได้ไหม?

3
เมื่อใดการแปลง z ของฟิชเชอร์จึงเหมาะสม?
ฉันต้องการทดสอบความสัมพันธ์ตัวอย่างเพื่อความสำคัญโดยใช้ค่า p นั่นคือRrr H0: ρ = 0 ,H1: ρ ≠ 0H0:ρ=0,H1:ρ≠0.H_0: \rho = 0, \; H_1: \rho \neq 0. ฉันเข้าใจว่าฉันสามารถใช้การแปลง z ของฟิชเชอร์เพื่อคำนวณสิ่งนี้ด้วย Zo b s= n - 3-----√2LN( 1 + r1 - ร)zobs=n−32ln⁡(1+r1−r)z_{obs}= \displaystyle\frac{\sqrt{n-3}}{2}\ln\left(\displaystyle\frac{1+r}{1-r}\right) และหาค่า p โดย p = 2 P( Z> zo b s)p=2P(Z>zobs)p = 2P\left(Z>z_{obs}\right) ใช้การแจกแจงแบบปกติมาตรฐาน คำถามของฉันคือวิธีที่มีขนาดใหญ่ควรจะให้นี้จะมีการเปลี่ยนแปลงที่เหมาะสมหรือไม่ เห็นได้ชัดว่าจะต้องมีขนาดใหญ่กว่า …

2
ขนาดตัวอย่างที่มีประสิทธิภาพสำหรับการอนุมานหลังจากการสุ่มตัวอย่าง MCMC
เมื่อได้รับตัวอย่าง MCMC เพื่อทำการอนุมานพารามิเตอร์ที่เฉพาะเจาะจงอะไรคือคำแนะนำที่ดีสำหรับจำนวนตัวอย่างที่มีประสิทธิภาพขั้นต่ำที่เราควรตั้งเป้าหมายไว้? และคำแนะนำนี้เปลี่ยนไปเมื่อแบบจำลองมีความซับซ้อนมากขึ้นหรือน้อยลงหรือไม่?

3
การเพิ่มขนาดของกลุ่มตัวอย่างเป็นแบบไดนามิกหรือไม่หากระบุนิรนัย?
ฉันกำลังจะทำการศึกษาเกี่ยวกับข้อดีของการกระตุ้นหนึ่งเมื่อเปรียบเทียบกับการออกแบบภายในเรื่อง ฉันมีรูปแบบการเรียงสับเปลี่ยนที่ออกแบบมาเพื่อลดผลกระทบต่อลำดับของบางส่วนของการศึกษา รูปแบบการเรียงสับเปลี่ยนกำหนดว่าขนาดตัวอย่างสามารถหารด้วย 8 เพื่อกำหนดขนาดตัวอย่างฉันจะต้องเดาอย่างกล้าหาญ (เป็นประเพณีที่ดีในสาขาของฉัน) หรือคำนวณขนาดตัวอย่างสำหรับพลังงานที่ฉันต้องการ ปัญหาคือตอนนี้ฉันไม่ได้มีเงื่อนงำน้อยขนาดขนาดผลที่ฉันจะสังเกต (ยังเป็นประเพณีที่ดีในสาขาของฉัน) นั่นหมายความว่าการคำนวณพลังงานนั้นค่อนข้างยาก ในทางกลับกันการคาดเดาอย่างบ้าคลั่งอาจไม่ดีเพราะฉันสามารถออกตัวอย่างขนาดต่ำเกินไปหรือจ่ายเงินมากเกินไปแก่ผู้เข้าร่วมและใช้เวลามากเกินไปในห้องทดลอง จะเป็นการดีหรือไม่ที่จะกล่าวล่วงหน้าว่าฉันเพิ่มผู้เข้าร่วมเป็นกลุ่ม 8 คนจนกว่าฉันจะออกจากค่า p สองค่า? เช่น 0,05 <p <0,30 หรือคุณจะแนะนำวิธีอื่นฉันควรดำเนินการต่อหรือไม่

2
ภาวะแทรกซ้อนของการมีตัวอย่างขนาดเล็กมากในตัวแบบสมการโครงสร้าง
ฉันกำลังใช้โมเดลสมการโครงสร้าง (SEM) ใน Amos 18 ฉันกำลังมองหาผู้เข้าร่วม 100 คนสำหรับการทดสอบของฉัน (ใช้แบบหลวม ๆ ) ซึ่งถือว่าไม่น่าจะเพียงพอที่จะจัดการ SEM ที่ประสบความสำเร็จ ฉันได้รับการบอกซ้ำ ๆ ว่า SEM (พร้อมด้วย EFA, CFA) เป็นกระบวนการทางสถิติ "ตัวอย่างขนาดใหญ่" เรื่องสั้นสั้นฉันไม่ได้ทำให้ผู้เข้าร่วม 100 คน (น่าแปลกใจ!) และมีเพียง 42 หลังจากไม่รวมจุดข้อมูลที่มีปัญหาสองจุด ฉันก็ลองแบบจำลองต่อไปและด้วยความประหลาดใจของฉันมันก็ดูเหมือนจะเข้ากันได้ดีมาก! CFI> .95, RMSEA <.09, SRMR <.08 ตัวแบบไม่ง่ายจริง ๆ แล้วฉันจะบอกว่ามันค่อนข้างซับซ้อน ฉันมีตัวแปรแฝงอยู่สองตัวตัวหนึ่งมีสองตัวแปรที่สังเกตได้และอีก 5 ตัวแปรที่สังเกตได้ ฉันมีตัวแปรที่สังเกตเพิ่มเติมอีกสี่ตัวในโมเดล มีความสัมพันธ์มากมายระหว่างตัวแปรทางอ้อมและทางตรงโดยมีตัวแปรบางตัวที่อยู่ภายนอกถึงสี่คนเป็นตัวอย่าง ฉันค่อนข้างใหม่สำหรับ SEM; อย่างไรก็ตามบุคคลสองคนที่ฉันรู้ว่าคุ้นเคยกับ SEM บอกฉันว่าตราบใดที่การบ่งบอกความเหมาะสมนั้นดีผลกระทบนั้นสามารถตีความได้ …

3
ขนาดตัวอย่างที่จำเป็นในการประมาณความน่าจะเป็นของ“ ความสำเร็จ” ในการทดลองใช้ Bernoulli
สมมติว่าเกมเสนอเหตุการณ์ที่เมื่อดำเนินการเสร็จแล้วอาจให้รางวัลหรือไม่ทำอะไรเลย กลไกที่แน่ชัดในการพิจารณาว่าการให้รางวัลนั้นไม่เป็นที่รู้จักหรือไม่ แต่ฉันคิดว่าจะใช้ตัวสร้างตัวเลขแบบสุ่มและหากผลลัพธ์นั้นมีค่ามากกว่าค่าฮาร์ดโค้ดบางตัวคุณจะได้รับรางวัล ถ้าฉันต้องการวิศวกรรมย้อนกลับโดยทั่วไปแล้วโปรแกรมเมอร์ใช้ค่าอะไรในการพิจารณาความถี่ที่ได้รับรางวัล (ประมาณ 15-30%) ฉันจะคำนวณจำนวนตัวอย่างที่ฉันต้องการได้อย่างไร ฉันเริ่มต้นด้วยส่วน "เครื่องมือประมาณความน่าจะเป็นจริง" ที่นี่: Checking_whether_a_coin_is_fairแต่ฉันไม่แน่ใจว่าฉันกำลังมุ่งหน้าไปทางที่ถูกต้อง ฉันได้รับผลลัพธ์จาก ~ 1,000 ตัวอย่างที่จำเป็นสำหรับข้อผิดพลาดสูงสุด 3% ที่ความมั่นใจ 95% ท้ายที่สุดนี่คือสิ่งที่ฉันพยายามแก้ไข: กิจกรรม # 1 ให้รางวัล 1.0R, X% ของเวลา กิจกรรม # 2 ให้รางวัล 1.4R กับ Y% ของเวลา ฉันต้องการประเมิน X & Y อย่างแม่นยำพอที่จะตัดสินว่ากิจกรรมใดมีประสิทธิภาพมากกว่า ขนาดตัวอย่างที่มีขนาดใหญ่เป็นปัญหาเนื่องจากฉันสามารถได้รับ 1 ตัวอย่างทุก ๆ 20 นาทีเท่านั้น

3
ขนาดสัมพัทธ์ของค่า p ที่ขนาดตัวอย่างต่างกัน
ขนาดสัมพัทธ์ของค่า ap เปลี่ยนแปลงขนาดตัวอย่างต่างกันอย่างไร เช่นถ้าคุณได้p=0.20p=0.20p=0.20ที่n=45n=45n=45สำหรับค่าสหสัมพันธ์และที่n=120n=120n=120คุณได้ค่า p เท่ากันที่ 0.20 สิ่งที่จะเป็นขนาดสัมพันธ์ของค่า p สำหรับการทดสอบครั้งที่สองเมื่อเทียบกับค่า p ดั้งเดิม เมื่อn=45n=45n=45 ?

5
การกำหนดขนาดตัวอย่างก่อนเริ่มการทดสอบหรือเรียกใช้การทดสอบอย่างไม่มีกำหนด
ฉันศึกษาสถิติเมื่อหลายปีก่อนและลืมไปหมดดังนั้นสิ่งเหล่านี้อาจดูเหมือนคำถามเชิงแนวคิดทั่วไปมากกว่าสิ่งใดโดยเฉพาะ แต่นี่คือปัญหาของฉัน ฉันทำงานให้กับเว็บไซต์อีคอมเมิร์ซในฐานะนักออกแบบ UX เรามีกรอบการทดสอบ A / B ที่สร้างขึ้นเมื่อหลายปีก่อนซึ่งฉันเริ่มสงสัย การวัดที่เราทำการตัดสินใจทั้งหมดของเรานั้นเรียกว่าการแปลงและขึ้นอยู่กับเปอร์เซ็นต์ของผู้ใช้ที่เข้าชมเว็บไซต์และซื้อสิ่งต่างๆ ดังนั้นเราต้องการทดสอบการเปลี่ยนสีของปุ่มซื้อจากสีเขียวเป็นสีน้ำเงิน การควบคุมคือสิ่งที่เรามีอยู่แล้วปุ่มสีเขียวที่เรารู้ว่าอัตราการแปลงโดยเฉลี่ยของเราคืออะไร การทดลองกำลังแทนที่ปุ่มสีเขียวด้วยปุ่มสีฟ้า เราเห็นด้วยอย่างมีนัยสำคัญ 95% คือระดับความมั่นใจที่เรามีความสุขและเราเปิดการทดสอบปล่อยให้มันทำงาน เมื่อผู้ใช้เยี่ยมชมเว็บไซต์เบื้องหลังมีโอกาส 50/50 พวกเขาจะถูกส่งไปยังรุ่นควบคุม (ปุ่มสีเขียว) เทียบกับรุ่นทดสอบ (ปุ่มสีน้ำเงิน) หลังจากดูการทดสอบหลังจาก 7 วันฉันเห็นการแปลงเพิ่มขึ้น 10.2% ตามการทดลองด้วยขนาดตัวอย่าง 3000 (1500 ไปสู่การควบคุม 1500 การทดลอง 1500 และนัยสำคัญทางสถิติที่ 99.2% ยอดเยี่ยมฉันคิดว่า การทดสอบดำเนินต่อไปขนาดของตัวอย่างเพิ่มขึ้นจากนั้นฉันเห็นการแปลงเพิ่มขึ้น + 9% โดยมีนัยสำคัญที่ 98.1% ตกลงให้การทดสอบทำงานต่อไปนานขึ้นและตอนนี้การทดลองแสดงให้เห็นว่าการแปลงเพิ่มขึ้น 5% โดยมีนัยสำคัญทางสถิติเพียง 92% โดยกรอบการทำงานบอกฉันว่าฉันต้องการตัวอย่างเพิ่ม 4600 ก่อนที่จะถึงนัยสำคัญ 95%? การทดสอบสรุปได้ในจุดใด? …

1
นัยสำคัญทางสถิติของความแตกต่างระหว่างระยะทาง
ฉันมีเวกเตอร์มากกว่า 3,000 ตัวบนกริดสองมิติพร้อมการกระจายแบบไม่ต่อเนื่องโดยประมาณ เวกเตอร์คู่หนึ่งตอบสนองเงื่อนไขที่แน่นอน หมายเหตุ: เงื่อนไขนี้ใช้ได้กับคู่เวกเตอร์เท่านั้นไม่ใช่กับเวกเตอร์แต่ละตัว ฉันมีรายการประมาณ 1,500 คู่ดังกล่าวลองเรียกมันว่ากลุ่ม 1 กลุ่มที่ 2 มีคู่เวกเตอร์อื่น ๆ ทั้งหมด ฉันต้องการตรวจสอบว่าระยะห่างระหว่างเวกเตอร์ในคู่ในกลุ่ม 1 นั้นมีขนาดเล็กกว่าระยะทางเฉลี่ยระหว่างสองเวกเตอร์หรือไม่ ฉันจะทำสิ่งนั้นได้อย่างไร การทดสอบทางสถิติ : ทฤษฎีบทขีด จำกัด กลางสามารถใช้กับกรณีของฉันได้หรือไม่? นั่นคือฉันสามารถใช้ตัวอย่างระยะทางและใช้การทดสอบ t ของนักเรียนเพื่อเปรียบเทียบวิธีของตัวอย่างที่ปฏิบัติตามเงื่อนไขด้วยวิธีการตัวอย่างที่ไม่ตรงตามเงื่อนไขหรือไม่ มิฉะนั้นการทดสอบทางสถิติใดที่เหมาะสมที่นี่ ขนาดตัวอย่างและจำนวนตัวอย่าง : ฉันเข้าใจว่ามีสองตัวแปรที่นี่สำหรับแต่ละกลุ่มสองฉันต้องใช้ตัวอย่างnขนาดmและหาค่าเฉลี่ยของตัวอย่างแต่ละตัวอย่าง มีวิธีใดหลักการในการเลือกnและm ? พวกเขาควรมีขนาดใหญ่ที่สุด หรือควรให้น้อยที่สุดเท่าที่จะเป็นไปได้ตราบใดที่พวกเขาแสดงนัยสำคัญทางสถิติ? พวกเขาควรจะเหมือนกันสำหรับแต่ละกลุ่มหรือไม่ หรือควรใหญ่กว่าสำหรับกลุ่ม 2 ซึ่งมีจำนวนคู่เวกเตอร์มากกว่านี้

5
เวทมนตร์หมายเลข 20 คืออะไร?
ฉันมีการอ้างอิงที่แนะนำให้พิจารณาขนาดตัวอย่างขั้นต่ำ 20 สำหรับการกระจายข้อมูลที่เหมาะสม มีความรู้สึกในเรื่องนี้หรือไม่? ขอบคุณ

1
สูตรขนาดตัวอย่างสำหรับการทดสอบ F หรือไม่
ฉันสงสัยว่ามีสูตรขนาดตัวอย่างเช่นสูตรของ Lehr ที่ใช้กับการทดสอบ F หรือไม่ สูตรของ Lehr สำหรับการทดสอบ t คือโดยที่คือขนาดของเอฟเฟกต์ ( เช่น ) สิ่งนี้สามารถทำให้เป็นปกติได้ถึงโดยที่เป็นค่าคงที่ที่ขึ้นอยู่กับอัตราของประเภทพลังงานที่ต้องการและไม่ว่าจะทำการทดสอบด้านเดียวหรือสองด้านn=16/Δ2n=16/Δ2n = 16 / \Delta^2ΔΔ\Delta Δ=(μ1−μ2)/σΔ=(μ1−μ2)/σ\Delta = (\mu_1 - \mu_2) / \sigman=c/Δ2n=c/Δ2n = c / \Delta^2ccc ฉันกำลังมองหาสูตรที่คล้ายกันสำหรับการทดสอบ F สถิติการทดสอบของฉันได้รับการแจกจ่ายภายใต้ทางเลือกเนื่องจากไม่ใช่ F กลางที่มีองศาอิสระและพารามิเตอร์ที่ไม่ใช่ศูนย์กลางโดยที่ขึ้นอยู่กับพารามิเตอร์ประชากรเท่านั้นซึ่งไม่เป็นที่รู้จัก . พารามิเตอร์ได้รับการแก้ไขโดยการทดลองและคือขนาดตัวอย่าง เป็นการดีที่ฉันกำลังมองหาสูตร (รูปแบบที่รู้จักกันดี) ของรูปแบบ โดยที่ขึ้นอยู่กับอัตราของฉันและพลังเท่านั้นk,nk,nk,nnλnλn \lambdaλλ\lambdakkknnnn=cg(k,λ)n=cg(k,λ)n = \frac{c}{g(k,\lambda)}ccc ขนาดตัวอย่างควรเป็นไปตาม ที่คือ CDF ของ F ที่ไม่ได้เป็นศูนย์กลางพร้อมพารามิเตอร์ dof …

2
การคำนวณขนาดตัวอย่างแบบพารามิเตอร์และการวิเคราะห์แบบไม่อิงพารามิเตอร์
ฉันอยากรู้ว่าใครมีการอ้างอิงเฉพาะ (ข้อความหรือบทความในวารสาร) เพื่อสนับสนุนการปฏิบัติทั่วไปในวรรณคดีทางการแพทย์ของการคำนวณขนาดตัวอย่างโดยใช้วิธีการที่เป็นพารามิเตอร์ (เช่นสมมติว่ามีการแจกแจงปกติและความแปรปรวนของการวัด) เมื่อการวิเคราะห์ผลการทดลองขั้นต้นจะกระทำโดยใช้วิธีที่ไม่ใช้พารามิเตอร์ ตัวอย่าง: ผลลัพธ์หลักคือเวลาที่จะอาเจียนหลังจากให้ยาบางอย่างซึ่งเป็นที่รู้กันว่ามีค่าเฉลี่ย 20 นาที (SD 6 นาที) แต่มีการแจกแจงเบ้ขวาอย่างเห็นได้ชัด การคำนวณขนาดตัวอย่างทำได้โดยใช้สมมติฐานที่ระบุไว้ข้างต้นโดยใช้สูตร n(per-group)=f(α,β)×(2σ2/(μ1−μ2)2)n(per-group)=f(α,β)×(2σ2/(μ1−μ2)2)n(\text{per-group})=f(\alpha,\beta) \times (2\sigma^2 /(\mu_1 - \mu_2)^2 ) , โดยที่เปลี่ยนแปลงตามข้อผิดพลาดและต้องการf(α,β)f(α,β)f(\alpha, \beta)αα\alphaββ\beta อย่างไรก็ตามเนื่องจากความเบ้ของการแจกแจงการวิเคราะห์ผลลัพธ์หลักจะขึ้นอยู่กับอันดับ (วิธีการที่ไม่ใช่พารามิเตอร์เช่นการทดสอบ Mann Whitney U) สคีมานี้สนับสนุนโดยผู้เขียนในวรรณกรรมทางสถิติหรือควรทำการประมาณขนาดตัวอย่างที่ไม่ใช่พารามิเตอร์ (และจะต้องทำอย่างไร) ความคิดของฉันคือเพื่อความสะดวกในการคำนวณมันเป็นที่ยอมรับที่จะทำแบบฝึกหัดข้างต้น ท้ายที่สุดแล้วการประมาณขนาดตัวอย่างเป็นเพียงแค่นั้น - การประมาณการที่ทำข้อสันนิษฐานหลายข้อ - ซึ่งทั้งหมดนั้นมีแนวโน้มเล็กน้อย (หรือมาก!) ไม่แน่ชัด อย่างไรก็ตามฉันอยากรู้ว่าคนอื่นคิดอย่างไรและโดยเฉพาะอย่างยิ่งที่จะรู้ว่ามีการอ้างอิงใด ๆ เพื่อสนับสนุนการให้เหตุผลในแนวนี้ ขอบคุณมากสำหรับความช่วยเหลือใด ๆ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.