การคำนวณขนาดตัวอย่างสำหรับแบบผสม


23

ฉันสงสัยว่ามีวิธีใดในการคำนวณขนาดตัวอย่างในโมเดลผสมหรือไม่ ฉันใช้lmerใน R เพื่อให้พอดีกับโมเดล (ฉันมีความลาดชันและจุดตัดแบบสุ่ม)


3
การจำลองเป็นตัวเลือกเสมอ - คือจำลองข้อมูลภายใต้สมมติฐานทางเลือกเฉพาะและขนาดตัวอย่างและปรับโมเดลให้เหมาะสมใหม่หลาย ๆ ครั้งเพื่อดูว่าคุณปฏิเสธสมมติฐานว่างที่น่าสนใจบ่อยแค่ไหน จากประสบการณ์ของฉันมันค่อนข้างใช้เวลานาน (คอมพิวเตอร์) เนื่องจากมันใช้เวลาอย่างน้อยสองสามวินาทีสำหรับแต่ละรุ่น
มาโคร

คำตอบ:


29

longpowerแพคเกจการดำเนินการคำนวณขนาดของกลุ่มตัวอย่างในหลิวและเหลียง (1997) และดิ๊กเกิ้ล, et al (2002) เอกสารประกอบมีรหัสตัวอย่าง นี่คือหนึ่งโดยใช้lmmpower()ฟังก์ชั่น:

> require(longpower)
> require(lme4)
> fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy) 
> lmmpower(fm1, pct.change = 0.30, t = seq(0,9,1), power = 0.80)

     Power for longitudinal linear model with random slope (Edland, 2009) 

              n = 68.46972
          delta = 3.140186
         sig2.s = 35.07153
         sig2.e = 654.941
      sig.level = 0.05
              t = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
          power = 0.8
    alternative = two.sided
       delta.CI = 2.231288, 4.049084
           Days = 10.46729
        Days CI = 7.437625, 13.496947
           n.CI = 41.18089, 135.61202

ตรวจสอบสิ่งliu.liang.linear.power()ที่ " ทำการคำนวณขนาดตัวอย่างสำหรับโมเดลเชิงเส้นผสม"

Liu, G. , & Liang, KY (1997) การคำนวณขนาดตัวอย่างสำหรับการศึกษาที่มีการสังเกตที่สัมพันธ์กัน ชีวภาพ, 53 (3), 937-47

Diggle PJ, Heagerty PJ, Liang K, Zeger SL การวิเคราะห์ข้อมูลระยะยาว ฉบับที่สอง ฟอร์ด Serires วิทยาศาสตร์สถิติ 2002

แก้ไข: อีกวิธีคือ "แก้ไข" สำหรับผลกระทบของการทำคลัสเตอร์ ในแบบจำลองเชิงเส้นธรรมดาการสังเกตแต่ละครั้งมีความเป็นอิสระ แต่ในการปรากฏตัวของการสังเกตการจัดกลุ่มไม่เป็นอิสระซึ่งสามารถคิดว่ามีการสังเกตอิสระน้อยลง - ขนาดตัวอย่างที่มีประสิทธิภาพนั้นเล็กกว่า การสูญเสียประสิทธิภาพนี้เรียกว่าเอฟเฟกต์การออกแบบ :

DE=1+(m1)ρ
โดยที่คือขนาดคลัสเตอร์เฉลี่ยและคือค่าสัมประสิทธิ์สหสัมพันธ์อินทราสคลาส ดังนั้นขนาดตัวอย่างที่ได้จากการคำนวณที่ละเว้นการทำคลัสเตอร์จะสูงเกินจริงโดยเพื่อให้ได้ขนาดตัวอย่างที่อนุญาตสำหรับการทำคลัสเตอร์mD EρDE

3
ผลการออกแบบนี้เกี่ยวข้องกับสถิติเชิงเส้นโดยรวมเท่านั้น (หมายถึงผลรวม) สำหรับสัมประสิทธิ์การถดถอย DEFF นั้นเหมือนที่เป็น ICC ของ regressor และเป็น ICC ของเทอมข้อผิดพลาด ข้อผิดพลาดคอมโพสิต = ผลแบบสุ่มคลัสเตอร์ + ผลการสังเกตที่เฉพาะเจาะจง) เนื่องจากผลิตภัณฑ์ของสหสัมพันธ์ที่มีแนวโน้มที่จะมีขนาดเล็กข้อ จำกัด นี้ก็เล็กเช่นกัน ρ x ρ ϵ
DEFF=1+(m1)ρxρϵ,
ρxρϵ
StasK

คุณช่วยชี้ให้ฉันดูการอ้างอิงสำหรับสูตรนี้ได้ไหม
Joshua Rosenberg

10

สำหรับทุกอย่างที่นอกเหนือจากการทดสอบตัวอย่าง 2 อย่างฉันชอบใช้การจำลองสำหรับขนาดตัวอย่างหรือการศึกษาด้านกำลัง ด้วยกิจวัตรแบบแพคเกจล่วงหน้าบางครั้งคุณสามารถเห็นความแตกต่างอย่างมากระหว่างผลลัพธ์จากโปรแกรมตามสมมติฐานที่พวกเขากำลังทำ (และคุณอาจไม่สามารถค้นหาว่าสมมติฐานเหล่านั้นคืออะไร ด้วยการจำลองคุณควบคุมสมมติฐานทั้งหมด

นี่คือลิงค์ไปยังตัวอย่าง:
https://stat.ethz.ch/pipermail/r-sig-mixed-models/2009q1/001790.html


แค่สงสัยว่ามันใช้งานได้กับรุ่น GLMER หรือไม่
Charlie Glez

1
@CarlosGlez ใช่มันใช้งานได้กับทุกรุ่นที่คุณสามารถจำลองข้อมูลและวิเคราะห์มันได้ ฉันทำสิ่งนี้สำหรับรุ่น GLMER แล้ว
เกร็กสโนว์

พูดได้ดีและฉันจะเพิ่มว่านอกจาก "การควบคุมสมมติฐาน" คุณยังสามารถถามคำถาม "เกิดอะไรขึ้นถ้า" ทำลายสมมติฐานเหล่านี้และกำหนดความรู้สึกเชิงปฏิบัติของความแข็งแกร่งเช่นว่าเอฟเฟกต์แบบสุ่มที่ไม่ปกติจะทำลายประสิทธิภาพจริงๆหรือไม่
AdamO
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.