ฉันจะรวมค่า p bootstrapped กับชุดข้อมูลที่มีการคูณทวีคูณได้อย่างไร


12

ฉันกังวลกับปัญหาที่ฉันต้องการบู๊ต p-value สำหรับการประมาณของจากข้อมูล imputed (MI) ที่คูณกัน แต่มันก็ไม่ชัดเจนสำหรับฉันที่จะรวมค่า p-ข้ามชุด MIθ

สำหรับชุดข้อมูล MI วิธีการมาตรฐานในการเข้าถึงความแปรปรวนโดยประมาณทั้งหมดใช้กฎของรูบิน ดูที่นี่สำหรับการตรวจสอบการรวมชุดข้อมูล MI รากที่สองของความแปรปรวนทั้งหมดทำหน้าที่เป็นประมาณการข้อผิดพลาดมาตรฐานของ\อย่างไรก็ตามสำหรับบางตัวประมาณค่าความแปรปรวนทั้งหมดยังไม่ทราบว่าเป็นรูปแบบปิดหรือการกระจายตัวตัวอย่างไม่ปกติ สถิติอาจไม่ได้รับการแจกแจงแบบทีไม่ใช่แบบไม่แสดงอาการθ / s E ( θ )θθ/se(θ)

ดังนั้นในกรณีข้อมูลที่สมบูรณ์ตัวเลือกหนึ่งทางเลือกคือการบูตสถิติเพื่อค้นหาความแปรปรวนค่า p และช่วงความมั่นใจแม้ว่าการกระจาย samling ไม่ปกติและไม่ทราบรูปแบบปิด ในกรณี MI มีสองตัวเลือก:

  • รวมกลุ่มความแปรปรวนที่เริ่มต้นผ่านชุดข้อมูล MI
  • พูลค่า p-value หรือขอบเขตความมั่นใจในชุดข้อมูล MI

ตัวเลือกแรกจะใช้กฎของรูบินอีกครั้ง อย่างไรก็ตามฉันเชื่อว่านี่เป็นปัญหาหากมีการแจกแจงตัวอย่างที่ไม่ปกติ ในสถานการณ์นี้ (หรือโดยทั่วไปในทุกสถานการณ์) ค่า p bootstrapped สามารถนำมาใช้โดยตรง อย่างไรก็ตามในกรณี MI สิ่งนี้จะนำไปสู่ค่า p หลายค่าหรือช่วงความเชื่อมั่นซึ่งจำเป็นต้องรวมเข้าด้วยกันในชุดข้อมูล MIθ

ดังนั้นคำถามของฉันคือฉันควรรวมค่า p-bootstrapped หลาย ๆ ตัว (หรือช่วงความมั่นใจ) ไว้ในชุดข้อมูลที่มีการคูณทวีคูณอย่างไร

ฉันยินดีรับข้อเสนอแนะเกี่ยวกับวิธีดำเนินการขอบคุณ


ที่เป็นประโยชน์บางที: หายไปข้อมูลใส่ร้ายและเงินทุน (Efron 1992) statistics.stanford.edu/sites/default/files/BIO%2520153.pdf
DL Dahly

@DLDahly อืมฉันไม่คุ้นเคยกับกระดาษนั้น แต่ความคิดที่ดูเหมือนจะเริ่มต้นก่อนแล้วจึงทำการใส่หลาย ๆ OP ดูเหมือนจะเป็นการประเมินราคาเริ่มต้นจากชุดข้อมูล MI
tchakravarty

@fgnu อันที่จริงแล้วขั้นตอนมาตรฐานในการรับความแปรปรวนทั้งหมดของการประมาณโดย bootstrap คือการบูตความแปรปรวนภายในชุดข้อมูล MI แต่ละชุดจากนั้นใช้กฎของ Rubin เพื่อรวมชุดความแปรปรวน bootstrapped เข้ากับชุดข้อมูล MI
tomka

คำตอบ:


6

ฉันคิดว่าตัวเลือกทั้งคู่ส่งผลให้ได้คำตอบที่ถูกต้อง โดยทั่วไปแล้วฉันต้องการวิธีที่ 1 เนื่องจากรักษาการกระจายทั้งหมด

สำหรับวิธีที่ 1 ให้บูตพารามิเตอร์คูณภายในแต่ละโซลูชัน MI จากนั้นก็ผสมการแจกแจง bootstrapped เพื่อให้ได้ความหนาแน่นสุดท้ายของคุณตอนนี้ประกอบด้วยตัวอย่างที่มีการแปรผันระหว่างการใส่เข้าไป จากนั้นให้ถือว่าเป็นตัวอย่างบูตสแตรปทั่วไปเพื่อรับช่วงความมั่นใจ ใช้ bootstrap แบบเบย์สำหรับตัวอย่างขนาดเล็ก ฉันรู้ว่าไม่มีงานจำลองที่ตรวจสอบขั้นตอนนี้และนี่เป็นปัญหาเปิดที่ต้องสอบสวนm m k × mkmmk×m

สำหรับวิธีที่ 2 ใช้ขั้นตอน Licht-Rubin ดูวิธีรับค่า p-pooled จากการทดสอบที่ทำในชุดข้อมูลหลายชุด


+1 - หากเป้าหมายคือเข้าใจความแปรปรวนของการประมาณค่าในชุดข้อมูล MI ฉันจะบู๊ตภายในชุดข้อมูล MI แต่ละชุดและดูการกระจายตัวของพารามิเตอร์ทั้งหมดและ MI เฉพาะ
DL Dahly

@ Stef-van-Buuren ดูเหมือนว่าสิ่งที่ DL Dahly แนะนำเทียบเท่ากับการรวมความแปรปรวนที่เพิ่มขึ้นในชุด MI คุณจะยังคงต้องการวิธีการของคุณหนึ่ง (ผนวกชุดข้อมูล bootstrapped ทั้งหมด) มากกว่าวิธีการ 'ทางอ้อม' นี้หรือไม่?
tomka

@tomka แน่นอนฉันจะทำเช่นเดียวกันกับ DL Dahly และศึกษาการกระจายตัวของภายในและระหว่าง ในการรวมการแจกแจงทั้งสองประเภทเราจำเป็นต้องรวมการแจกแจงในบางวิธี คำแนะนำของฉันคือการผสมพวกเขา
Stef van Buuren

6

นี่ไม่ใช่วรรณกรรมที่ฉันคุ้นเคย แต่วิธีหนึ่งในการเข้าถึงสิ่งนี้อาจเป็นการเพิกเฉยต่อความจริงที่ว่าสิ่งเหล่านี้คือค่า p ที่ถูกบูตและดูที่วรรณกรรมเกี่ยวกับการรวมค่า p ในชุดข้อมูลที่ใส่เข้าไปทวีคูณ

ในกรณีที่หลี่เม้ง Raghunathan และรูบิน (1991)มีผลบังคับใช้ ขั้นตอนจะขึ้นอยู่กับสถิติจากชุดข้อมูลแต่ละชุดซึ่งมีน้ำหนักโดยใช้การวัดการสูญเสียข้อมูลเนื่องจากการใส่ข้อมูล พวกเขาพบปัญหาที่เกี่ยวข้องกับการแจกแจงร่วมของสถิติในการใส่ข้อมูลและทำให้สมมติฐานบางอย่างง่ายขึ้น

ที่น่าสนใจที่เกี่ยวข้องเม้ง (1994)

ปรับปรุง

ขั้นตอนสำหรับการรวมค่า p ในชุดข้อมูลที่มีการคูณที่มีการอธิบายไว้ในวิทยานิพนธ์ของ Christine Licht, Ch 4 . ความคิดที่เธอให้กับ Don Rubin นั้นเป็นสิ่งสำคัญในการแปลงค่า p ที่จะกระจายตามปกติซึ่งสามารถนำมารวมกันในชุดข้อมูล MI โดยใช้กฎมาตรฐานสำหรับการรวมกันของสถิติ z


ถ้าฉันเข้าใจ Li et al ทำงานอย่างถูกต้องมันใช้กับสถิติที่คุณได้รับจากชุด MI แต่ละชุด ตัวอย่างเช่นหากคุณได้รับ Pearson Chi²ในแต่ละชุดคุณสามารถใช้กฎของพวกเขาเพื่อรวมเข้าด้วยกันเพื่ออนุมานข้ามชุด ตัวอย่างเช่นการทดสอบ Wald สามารถดำเนินการได้เช่นกัน แต่ในกรณีของ bootstrap คุณไม่ได้รับสถิติคุณจะรวมกลุ่ม (แต่มีเพียงค่า p) ดังนั้นฉันไม่แน่ใจว่ามีบางอย่างใน Li et al หรือไม่ ที่สามารถนำไปใช้กับ bootstrapped p
tomka

1
@tomka ฉันได้อัปเดตคำตอบของฉันแล้ว
tchakravarty
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.