แนวปฏิบัติที่ดีที่สุดเมื่อวิเคราะห์การออกแบบการควบคุมการรักษาก่อนโพสต์


53

ลองนึกภาพการออกแบบทั่วไปต่อไปนี้:

  • ผู้เข้าร่วม 100 คนจะถูกจัดสรรแบบสุ่มให้กับการรักษาหรือกลุ่มควบคุม
  • ตัวแปรตามคือตัวเลขและวัดก่อนและหลังการรักษา

สามตัวเลือกที่ชัดเจนสำหรับการวิเคราะห์ข้อมูลดังกล่าวคือ:

  • ทดสอบกลุ่มตามผลการโต้ตอบเวลาใน ANOVA ผสม
  • ทำ ANCOVA โดยมีเงื่อนไขเหมือนกับ IV และการวัดล่วงหน้าเป็น covariate และ post post เป็น DV
  • ทำการทดสอบ t โดยมีเงื่อนไขว่าเป็น IV และโพสต์คะแนนการเปลี่ยนแปลงล่วงหน้าเป็น DV

คำถาม:

  • วิธีที่ดีที่สุดในการวิเคราะห์ข้อมูลดังกล่าวคืออะไร?
  • มีเหตุผลที่จะชอบวิธีหนึ่งมากกว่าอีกวิธีหนึ่งหรือไม่?

1
เมื่อคุณพูดว่า "เงื่อนไข" คุณหมายถึงการมอบหมายกลุ่มหรือไม่
pmgjones

1
@propofol: ใช่ ขออภัยหากภาษาของฉันไม่ชัดเจน
Jeromy Anglim

1
นอกจากนี้ยังมีวิธีการ "N-of-1" แบบพารามิเตอร์สำหรับการประเมินข้อมูลเชิงสถิติสำหรับการสังเกตเพียงครั้งเดียว ตัวอย่างการใช้งาน: ncbi.nlm.nih.gov/pubmed/2039432วิธีเปรียบเทียบ: europepmc.org/abstract/MED/10557859/ …
31256

คำตอบ:


34

มีวรรณกรรมมากมายรอบหัวข้อนี้ (เปลี่ยน / เพิ่มคะแนน) และฉันคิดว่าการอ้างอิงที่ดีที่สุดมาจากโดเมนชีวการแพทย์เช่น

Senn, S (2007) ปัญหาทางสถิติในการพัฒนายาเสพติด ไวลีย์ (บทที่ 7 หน้า 96-112)

ในการวิจัยทางชีวการแพทย์มีการทำงานที่น่าสนใจในการศึกษาการทดลองข้ามสายพันธุ์ (โดยเฉพาะที่เกี่ยวข้องกับผลกระทบที่มีต่อการพกพาแม้ว่าฉันจะไม่รู้ว่ามันใช้กับการศึกษาของคุณอย่างไร)

จากคะแนนที่ได้รับ t ถึง ANCOVA F (และในทางกลับกัน)จาก Knapp & Schaffer ให้ความเห็นที่น่าสนใจเกี่ยวกับ ANCOVA vs. t (ซึ่งเรียกว่า Lord's Paradox) การวิเคราะห์คะแนนการเปลี่ยนแปลงอย่างง่าย ๆ ไม่ใช่วิธีที่แนะนำสำหรับการออกแบบก่อน / หลังตาม Senn ในบทความของเขาเปลี่ยนจากพื้นฐานและการวิเคราะห์ความแปรปรวนร่วมที่มาเยือน (Stat. Med. 2006 25 (24)) ยิ่งไปกว่านั้นการใช้แบบจำลองเอฟเฟกต์แบบผสม (เช่นเพื่ออธิบายความสัมพันธ์ระหว่างจุดสองจุด) นั้นไม่ได้ดีไปกว่านี้เพราะคุณจำเป็นต้องใช้การวัดแบบ "pre" เป็น covariate เพื่อเพิ่มความแม่นยำ (ผ่านการปรับ) สั้นมาก:

  • การใช้คะแนนการเปลี่ยนแปลง (หลังก่อนหรือผลลัพธ์พื้นฐาน) ไม่ได้แก้ปัญหาความไม่สมดุล ความสัมพันธ์ระหว่างการวัดก่อนและหลังคือ <1 และความสัมพันธ์ระหว่างการวัดก่อนและ (หลังก่อน) นั้นเป็นลบ - มันจะตามมาถ้าการรักษา (การจัดสรรกลุ่มของคุณ) ตามที่วัดด้วยคะแนนดิบนั้นเป็นข้อเสียที่ไม่ยุติธรรม ในการควบคุมมันจะมีข้อได้เปรียบที่ไม่เป็นธรรมกับคะแนนการเปลี่ยนแปลง
  • ความแปรปรวนของตัวประมาณที่ใช้ใน ANCOVA โดยทั่วไปนั้นต่ำกว่าค่าประมาณสำหรับดิบหรือคะแนนการเปลี่ยนแปลง (ยกเว้นความสัมพันธ์ระหว่างค่าก่อนและหลังเท่ากับ 1)
  • หากความสัมพันธ์ก่อน / หลังแตกต่างกันระหว่างทั้งสองกลุ่ม (ความลาดชัน) ก็ไม่ได้เป็นปัญหามากไปกว่าวิธีอื่นใด (วิธีการเปลี่ยนคะแนนก็ถือว่าความสัมพันธ์นั้นเหมือนกันระหว่างทั้งสองกลุ่ม - สมมติฐานความชันขนาน )
  • ภายใต้สมมติฐานว่างของความเท่าเทียมของการรักษา (บนผลลัพธ์) ไม่คาดว่าจะมีปฏิสัมพันธ์กับการรักษา x พื้นฐาน; มันเป็นสิ่งที่อันตรายที่จะจัดวางแบบจำลองดังกล่าว แต่ในกรณีนี้เราต้องใช้เส้นศูนย์กลางที่ศูนย์กลาง

ฉันยังชอบเทพนิยายสิบคะแนนที่แตกต่างจากเอ็ดเวิร์ดแม้ว่ามันจะมุ่งเน้นไปที่คะแนนที่แตกต่างในบริบทที่แตกต่างกัน แต่นี่คือบรรณานุกรมประกอบการวิเคราะห์การเปลี่ยนแปลงก่อนโพสต์ (น่าเสียดายที่มันไม่ครอบคลุมงานล่าสุด) Van Breukelen ยังเปรียบเทียบ ANOVA กับ ANCOVA ในการตั้งค่าแบบสุ่มและไม่สุ่มและข้อสรุปของเขาสนับสนุนความคิดที่ว่า ANCOVA จะต้องเป็นที่ต้องการอย่างน้อยในการศึกษาแบบสุ่ม (ซึ่งป้องกันจากการถดถอยเพื่อผลเฉลี่ย)


เพื่อชี้แจง: คุณหมายถึงว่า ANCOVA ที่มีคะแนนทดสอบล่วงหน้าเนื่องจาก covariates เป็นตัวเลือกที่ดีที่สุดหรือไม่?
mkt - Reinstate Monica

17

แดเนียลบีไรท์กล่าวถึงนี้ในมาตรา 5 ของบทความของเขาทำให้เพื่อนกับข้อมูลของคุณ เขาแนะนำ (p.130):

ขั้นตอนเดียวที่ถูกต้องเสมอในสถานการณ์นี้คือ scatterplot เปรียบเทียบคะแนนที่เวลา 2 กับที่เวลา 1 สำหรับกลุ่มต่าง ๆ ในกรณีส่วนใหญ่คุณควรวิเคราะห์ข้อมูลได้หลายวิธี หากวิธีการให้ผลลัพธ์ที่แตกต่าง ... คิดให้รอบคอบมากขึ้นเกี่ยวกับแบบจำลองโดยนัย

เขาแนะนำบทความต่อไปนี้เป็นการอ่านเพิ่มเติม:

  • มือดีเจ (1994) การแยกแยะคำถามเชิงสถิติ วารสารสมาคมสถิติแห่งชาติ: A, 157, 317–356
  • ท่านลอร์ด fm (2510) ความขัดแย้งในการตีความการเปรียบเทียบกลุ่ม แถลงการณ์ทางจิตวิทยา, 72, 304–305 PDF ฟรี
  • Wainer, H. (1991) การปรับอัตราฐานที่แตกต่าง: ความขัดแย้งของพระเจ้าอีกครั้ง กระดานข่าวทางจิตวิทยา, 109, 147–151 PDF ฟรี

9

กลยุทธ์ที่พบบ่อยที่สุดคือ:

  1. มาตรการ ANOVA ซ้ำด้วยหนึ่งปัจจัยภายในเรื่อง (ก่อนกับหลังการทดสอบ) และหนึ่งระหว่างปัจจัยเรื่อง (การรักษาเทียบกับการควบคุม)
  2. ANCOVA ในคะแนนหลังการรักษาด้วยคะแนนก่อนการรักษาในรูปของค่าความแปรปรวนร่วมและการรักษาเป็นตัวแปรอิสระ โดยสังเขปความคิดคือการทดสอบความแตกต่างระหว่างทั้งสองกลุ่มเป็นสิ่งที่คุณเป็นจริงและรวมถึงคะแนนการทดสอบก่อนหน้านี้ในฐานะ covariate สามารถเพิ่มพลังเมื่อเทียบกับ t-test หรือ ANOVA แบบง่าย

มีการถกเถียงกันมากมายเกี่ยวกับการตีความสมมติฐานและความแตกต่างที่ขัดแย้งระหว่างสองแนวทางนี้กับทางเลือกที่ซับซ้อนกว่า (โดยเฉพาะอย่างยิ่งเมื่อผู้เข้าร่วมไม่สามารถทำการสุ่มรักษา) แต่พวกเขายังคงมาตรฐานอยู่

แหล่งที่มาของความสับสนที่สำคัญอย่างหนึ่งคือสำหรับ ANOVA ผลที่น่าสนใจน่าจะเป็นการปฏิสัมพันธ์ระหว่างเวลาและการรักษาและไม่ใช่ผลหลักของการรักษา อนึ่งการทดสอบ F สำหรับคำศัพท์นี้จะให้ผลลัพธ์ที่เหมือนกันอย่างแน่นอนกว่าการทดสอบตัวอย่างแบบอิสระบนคะแนนที่ได้รับ (เช่นคะแนนที่ได้จากการลบคะแนนก่อนการทดสอบจากคะแนนหลังการทดสอบสำหรับผู้เข้าร่วมแต่ละคน) ยังไปเพื่อที่

หากทั้งหมดนี้มากเกินไปคุณไม่มีเวลาที่จะคิดออกและไม่สามารถขอความช่วยเหลือจากนักสถิตินักรวดเร็วและสกปรก แต่โดยวิธีการที่ไร้สาระทั้งหมดจะเปรียบเทียบคะแนนหลังการทดสอบกับ ตัวอย่างอิสระ t-test โดยไม่สนใจค่าการทดสอบล่วงหน้า นี้จะทำให้ความรู้สึกหากผู้เข้าร่วมในความเป็นจริงสุ่มให้กลุ่มการรักษาหรือควบคุม

ท้ายที่สุดนั่นไม่ใช่เหตุผลที่ดีในการเลือก แต่ฉันสงสัยว่าวิธีที่ 2 ข้างต้น (ANCOVA) คือสิ่งที่ผ่านไปแล้วสำหรับแนวทางที่ถูกต้องในด้านจิตวิทยาดังนั้นหากคุณเลือกอย่างอื่นคุณอาจต้องอธิบายเทคนิคในรายละเอียดหรือเพื่อให้เหตุผล ตัวคุณเองกับคนที่เชื่อมั่นเช่น“ ได้รับคะแนนทราบว่าไม่ดี”


1
ฉันว่าคำแนะนำแรกมาตรการ ANOVA ซ้ำแล้วซ้ำอีกไม่เหมาะสำหรับการวิเคราะห์ข้อมูลก่อนโพสต์ การรักษามีรหัสเป็น 0 ในกลุ่มการแทรกแซงที่พื้นฐานหรือไม่? ไม่ว่าจะด้วยวิธีใดวิธีนี้จะทำให้เกิดผลฮอว์ ธ อร์นอีกครั้ง ความแตกต่างอย่างเป็นระบบในการพรี / โพสต์ระหว่างการควบคุมจะถูกทำให้แตกต่างกันไปแบบสุ่ม RM AN C OVA มีความชอบธรรมเมื่อมีการวัดหลายครั้งในช่วงหลังการโพสต์และค่าพื้นฐานยังคงปรับเป็นโควาเรียตหรือใช้เป็นคะแนนกำไร
AdamO

2

ANCOVA และการวัดซ้ำ / ตัวแบบผสมสำหรับคำศัพท์ปฏิสัมพันธ์เป็นการทดสอบสมมติฐานที่แตกต่างกันสองแบบ อ้างถึงบทความนี้: ariticle 1และบทความนี้: บทความ 2


-2

เนื่องจากคุณมีสองวิธี (อย่างใดอย่างหนึ่งของรายการที่เฉพาะเจาะจงหรือผลรวมของสินค้าคงคลัง) จึงไม่มีเหตุผลที่จะต้องพิจารณา ANOVA การทดสอบแบบจับคู่อาจเหมาะสม สิ่งนี้อาจช่วยคุณเลือกการทดสอบ t ที่คุณต้องการ

คุณต้องการดูผลลัพธ์เฉพาะรายการหรือคะแนนโดยรวมหรือไม่ หากคุณต้องการทำการวิเคราะห์รายการนี่อาจเป็นจุดเริ่มต้นที่มีประโยชน์


4
แล้วกลุ่มควบคุมล่ะ? การทดสอบแบบจับคู่กับข้อมูลทั้งหมดดูเหมือนความคิดที่ไม่ดีและแน่นอนไม่ได้ตอบคำถามหลัก (การรักษามีประสิทธิภาพหรือไม่?) การทดสอบแบบจับคู่ t- จำกัด อยู่ที่กลุ่มการรักษาเป็นกลยุทธ์ที่มีเหตุผล แต่การไม่สนใจกลุ่มควบคุมจะทิ้งข้อมูลจำนวนมากและสร้างหลักฐานที่อ่อนแอกว่ามากว่าการแทรกแซงนั้นเป็นส่วนประกอบสำคัญ อันที่จริงแล้ว ANOVA เป็นเรื่องธรรมดา - หากวิพากษ์วิจารณ์บ่อยครั้ง - วิธีวิเคราะห์การออกแบบนี้
Gala
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.