มันถูกต้องหรือไม่ที่จะรวมการวัดพื้นฐานเป็นตัวแปรควบคุมเมื่อทดสอบผลกระทบของตัวแปรอิสระต่อคะแนนการเปลี่ยนแปลง?


38

ฉันพยายามเรียกใช้การถดถอย OLS:

  • DV: การเปลี่ยนแปลงของน้ำหนักในช่วงหนึ่งปี (น้ำหนักเริ่มต้น - น้ำหนักสุดท้าย)

  • IV: ไม่ว่าคุณจะออกกำลังกายหรือไม่ก็ตาม

อย่างไรก็ตามดูเหมือนว่าคนที่มีน้ำหนักมากจะลดน้ำหนักได้มากขึ้นต่อการออกกำลังกายมากกว่าคนที่ผอมลง ดังนั้นฉันต้องการรวมตัวแปรควบคุม:

  • CV: น้ำหนักเริ่มต้นเริ่มต้น

อย่างไรก็ตามตอนนี้น้ำหนักเริ่มต้นจะใช้ทั้งสองในการคำนวณตัวแปรตามและเป็นตัวแปรควบคุม

ไม่เป็นไร สิ่งนี้ละเมิดสมมติฐานของ OLS หรือไม่


4
ได้รับการรักษาแบบสุ่มหรือไม่?
Andy W

1
หมายเหตุที่ว่าคนอื่นที่คล้ายกันมากก็ถามว่าเมื่อเร็ว ๆ นี้เช่นกันstats.stackexchange.com/q/15104/1036 คำตอบสำหรับคำถามนั้นใช้ได้กับคำถามนี้ (อันที่จริงแล้วฉันจะบอกว่าพวกเขาเป็นคำถามซ้ำซ้อน)
Andy W

3
@ อันที่จริงแล้วคำถามสองข้อนั้นแตกต่างกันมากพอที่ฉันจะให้คำตอบที่แตกต่างจากคำถามนี้ Charlie ได้ทำการวิเคราะห์ที่ดีที่นี่แล้ว
whuber

3
โปรดทราบว่าโดยทั่วไปแล้วการใช้คะแนนที่แตกต่างนั้นมีความเกี่ยวข้องกับการลดความน่าเชื่อถือแม้ว่าจะมีการถกเถียงกันค่อนข้างมาก
Behacad

คำตอบ:


25

ที่จะตอบคำถามที่แท้จริงของคุณ "คือมันถูกต้องที่จะรวมถึงมาตรการพื้นฐานเป็นตัวแปรควบคุมเมื่อการทดสอบผลของตัวแปรอิสระกับคะแนนการเปลี่ยนแปลง?" คำตอบคือไม่มี คำตอบคือไม่เพราะจากการก่อสร้างคะแนนพื้นฐานมีความสัมพันธ์กับคำผิดพลาดเมื่อใช้คะแนนการเปลี่ยนแปลงเป็นตัวแปรตามดังนั้นผลกระทบโดยประมาณของพื้นฐานในคะแนนการเปลี่ยนแปลงจะไม่สามารถตีความได้

การใช้

  • Y1เป็นน้ำหนักเริ่มต้น
  • Y2เป็นน้ำหนักสิ้นสุด
  • Δ Y = Y 2 - Y 1ΔYตามการเปลี่ยนแปลงของน้ำหนัก (เช่น )ΔY=Y2Y1
  • Tเป็นการรักษาแบบสุ่มที่ได้รับมอบหมายและ
  • Xเป็นปัจจัยภายนอกอื่น ๆ ที่มีผลต่อน้ำหนัก (เช่นตัวแปรควบคุมอื่น ๆ ที่เกี่ยวข้องกับผลลัพธ์ แต่ควรไม่เกี่ยวข้องกับการรักษาเนื่องจากการสุ่มกำหนด)

จากนั้นมีรูปแบบการถดถอยบนและ ; T XΔYTX

ΔY=β1T+β2X+e

ซึ่งตามคำนิยามเทียบเท่ากับ;

Y2Y1=β1T+β2X+e

ทีนี้ถ้าคุณรวม baseline เป็น covariate เราควรเห็นปัญหาในการที่คุณมีทั้งสองข้างของสมการ สิ่งนี้แสดงให้เห็นว่านั้นไม่สามารถได้เพราะมีความสัมพันธ์โดยทั่วไปกับคำที่ผิดพลาดβ 3 Y 1Y1β3Y1

Y2Y1=β1T+β2X+β3Y1+eY2=β1T+β2X+β3Y1+(e+Y1)

ตอนนี้เป็นส่วนหนึ่งของความสับสนในคำตอบต่างๆที่ดูเหมือนว่าจะเกิดจากความจริงที่ว่ารูปแบบที่แตกต่างกันจะให้ผลลัพธ์ที่เหมือนกันสำหรับผลการรักษา ,ในการกำหนดดังกล่าวข้างต้นของฉัน ดังนั้นหากมีการเปรียบเทียบผลการรักษาสำหรับแบบจำลองโดยใช้คะแนนการเปลี่ยนแปลงเป็นตัวแปรที่ขึ้นอยู่กับแบบจำลองโดยใช้ "ระดับ" (กับแต่ละรุ่นรวมถึงพื้นฐานเป็น ) การตีความผลการรักษาจะเป็น เหมือนกัน. ในทั้งสองรุ่นที่ตามมาจะเหมือนกันและจะทำการอนุมานตามพวกมัน (Bruce Weaver มีรหัส SPSSบางตัวที่โพสต์แสดงให้เห็นถึงความเท่าเทียมกันเช่นกัน)Y 1 β 1 Tβ1TY1β1T

Change Score Model:Y2Y1=β1T+β2X+β3Y1+eLevels Model:Y2=β1T+β2X+β3Y1+e

ดังนั้นบางคนจะเถียง (ตามที่เฟลิกซ์มีในหัวข้อนี้และอย่างที่บรูซวีฟเวอร์ได้ทำการสนทนากันในกลุ่ม Google SPSS) เนื่องจากแบบจำลองนั้นมีผลการรักษาโดยประมาณเหมือนกันจึงไม่สำคัญว่าคุณจะเลือกรุ่นใด ฉันไม่เห็นด้วยเพราะพื้นฐาน covariate ในแบบจำลองคะแนนการเปลี่ยนแปลงไม่สามารถตีความได้คุณไม่ควรรวม baseline เป็น covariate (ไม่ว่าผลการรักษาโดยประมาณจะเหมือนกันหรือไม่ก็ตาม) ดังนั้นสิ่งนี้ทำให้เกิดคำถามอีกข้อหนึ่งอะไรคือจุดที่ใช้คะแนนการเปลี่ยนแปลงเป็นตัวแปรตาม ดังที่เฟลิกซ์ตั้งข้อสังเกตไว้เช่นกันแบบจำลองที่ใช้คะแนนการเปลี่ยนแปลงเป็นตัวแปรตามที่ไม่รวมค่าพื้นฐานเป็นค่าความแปรปรวนร่วมนั้นแตกต่างจากตัวแบบที่ใช้ระดับ เพื่อชี้แจงรูปแบบที่ตามมาจะให้ผลการรักษาที่แตกต่างกัน (โดยเฉพาะอย่างยิ่งในกรณีที่การรักษามีความสัมพันธ์กับพื้นฐาน);

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

เรื่องนี้ได้รับการบันทึกไว้ในวรรณคดีก่อนหน้าว่า "ท่านขัดขืน" ดังนั้นรูปแบบที่ถูกต้อง? ในกรณีของการทดลองแบบสุ่มฉันจะบอกว่าแบบจำลองระดับดีกว่า (แม้ว่าคุณจะทำการสุ่มได้ดีผลการรักษาโดยเฉลี่ยควรอยู่ใกล้กันมากระหว่างแบบจำลอง) เหตุผลอื่น ๆ ที่บันทึกไว้ว่าทำไมแบบจำลองระดับจึงดีกว่าคำตอบของ Charlieทำให้เป็นจุดที่ดีที่คุณสามารถประเมินผลกระทบการโต้ตอบกับพื้นฐานในแบบจำลองระดับ (แต่คุณไม่สามารถอยู่ในรูปแบบคะแนนการเปลี่ยนแปลง) Whuber ในการตอบคำถามที่คล้ายกันนี้แสดงให้เห็นว่าคะแนนการเปลี่ยนแปลงนั้นก่อให้เกิดความสัมพันธ์ระหว่างการรักษาที่แตกต่างกันอย่างไร

ในสถานการณ์ที่ไม่ได้รับการรักษาแบบสุ่มรูปแบบที่ใช้คะแนนการเปลี่ยนแปลงเป็นตัวแปรตามควรได้รับการพิจารณามากขึ้น ประโยชน์หลักของแบบจำลองคะแนนการเปลี่ยนแปลงก็คือเมื่อใดก็ตามที่มีการควบคุมตัวทำนายค่าคงที่ตลอดเวลา เพื่อบอกว่าในการกำหนดข้างต้นเป็นค่าคงที่ตลอดเวลา (เช่นบอกความบกพร่องทางพันธุกรรมที่จะเป็นที่น้ำหนักบางอย่าง) และมีความสัมพันธ์กับว่า Chooses บุคคลที่จะออกกำลังกาย (และคือไม่มีใครสังเกต) ในตัวอย่างนั้นรูปแบบคะแนนการเปลี่ยนแปลงจะดีกว่า นอกจากนี้ในกรณีที่การเลือกในการรักษามีความสัมพันธ์กับค่าพื้นฐานรูปแบบคะแนนการเปลี่ยนแปลงอาจจะดีกว่า Paul Allison ในเอกสารของเขาX XXXXเปลี่ยนคะแนนเป็นตัวแปรที่ขึ้นอยู่กับการวิเคราะห์การถดถอยแสดงตัวอย่างเดียวกันนี้ (และมีอิทธิพลอย่างมากต่อมุมมองของฉันในหัวข้อดังนั้นฉันขอแนะนำให้อ่าน)

นี่ไม่ได้เป็นการบอกว่าคะแนนการเปลี่ยนแปลงนั้นดีกว่าเสมอในการตั้งค่าแบบไม่สุ่ม ในกรณีที่คุณคาดว่าพื้นฐานจะมีผลกระทบที่เกิดขึ้นจริงกับน้ำหนักโพสต์คุณควรใช้แบบจำลองระดับ ในกรณีที่คุณคาดว่าพื้นฐานจะมีผลเชิงสาเหตุและการเลือกในการรักษามีความสัมพันธ์กับพื้นฐานผลการรักษาจะสับสนกับผลพื้นฐาน

ฉันไม่สนใจบันทึกย่อของ Charlie ว่าลอการิทึมของน้ำหนักนั้นสามารถใช้เป็นตัวแปรตาม ในขณะที่ฉันไม่สงสัยเลยว่าอาจเป็นไปได้ แต่ก็ไม่ได้เป็นไปตามคำถามเริ่มต้น คำถามอื่นได้กล่าวถึงเมื่อมันเหมาะสมที่จะใช้ลอการิทึมของตัวแปร (และยังคงใช้ในกรณีนี้) อาจมีวรรณกรรมก่อนหน้าในเรื่องที่จะช่วยแนะนำคุณว่าการใช้น้ำหนักที่บันทึกไว้นั้นเหมาะสมหรือไม่


การอ้างอิง

แอลลิสัน, พอลดีปี 1990 เปลี่ยนคะแนนเป็นตัวแปรในการวิเคราะห์การถดถอย ระเบียบวิธีทางสังคมวิทยา 20: 93-114 รุ่นสาธารณะรูปแบบไฟล์ PDF


3
ในสมการถ้าเป็นเป็นมาตรฐานการปฏิบัติเราสมมติตัวแปรทั้งหมดที่ไม่ได้เป็นตัวแปรสุ่มแล้วไม่ได้มีความสัมพันธ์กับY_1 ดังนั้นฉันคิดว่ามีปัญหาเฉพาะถ้าคุณดูเป็นแบบสุ่มซึ่งในกรณีนี้ (เป็นเพียงความคิดเห็นของฉัน) คุณควรทำแบบจำลองร่วมกัน แต่ไม่มีเป็น covariate ในส่วนนี้โดยไม่ขาดข้อมูลฉันได้รับแจ้งว่าวิธีนี้เทียบเท่ากับที่เป็นค่าคงที่แบบคงที่ (ฉันจะลองและค้นหาข้อมูลอ้างอิงบางอย่างสำหรับสิ่งนี้) Y2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)Y1Y1
58

1
@dandar คำสั่งนั้นไม่สมเหตุสมผลสำหรับฉัน โปรดทราบว่าเป็นค่าการรักษาล่วงหน้าของผลลัพธ์ไม่ใช่ตัวแปรที่ถูกจัดการในการทดสอบ คุณกำลังบอกว่าถ้าฉันมีค่าพื้นฐานของจากนั้นฉันทำการทดสอบแล้ววัดฉันควรทำแบบจำลองทั้งและเป็นฟังก์ชั่นของการแทรกแซงการทดลองหรือไม่ Y1Y1Y2Y1Y2
Andy W

1
แบบจำลองที่ฉันกำลังพูดถึงนั้นหมายถึงเป็นหน้าที่ของการรักษา แต่จากมุมมองที่ว่าถึงแม้จะมีการสุ่มตัวอย่างก็จะมีความแตกต่างกันเล็กน้อยระหว่างกลุ่มการรักษาและกลุ่มควบคุม ดังนั้นจะจับความแตกต่างนี้และผลของการรักษา การอ้างอิงสำหรับสิ่งนี้คือ ("การวิเคราะห์ข้อมูลระยะยาวของการตอบสนองอย่างต่อเนื่องและไม่ต่อเนื่องสำหรับการออกแบบก่อนโพสต์" โดย Zeger and Liang, 2000) Y1β1
dandar

1
การสนทนาที่ชัดเจนของบทความนี้สามารถพบได้ใน (“ ควรพื้นฐานเป็นตัวแปรร่วมหรือตัวแปรตามในการวิเคราะห์การเปลี่ยนแปลงจากพื้นฐานในการทดลองทางคลินิก?” โดย Liu, Mogg, Mallick และ Mehrotra 2009) พวกเขาอ้างถึงโมเดลนี้ว่าเป็นโมเดลที่ไม่มีเงื่อนไข (นั่นคือมันไม่ได้มีเงื่อนไขในการตอบสนองพื้นฐาน) ในกระดาษ Liu (2009) พวกเขาอภิปรายผลลัพธ์หลักของบทความ Zeger (2000) สิ่งเหล่านี้เป็นครั้งแรกที่ไม่มีข้อมูลที่ขาดหายไปการประเมินจุดจากแบบจำลองที่ไม่มีเงื่อนไขเหมือนกันกับวิธีการที่มีเงื่อนไขของ ANCOVA โดยใช้ post-baselineB1
dandar

1
การวัดเป็นการตอบสนองและการปรับค่าพื้นฐานที่คงที่และอย่างที่สองที่การประมาณค่าความแปรปรวนจากแบบจำลอง ANCOVA นั้นมากกว่าหรือเท่ากับค่าเสมอจากค่าที่ไม่มีเงื่อนไข ปรากฎว่าความแตกต่างความแปรปรวนนี้มักจะมีขนาดเล็กเนื่องจากการสุ่มตรวจสอบให้แน่ใจว่าการตอบสนองพื้นฐานระหว่างกลุ่มมีขนาดเล็ก ผู้เขียนสรุปแบบจำลองที่ไม่มีเงื่อนไขมีความเหมาะสมสำหรับการสร้างแบบจำลองพื้นฐานเป็นตัวแปรสุ่ม แต่ ANCOVA ตามความเหมาะสมเมื่อดูเป็นแบบคงที่
dandar

21

คำตอบของ Andy ดูเหมือนจะเป็นมุมมองของนักเศรษฐศาสตร์ในเรื่องต่างๆ เป็นที่ยอมรับในทางปฏิบัติในการทดลองทางคลินิกเพื่อปรับเกือบทุกครั้งสำหรับเวอร์ชั่นพื้นฐานของตัวแปรตอบสนองเพื่อเพิ่มพลังงานอย่างมาก เนื่องจากเรามีเงื่อนไขกับตัวแปรพื้นฐานจึงไม่มี 'ข้อผิดพลาด' สำหรับพวกเขาที่จะสับสนกับคำที่ผิดพลาดโดยรวม ปัญหาเดียวก็คือถ้าความผิดพลาดในการวัดใน baseline covariate นั้นสับสนกับ X ตัวอื่นทำให้บิดเบือนผลกระทบของ X ตัวอื่น วิธีที่ต้องการโดยรวมคือการปรับสำหรับพื้นฐานและเพื่อจำลองตัวแปรการตอบสนองไม่ใช่การคำนวณการเปลี่ยนแปลง เหตุผลหนึ่งสำหรับเรื่องนี้คือการเปลี่ยนแปลงนั้นขึ้นอยู่กับการเปลี่ยนแปลงของ Y ให้ถูกต้องและการเปลี่ยนแปลงนั้นไม่ได้ใช้กับแบบจำลองการถดถอยโดยทั่วไป เช่นถ้า Y เป็นเลขลำดับความแตกต่างระหว่างตัวแปรอันดับสองไม่ได้เป็นลำดับ


1
ฉันไม่เข้าใจคำตอบนี้อย่างเต็มที่ คุณหมายถึงอะไรด้วย "ปรับสำหรับพื้นฐาน"? รับความแตกต่างหรือควบคุมมันได้หรือไม่
Henrik

3
โดย 'ปรับค่าพื้นฐาน' ฉันหมายถึงการรวมค่าพื้นฐานเป็น covariate นอกจากนี้ยังเป็นเรื่องธรรมดาที่จะใช้คะแนนการเปลี่ยนแปลง แต่คุณไม่สามารถใช้คะแนนการเปลี่ยนแปลงเหล่านั้นได้โดยไม่ต้องปรับค่าพื้นฐานเป็นค่า covariate
Frank Harrell

6
จริงๆแล้วไม่มีอะไรที่คุณพูดที่นี่ (หรือเพื่อตอบสนองต่อความคิดเห็นของเฟลิกซ์) ขัดแย้งโดยตรงกับสิ่งที่ฉันพูด การใช้คะแนนการเปลี่ยนแปลงไม่ได้ 'ปรับสำหรับพื้นฐาน' มันควบคุมสำหรับตัวแปร ommitted ที่เปลี่ยนแปลงตลอดเวลา (หรือถ้าการเลือกในการรักษามีความสัมพันธ์อย่างมากกับพื้นฐาน) หากพื้นฐานไม่สามารถเพิกเฉยได้ (เช่นมีผลโดยตรงกับผลลัพธ์หรือมีการโต้ตอบกับการรักษา) คะแนนการเปลี่ยนแปลงไม่สามารถแก้ปัญหาได้
Andy W

2
@ Frank Harrell ขอบคุณที่เข้าร่วมการสนทนาและชี้แจงสิ่งนี้ (+1)
Henrik

8

เราสามารถปรับเปลี่ยนเหตุผลของ @ ocram เล็กน้อยเพื่อให้มี start

E[w1w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

ดังนั้นถ้านี่คือโมเดลที่ถูกต้องการบอกว่าความแตกต่างขึ้นอยู่กับน้ำหนักหมายความว่าค่าสุดท้ายนั้นขึ้นอยู่กับค่าเริ่มต้นด้วยสัมประสิทธิ์ที่อาจเป็นอะไรก็ได้ เล่นการถดถอยของความแตกต่างในที่และหรือน้ำหนักท้ายกับตัวแปรเดียวกันควรให้ค่าสัมประสิทธิ์เดียวกันในทุกอย่าง แต่w_0แต่ถ้าโมเดลนี้ไม่ถูกต้องการถดถอยเหล่านี้จะให้ผลลัพธ์ที่แตกต่างกับสัมประสิทธิ์อื่นเช่นกันxw0w0

โปรดทราบว่าการตั้งค่านี้ก็หมายความว่าน้ำหนักเริ่มต้นคาดการณ์ความแตกต่างในน้ำหนักไม่ได้ผลกระทบของการรักษา สิ่งนี้จะต้องมีคำที่ใช้ในการโต้ตอบบางที

E[w1w0X,w0]=β0+(xw0)β+w0γ.

อีกวิธีคือการคำนวณ ที่นี่คืออัตราการเติบโตของน้ำหนัก นี่อาจเป็นผลลัพธ์ของคุณ สัมประสิทธิ์ของคุณในจะบอกคุณว่าตัวทำนายเหล่านี้เกี่ยวข้องกับการเปลี่ยนแปลงสัดส่วนของน้ำหนักอย่างไร "การควบคุมสำหรับ" น้ำหนักเริ่มต้นโดยบอกว่าตัวอย่างเช่นระบอบการออกกำลังกายที่ลดน้ำหนักลง 10% (สัมประสิทธิ์ 0.1 คูณ 100%) สำหรับผู้ที่น้ำหนัก 130 ปอนด์ลดน้ำหนัก 13 ปอนด์ในขณะที่โปรแกรมลดน้ำหนักลง น้ำหนักของผู้เข้าร่วม 200 ปอนด์ 20 ปอนด์ ในกรณีนี้คุณอาจไม่จำเป็นต้องรวมน้ำหนักเริ่มต้น (หรือบันทึก) ไว้ทางด้านขวามือ

log(w1)log(w0)r;
rx

คำศัพท์ที่ใช้ในการโต้ตอบอาจยังจำเป็นถ้าคุณเชื่อว่าผลกระทบของโปรแกรมขึ้นอยู่กับน้ำหนักเริ่มต้น หากคุณใช้ในเงื่อนไขการโต้ตอบโปรแกรมจะเชื่อมโยงกับการเปลี่ยนแปลงในอัตราการเติบโตของน้ำหนัก ปอนด์ที่หนักกว่าทุกคนที่อยู่ในช่วงเริ่มต้นของโปรแกรมจะนำไปสู่เพิ่มขึ้นในการเปลี่ยนแปลงของอัตราการเติบโต (นี่คืออนุพันธ์ข้ามส่วนของค่าคาดหวังที่เกี่ยวข้องกับการรักษาและน้ำหนักเริ่มต้น)w0w0β1β1

หากคุณใช้ในเงื่อนไขการโต้ตอบผลกระทบของโปรแกรมจะเพิ่มขึ้นโดยสำหรับปอนด์เพิ่มเติมแต่ละครั้งที่ผู้เข้าร่วมอยู่ในช่วงเริ่มต้นของโปรแกรมlog(w0)β1/w0

อย่างที่คุณเห็นว่า cross-partials บนเงื่อนไขการโต้ตอบอาจกลายเป็นเรื่องยากที่จะตีความ แต่พวกเขาอาจได้รับผลกระทบที่คุณสนใจ


สวัสดีชาร์ลีฉันเห็นข้อดีของการใช้การเปลี่ยนแปลงสัดส่วน แต่ทำไมคุณถึงพบความแตกต่างในตัวแปรที่บันทึกไว้ซึ่งแตกต่างจากเพียงแค่หาร w1 กับ w0
ChrisStata

ฉันชอบความคิดเรื่องการเปลี่ยนแปลงสัดส่วน คำถามจะยังคงอยู่หากการโต้ตอบที่คาดหวังมีสัดส่วนอย่างแท้จริง ถ้าไม่คุณจะยังคงต้องรวมน้ำหนักเริ่มต้นเป็น covariate หรือคุณจะแน่ใจว่ามันเป็นเรื่องยากเหมือนกันที่จะลดน้ำหนัก 10% ของน้ำหนัก 100 หรือ 200 ปอนด์?
Henrik

@ChrisStata คุณก็ทำได้เช่นกัน ฉันเป็นนักเศรษฐศาสตร์และเรารักบันทึกของเรา (และความแตกต่างด้วย) หากคุณมีอนุกรมเวลา (เช่นการสังเกตหลายครั้ง) สำหรับแต่ละคน (สร้างชุดข้อมูลแบบพาเนล) ฉันสามารถยืนยันว่าวิธีของฉันดีกว่า แต่ก็ไม่เกี่ยวข้องกันที่นี่ เฮนริกคุณพูดถูก ฉันเพิ่มเรื่องเล็กน้อยลงในคำตอบของฉัน
Charlie

8

แก้ไข: อาร์กิวเมนต์ของ Andy W โน้มน้าวให้ฉันวาง Model C ฉันเพิ่มความเป็นไปได้อีกอย่าง: วิเคราะห์การเปลี่ยนแปลงด้วยสัมประสิทธิ์แบบสุ่ม (aka Multilevel Models หรือ Mixed Effect Models

มีการถกเถียงทางวิทยาศาสตร์มากมายเกี่ยวกับการใช้คะแนนแตกต่างกัน ข้อความที่ฉันชอบคือ Rogosa (1982, [1]) และ Fitzmaurice, Laird, & Ware (2004, [2])

โดยทั่วไปคุณมีความเป็นไปได้สามทางในการวิเคราะห์ข้อมูลของคุณ:

  • A) ใช้คะแนนความแตกต่างระหว่างบุคคลเท่านั้น (คะแนนการเปลี่ยนแปลง)
  • B) ปฏิบัติต่อการวัดแบบโพสต์ในรูปแบบ DV และควบคุมเป็นค่าพื้นฐาน
  • C) จดคะแนนความแตกต่างในรูปแบบ DV และควบคุมเป็นพื้นฐาน (นั่นคือแบบจำลองที่คุณแนะนำ) เนื่องจากข้อโต้แย้งของ Andy W ฉันจึงเลือกตัวเลือกนี้
  • D) ใช้วิธีการหลายระดับ / ผสมผลกระทบรูปแบบที่สายการถดถอยจะถูกสร้างแบบจำลองสำหรับผู้เข้าร่วมแต่ละคนและผู้เข้าร่วมจะถือว่าเป็นหน่วยระดับ 2

แบบจำลอง A และ B สามารถให้ผลลัพธ์ที่แตกต่างกันมากถ้าพื้นฐานมีความสัมพันธ์กับคะแนนการเปลี่ยนแปลง (เช่นคนที่น้ำหนักมากมีการลดน้ำหนักมากขึ้น) และ / หรือการกำหนดการรักษามีความสัมพันธ์กับพื้นฐาน

หากคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับปัญหาเหล่านี้ให้ดูเอกสารที่อ้างถึงหรือที่นี่และที่นี่

นอกจากนี้ยังมีการศึกษาแบบจำลองเมื่อไม่นานมานี้ [3] ซึ่งเปรียบเทียบเงื่อนไขที่ A หรือ B เป็นที่ต้องการ

สำหรับการออกแบบที่สมดุลอย่างสมบูรณ์โดยไม่มีค่าที่หายไปรุ่น D ควรเทียบเท่ากับรุ่น A อย่างไรก็ตามจะให้ข้อมูลเพิ่มเติมเกี่ยวกับความแปรปรวนระหว่างบุคคลของคุณและขยายไปยังจุดตรวจวัดได้ง่ายขึ้นและมีคุณสมบัติที่ดีเมื่อมีข้อมูลที่ไม่สมดุล และ / หรือค่าที่หายไป

ในฐานะที่เป็นบรรทัดล่าง: ในกรณีของคุณฉันจะวิเคราะห์โพสต์ - มาตรการควบคุมสำหรับพื้นฐาน (รุ่น B)

[1] Rogosa, D. , Brandt, D. , & Zimowski, M. (1982) แนวทางการเจริญเติบโตของการวัดการเปลี่ยนแปลง กระดานข่าวทางจิตวิทยา, 92, 726-748

[2] Fitzmaurice, GM, Laird, NM, & Ware, JH (2004) การวิเคราะห์ตามยาวประยุกต์ โฮโบเก้นนิวเจอร์ซีย์: ไวลีย์

[3] Petscher, Y. & Schatschneider, C. , 2011 การศึกษาแบบจำลองเกี่ยวกับประสิทธิภาพของความแตกต่างอย่างง่ายและความแปรปรวนร่วม ‐ คะแนนที่ปรับในการออกแบบการทดลองแบบสุ่ม วารสารการวัดการศึกษา, 48, 31-43


ฉันได้ลดคำตอบลงและคุณสามารถเห็นคำตอบของฉันว่าทำไมฉันจึงเชื่อว่าไม่ควรทำคะแนนการเปลี่ยนแปลงที่มีพื้นฐานเป็น covariate เพื่อสรุปผลแม้ว่ารุ่น B และ C ในสูตรของคุณจะให้ผลการรักษาที่เทียบเท่า แต่ก็ไม่ได้หมายความว่ารุ่น C นั้นจะเหมาะสมกว่า อันที่จริงแล้วผลกระทบพื้นฐานในโมเดล C นั้นไม่สามารถตีความได้ดังนั้นฉันจึงไม่ควรใช้
Andy W

@AndyW: ข้อโต้แย้งของคุณทำให้ฉันเชื่อมั่น แม้ว่าการประเมินผลการรักษาที่เกี่ยวข้องที่สุดจะเหมือนกันในทั้งสองโมเดล แต่ควรเลือกใช้โมเดล B มากกว่ารุ่น C ฉันปรับคำตอบของฉันให้เหมาะสม แต่คุณจะพูดอะไรกับLaird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330.ใครที่แสดงความเท่าเทียมกันของ B และ C?
เฟลิกซ์ S

ฉันไม่คิดว่าฉันจะพูดอะไรขัดแย้งกับบทความในดิน โดยพื้นฐานแล้วการพูดจาโผงผางทั้งหมดของฉันคือ (ในสัญกรณ์ของ Laird)นั้นไม่สามารถตีความได้ดังนั้นเหตุใดจึงต้องรายงาน (การเทียบเท่าไม่ได้มีปัญหา) เจ้าของที่ดินให้ความคิดเห็นอื่น ๆ เกี่ยวกับวิธีการที่ผล covariate พื้นฐานอาจตีความได้ว่าเป็นสมมติฐานว่าหากกลุ่มการรักษาของแต่ละบุคคลจะไม่เปลี่ยนแปลง (แม้ว่ายังคงมีความสำคัญของมัน) อย่าลังเลที่จะตอบโต้จุดของฉันกับสถานการณ์ที่มีประโยชน์ (แน่นอนที่สุดไม่มีประโยชน์ในวิธีปกติที่เราตีความสัมประสิทธิ์การถดถอย) b¯b¯
Andy W

จุดหนึ่งสำหรับโมเดล D. ฉันสงสัยว่าทำไมไม่พิจารณาเฉพาะรุ่น D มันเป็นค่าที่สอดคล้องกันมากที่สุด (ค่าพื้นฐานคือตัวแปรสุ่มและไม่ได้ถูกบังคับให้เป็นตัวแปรตาม) มันง่ายและยืดหยุ่นมาก (การโต้ตอบสามารถ ถูกเพิ่มเข้ามา) และส่งมอบส่วนเบี่ยงเบนมาตรฐานของประชากรด้วย
Giordano

3

ดู Josh Angrist ที่ว่าคำถามนี้: http://www.mostlyharmlesseconometrics.com/2009/10/adding-lagged-dependent-vars-to-differenced-models/ เขาลงมาต่อต้านอย่างมากรวมถึง DV ที่ล้าหลังในโมเดลของคุณ ไม่มีอะไรในคำตอบของเขาที่ไม่ได้อยู่ในคำตอบข้างต้น แต่คำตอบสั้น ๆ เพิ่มเติมสำหรับคำถามของคุณอาจช่วยได้


3

Glymour และคณะ (2005) แก้ไขโดยใช้การปรับพื้นฐานเมื่อวิเคราะห์คะแนนการเปลี่ยนแปลง หากการเปลี่ยนแปลงสถานะสุขภาพก่อนการประเมินพื้นฐานหรือมีข้อผิดพลาดในการวัดขนาดใหญ่ในตัวแปรตามพวกเขาพบว่าอคติสามารถเกิดขึ้นได้หากโมเดลการถดถอยโดยใช้คะแนนการเปลี่ยนแปลงเนื่องจากตัวแปรตามรวมถึงตัวแปรพื้นฐาน คำตอบของ Frank Harrell "ปัญหาเดียวก็คือหากเกิดข้อผิดพลาดในการวัดใน covariate พื้นฐานจะสับสนกับ X อีกตัวหนึ่งทำให้บิดเบือนผลกระทบของ X อื่น ๆ " อาจสะท้อนอคติเดียวกันกับที่อยู่ของ Glymour

Glymour (2005) "การปรับพื้นฐานมีประโยชน์ในการวิเคราะห์การเปลี่ยนแปลงเมื่อใดตัวอย่างกับการศึกษาและการเปลี่ยนแปลงทางปัญญา American Journal of ระบาดวิทยา 162: 267-278


1

Ocram ไม่ถูกต้อง ความแตกต่างของน้ำหนักไม่ได้คำนึงถึงน้ำหนักเริ่มต้น โดยเฉพาะน้ำหนักเริ่มต้นจะถูกนำออกมาโดยการลบน้ำหนักสุดท้ายออกจากมัน

ดังนั้นฉันจะยืนยันว่ามันไม่ได้ละเมิดสมมติฐานใด ๆ หากคุณควบคุมน้ำหนักเริ่มต้น

(ตรรกะเดียวกันนี้นำไปใช้หากคุณรับผลต่างของ BMI และ BMI เริ่มต้น)


อัปเดต
หลังจากนักวิจารณ์ของ Andy W ให้ฉันเป็นทางการมากขึ้นว่าทำไมฉันถึงพูดถูกและผิด Ocram (อย่างน้อยก็จากจุดของฉัน)

มีระดับน้ำหนักที่แน่นอนแต่ละคนมี (เช่นประมาณ 100 ปอนด์เมื่อเทียบกับ 200 ปอนด์) ให้เป็นน้ำหนัก absoulte นี้ จากนั้นน้ำหนักเริ่มต้นสามารถทำเป็นกรงเล็บเป็นและน้ำหนักสิ้นสุดเป็นaw
iw=awew=aw+Δw

dv the OP ต้องการใช้จึงΔw=iwew=awaw+Δw=Δw

กล่าวอีกนัยหนึ่งระดับน้ำหนักที่แท้จริง (ทำเป็นกรงเล็บเป็น ) ลดลงจากสมการที่เป็นตัวแทนของ dv และดังนั้นจึงไม่ปนเปื้อนมัน (ซึ่งไม่เห็นด้วยกับสิทธิของ Andy W)aw

หากคุณต้องการนำมาพิจารณาคุณต้องรวมไว้ในแบบจำลองของคุณแยกต่างหาก (เป็นพารามิเตอร์สามัญและ / หรือเป็นคำที่มีปฏิสัมพันธ์)

ตรรกะที่เหมือนกันอย่างชัดเจนนี้ใช้กับและสามารถปรับให้เข้ากับสัดส่วนที่ใคร ๆ จะพูดเช่น:อีW = W * P R o P Δ WΔBMJew=awpropΔw


เมื่อฉันบอกว่าความแตกต่างคำนึงถึงน้ำหนักเริ่มต้นนี่คือสิ่งที่ฉันตั้งใจจริง ทีนี้โดยเฉพาะคุณจะเขียนอะไร น้ำหนักสุดท้าย - น้ำหนักเริ่มต้น = ... ?
ocram

ในขณะที่ฉันเขียนข้อโต้แย้งของคุณดูเหมือนเท็จสำหรับฉัน ฉันจะยืนยันว่าในความเป็นจริงน้ำหนักสุดท้ายใช้น้ำหนักเริ่มต้นมากขึ้นเนื่องจากมันอยู่ใน "สเกล" เดียวกันในขณะที่ความแตกต่างคือ "rescaled" (เป็นน้ำหนักสิ้นสุดดังนั้นค่าสัมบูรณ์บางอย่างจะถูกลบออกจากค่าAbsoulte ที่ไม่เปลี่ยนแปลง
Henrik

(-1) สิ่งนี้ไม่ถูกต้อง โดยทั่วไปคุณไม่ควรรวมตัวแปรเดียวกันทั้งทางด้านขวาและด้านซ้ายมือของสมการ (เนื่องจากผลลัพธ์ในตัวแปรอิสระนั้นสัมพันธ์กับคำที่ผิดพลาด) ดังนั้นหากคุณใช้ความแตกต่างสำหรับตัวแปรตามคุณไม่ควรรวม baseline เป็น covariate
Andy W

@Andy W: ฉันรู้ว่าการโต้แย้งของคุณถูกต้อง แต่ข้อโต้แย้งของฉันคือคุณสามารถแยกส่วนค่าสัมบูรณ์ออกมาได้ (โดยการลบค่าจุดสิ้นสุดที่มีค่าพื้นฐาน) ซึ่งจะเป็นการขจัดความสัมพันธ์นี้ ดังนั้นการเพิ่มเป็นโควาริเอทจึงไม่ก่อให้เกิดความสัมพันธ์แบบผิดพลาดปลอม
Henrik

@Henrik ดูคำตอบของฉันสำหรับคำถามนี้และทำไมฉันยังเชื่อว่าความเชื่อมั่นนี้เข้าใจผิด
Andy W

0

สังเกตว่า

end weightinitial weightY=β0+βTx

เทียบเท่ากับ

end weight=initial weight+β0+βTx

ในคำพูดใช้การเปลี่ยนแปลงน้ำหนัก (แทนน้ำหนักสิ้นสุดเอง) เป็น DV แล้วบัญชีสำหรับน้ำหนักเริ่มต้น


1
แต่ฉันคิดว่าอาจมีปฏิสัมพันธ์ระหว่างน้ำหนักเริ่มต้นและการลดน้ำหนักที่ได้รับจากการฝึกอบรม สมมติว่าผู้ใหญ่ที่มีความสูง 1,90 ม. และมวลกาย 70 กก. และผู้ใหญ่ที่มีความสูง 1,60 ม. และมวลร่างกาย 90 กก. มีส่วนร่วมในการฝึกซ้อมแบบเดียวกัน ฉันพนันได้เลยว่าหลังสูญเสียน้ำหนักมากขึ้น ในความคิดที่สอง: ดัชนีมวลกายอาจเป็น CV ที่ดีกว่าแค่น้ำหนัก
xmjx

1
@xmjx: หากคุณคิดว่าน้ำหนักเริ่มต้นจะส่งผลกระทบต่อน้ำหนักสุดท้าย - และคุณอาจถูกต้อง - มันเป็นความคิดที่ดีที่จะแนะนำมันเป็นออฟเซ็ตในรูปแบบตามที่ทำที่นี่ ...
ocram

3
ไม่ถูกต้องโดยทั่วไป หากความชันของน้ำหนักพื้นฐานไม่ใช่ 1.0 การวิเคราะห์การเปลี่ยนแปลงจะไม่เทียบเท่ากับการวิเคราะห์น้ำหนักขั้นสุดท้ายเว้นแต่ว่าน้ำหนักเริ่มต้นอยู่ในทั้งสองโมเดลและคุณกำลังใช้การถดถอยแบบปกติ หากน้ำหนักพื้นฐานอยู่ในสองสถานที่แบบจำลองจะอธิบายได้ยากกว่าดังนั้นเหตุผลในการคงอยู่ของวิธีนี้จึงไม่ชัดเจน
Frank Harrell
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.