ความแตกต่างระหว่างการควบคุมและการรักษาควรเป็นแบบอย่างชัดเจนหรือโดยปริยาย?


9

รับการตั้งค่าการทดลองต่อไปนี้:

ตัวอย่างจำนวนมากนำมาจากหัวเรื่องและแต่ละตัวอย่างได้รับการปฏิบัติหลายวิธี (รวมถึงการรักษาควบคุม) สิ่งที่น่าสนใจที่สุดคือความแตกต่างระหว่างการควบคุมและการรักษาแต่ละครั้ง

ฉันนึกถึงโมเดลง่าย ๆ สองแบบสำหรับข้อมูลนี้ ด้วยตัวอย่างรักษารักษา 0 ถูกควบคุมให้เป็นข้อมูลเป็นพื้นฐานสำหรับตัวอย่าง ,มีความแตกต่างในการรักษาญโมเดลแรกดูทั้งการควบคุมและความแตกต่าง:ijYijγiiδjj

Yij=γi+δj+ϵij
δ0=0

ในขณะที่รุ่นที่สองเท่านั้นที่ดูความแตกต่าง หากเราทำการล่วงหน้าล่วงหน้า ดังนั้น dij

dij=YijYi0
dij=δj+εij

คำถามของฉันคืออะไรความแตกต่างพื้นฐานระหว่างการตั้งค่าทั้งสองนี้คืออะไร โดยเฉพาะอย่างยิ่งหากระดับนั้นไร้ความหมายในตัวเองและมีเพียงความแตกต่างเท่านั้นที่เป็นโมเดลแรกที่ทำมากเกินไปและอาจต่ำกว่าความเป็นจริง?


2
ฉันสามารถให้คำตอบอย่างละเอียดมากขึ้นในภายหลัง แต่ฉันอยากจะแนะนำบทความนี้โดย Paul Allison น่าสนใจ ( Allison, 1990 )
Andy W

1
แก้ไขเพื่อสะท้อนถึงความจริงที่ว่าข้อผิดพลาดในแบบจำลองที่แตกต่างกันนั้นไม่เหมือนกันจริงและดังนั้นจึงไม่ควรใช้สัญลักษณ์เดียวกัน
Rónán Daly

คำตอบ:


6

มีแนวโน้มที่จะมีความสัมพันธ์ในรูปแบบที่สอง แต่ไม่ได้เป็นครั้งแรกϵij

ในข้อแรกคำเหล่านี้แสดงถึงข้อผิดพลาดในการวัดและการเบี่ยงเบนจากแบบจำลองการเติม ด้วยความระมัดระวังตามสมควร - เช่นโดยการสุ่มลำดับของการวัด - ข้อผิดพลาดเหล่านั้นสามารถทำให้เป็นอิสระได้เมื่อแบบจำลองนั้นถูกต้อง จากไหน

dij=YijYi0=γi+δj+ϵij(γi+δ0+ϵi0)=δj+(ϵijϵi0).

(โปรดทราบว่าสิ่งนี้ขัดแย้งกับสมการสุดท้ายในคำถามเพราะมันผิดที่จะสมมติว่าทำเช่นนั้นจะบังคับให้เรายอมรับว่าเป็นตัวแปรสุ่มมากกว่าพารามิเตอร์อย่างน้อยเมื่อเรายอมรับ ความเป็นไปได้ของข้อผิดพลาดในการวัดสำหรับการควบคุมซึ่งจะนำไปสู่ข้อสรุปเดียวกันด้านล่าง)ϵi0=0γi

สำหรับ ,นี่หมายถึงj,k0jk

Cov(dij,dik)=Cov(ϵijϵi0,ϵikϵi0)=Var(ϵi0)0.

ความสัมพันธ์สามารถเป็นกอบเป็นกำ สำหรับข้อผิดพลาดของ iid การคำนวณที่คล้ายกันแสดงว่ามันเท่ากับ 0.5 ยกเว้นว่าคุณกำลังใช้โพรซีเดอร์ที่จัดการความสัมพันธ์นี้อย่างชัดเจนและถูกต้องโปรดเลือกโมเดลแรกในช่วงที่สอง


ดังนั้นคุณจึงสันนิษฐานว่าโมเดลแรกเป็นโมเดลจริงและได้มาซึ่งคุณสมบัติที่ไม่พึงประสงค์ของโมเดลที่สอง เรารู้ว่าแบบจำลองทั้งหมดไม่ถูกต้องดังนั้นผลลัพธ์นี้มีความหมายจริงหรือไม่
มาโคร

1
@Macro โปรดอ่านคำตอบของฉันอย่างละเอียดมากขึ้น: มันถูกสร้างขึ้นมาเพื่อแสดงว่าจำเป็นต้องใช้สมมติฐานใดในการปรับรูปแบบแรกและแยกความแตกต่างจากรุ่นที่สอง แต่ไม่มีข้อสันนิษฐานว่าแบบจำลองใดเป็น "ของจริง" ตัวอย่างเช่นให้สังเกตคำเตือน "เมื่อแบบจำลองนั้นถูกต้อง" แม้แต่คำว่า "ถูกต้อง" ก็ถูกเลือกด้วยความคิดบางอย่างเพื่อหลีกเลี่ยงความเข้าใจผิดที่มีรูปแบบ "ของจริง" หรือ "ถูกต้อง"
whuber

1
ฉันสับสนเล็กน้อยคืออะไร dik
Andy W

1
@ Andyและ index สองการรักษาที่แตกต่างกัน ฉันควรเขียน "สำหรับ ... "; ฉันจะแก้ไขข้อผิดพลาดนั้น ขอบคุณสำหรับการจับมัน jkj,k0
whuber

@whuber มีการอ้างอิงใดบ้างที่สนับสนุนข้อความของคุณเช่นเพื่อโน้มน้าวผู้ตรวจสอบ?
แดเนียล
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.