การมอบหมายแบบสุ่ม: ทำไมต้องกังวล


9

การมอบหมายแบบสุ่มมีค่าเพราะช่วยให้มั่นใจได้ถึงความเป็นอิสระในการรักษาจากผลลัพธ์ที่อาจเกิดขึ้น นั่นคือวิธีที่จะนำไปสู่การประมาณการแบบไม่เอนเอียงของผลการรักษาโดยเฉลี่ย แต่รูปแบบการมอบหมายอื่น ๆ สามารถมั่นใจได้อย่างเป็นระบบในการรักษาจากผลลัพธ์ที่เป็นไปได้อย่างเป็นระบบ แล้วทำไมเราต้องสุ่มมอบหมาย? กล่าวอีกนัยหนึ่งอะไรคือข้อดีของการมอบหมายแบบสุ่มเหนือแผนการมอบหมายที่ไม่ใช่การสุ่มที่นำไปสู่การอนุมานที่ไม่เอนเอียง?

ให้เป็นเวกเตอร์ของการกำหนดการรักษาซึ่งแต่ละองค์ประกอบคือ 0 (หน่วยที่ไม่ได้รับมอบหมายให้ทำการรักษา) หรือ 1 (หน่วยที่กำหนดให้การรักษา) ในบทความ JASA, Angrist, Imbens และ Rubin (1996, 446-47)บอกว่าการมอบหมายการรักษานั้นเป็นการสุ่มถ้าสำหรับ\ mathbf {c}และ\ mathbf {c'} ทุกอย่างที่\ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '}โดยที่\ iotaเป็น เวกเตอร์คอลัมน์ที่มีองค์ประกอบทั้งหมดเท่ากับ 1ZZiPr(Z=c)=Pr(Z=c)ccιTc=ιTcι

ในคำเรียกร้องคือการที่ได้รับมอบหมายZiเป็นแบบสุ่มถ้าเวกเตอร์ใด ๆ ของการมอบหมายงานที่มีmได้รับมอบหมายการรักษาเป็นที่น่าจะเป็นเวกเตอร์อื่น ๆ ที่รวมถึงmได้รับมอบหมายการรักษา

แต่เพื่อให้มั่นใจถึงความเป็นอิสระของผลลัพธ์ที่เป็นไปได้จากการมอบหมายการรักษามันก็เพียงพอแล้วเพื่อให้แน่ใจว่าแต่ละหน่วยในการศึกษามีความน่าจะเป็นที่เท่าเทียมกันในการได้รับมอบหมายให้รักษา และนั่นสามารถเกิดขึ้นได้อย่างง่ายดายแม้ว่าเวกเตอร์ที่ได้รับมอบหมายการรักษาส่วนใหญ่มีความน่าจะเป็นที่จะถูกเลือกเป็นศูนย์ นั่นคือมันสามารถเกิดขึ้นได้แม้ภายใต้การมอบหมายแบบไม่สุ่ม

นี่คือตัวอย่าง เราต้องการเรียกใช้การทดสอบโดยมีสี่หน่วยซึ่งได้รับการปฏิบัติสองอย่างแน่นอน มีหกเวกเตอร์ที่มอบหมายที่เป็นไปได้:

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

โดยที่ตัวเลขตัวแรกในแต่ละหมายเลขระบุว่าหน่วยแรกได้รับการปฏิบัติหรือไม่ตัวเลขตัวที่สองระบุว่าหน่วยที่สองนั้นได้รับการปฏิบัติเป็นต้น

สมมติว่าเราดำเนินการทดสอบที่เราไม่รวมความเป็นไปได้ของเวกเตอร์ที่มอบหมาย 3 และ 4 แต่ในแต่ละเวกเตอร์อื่น ๆ มีโอกาสที่จะถูกเลือกเท่ากัน (25%) แบบแผนนี้ไม่ใช่การสุ่มแบบสุ่มในความหมายของ AIR แต่ในความคาดหมายมันนำไปสู่การประเมินผลการรักษาโดยเฉลี่ยที่ไม่เอนเอียง และนั่นไม่ใช่อุบัติเหตุ รูปแบบการมอบหมายใด ๆ ที่ให้ความน่าจะเป็นเท่ากันของการมอบหมายต่อการรักษาจะอนุญาตให้การประเมิน ATE แบบไม่เอนเอียง

ดังนั้น: ทำไมเราต้องสุ่มมอบหมายในความหมายของ AIR? ข้อโต้แย้งของฉันมีรากฐานมาจากการอนุมานแบบสุ่ม ถ้ามีใครคิดแทนในแง่ของการอนุมานตามโมเดลนิยามของ AIR ดูเหมือนจะป้องกันได้มากกว่านี้หรือไม่?


3
ฉันไม่ได้อ่าน Angrist et al. ดังนั้นบางทีฉันอาจจะพลาดบางสิ่งบางอย่าง แต่ฉันมีคำพูดหยาบคายกับคำพูดของคุณ เราไม่ใช้การมอบหมายแบบสุ่มเพื่อประกันว่าการรักษาจะไม่ขึ้นอยู่กับผลลัพธ์ที่เป็นไปได้ การรักษาไม่ว่าจะเป็นอิสระจากผลลัพธ์ในการทดลองจริงหรือไม่นั้นขึ้นอยู่กับว่ามีการเชื่อมต่อสาเหตุโดยตรงหรือไม่การรักษาและผลลัพธ์ แต่ที่ได้รับมอบหมายสุ่มมั่นใจได้ว่าการรักษาเป็นอิสระจากที่ซุ่มซ่อนตัวแปร (หรือตัวแปรที่มีศักยภาพ) เป็นไปได้ว่าผลลัพธ์นั้นเกิดจากสิ่งอื่นนอกเหนือจากการรักษาที่เราหวังว่าจะแยกออก
gung - Reinstate Monica

1
@ gung ฉันคิดว่าคุณกำลังพูดถึง "ผลลัพธ์ที่เป็นไปได้" และ "ผลลัพธ์" เป็นความจริงที่การมอบหมายแบบสุ่มไม่รับประกันความเป็นอิสระในการรักษาจากผลลัพธ์ (นั่นคือจากผลลัพธ์ที่สังเกต) แต่ผลลัพธ์ที่เป็นไปได้นั้นไม่เหมือนกับผลลัพธ์ที่สังเกตได้และการมอบหมายแบบสุ่มทำให้มั่นใจได้ถึงความเป็นอิสระในการรักษาจากผลลัพธ์ที่เป็นไปได้ ฉันจะไม่แก้ไขโพสต์ต้นฉบับเพื่อขยายในจุดนี้ การทำเช่นนั้นจะพาฉันไปไกลจากหัวข้อหลัก แต่en.wikipedia.org/wiki/Rubin_causal_modelอาจมีประโยชน์ในประเด็นนี้
user697473

3
"[T] o ให้ความมั่นใจในความเป็นอิสระของผลลัพธ์ที่เป็นไปได้จากการกำหนดการรักษามันก็เพียงพอแล้วเพื่อให้แน่ใจว่าแต่ละหน่วยในการศึกษามีความน่าจะเป็นเท่ากับการมอบหมายให้รักษา" สิ่งนี้ไม่ถูกต้อง สมมติว่าคุณได้ลงทะเบียนเพศชายและเพศหญิงในการศึกษา พลิกเหรียญที่ยุติธรรม: ถ้าหัวให้ผู้หญิงทุกคนเข้ากลุ่มการรักษา (และผู้ชายทุกคนในกลุ่มควบคุม); ถ้าหางตัวผู้ทั้งหมดจะอยู่ในกลุ่มการรักษาและตัวเมียทั้งหมดในกลุ่มควบคุม แต่ละวิชา (ชัด) มีโอกาส 50% ที่จะมอบหมายให้กลุ่มรักษา - แต่การรักษานั้นสับสนกับเพศอย่างสมบูรณ์ xx
whuber

1
@whuber ความคิดเห็นของคุณไม่ถูกต้อง เพื่อดูว่าทำไมสมมติว่า = 1 ผลลัพธ์ที่เป็นไปได้ของผู้ชายคือ Y (1) = 1 และ Y (0) = 0 (นั่นคือ = 1 ถ้าผู้ชายได้รับการรักษา 0 ถ้าไม่ใช่) สำหรับผู้หญิง ผลลัพธ์ที่เป็นไปได้คือ Y (1) = -1 และ Y (0) = 2 (ผลลัพธ์ที่เป็นไปได้โดยเฉพาะนั้นไม่สำคัญมากนัก แต่จำนวนเต็มเล็กน้อยทำให้เรื่องง่าย) จากนั้น E [Y (1) | Z] = E [Y (1)] = 0 มีค่าเท่ากันสำหรับ E [Y (0)] โดยทั่วไปกลไกการมอบหมายของคุณไม่ได้สับสนกับเพศและจะสร้างการประมาณ ATE ที่ไม่เอนเอียง หากฉันเข้าใจผิดบางสิ่งโปรดแจ้งให้เราทราบ xYm
697473

3
แน่นอนว่าค่าประมาณนั้น "ไม่เอนเอียง" ในแง่เดียวกับที่นาฬิกาหยุดให้เวลาโดยประมาณที่เป็นกลาง! ที่จริงแล้วมันแย่กว่านั้น: วิธีการเลือกแบบสุ่มนี้ให้ผลลัพธ์ที่ไม่สามารถนำมาประกอบกับการรักษาเพราะพวกเขาสามารถนำมาประกอบกับเพศ นั่นคือสิ่งที่หมายถึงการรบกวน มุ่งเน้นไปที่การได้รับผลลัพธ์ที่เป็นกลางในขณะที่ทำลายข้อมูลที่เป็นประโยชน์ทั้งหมดในการทดลองคือการโยนสุภาษิตออกไปจากลูก ...
whuber

คำตอบ:


8

นี้ติดตามความคิดเห็นของ gung ผลการรักษาโดยรวมโดยรวมไม่ได้เป็นจุด

สมมติว่าคุณมีผู้ป่วยโรคเบาหวานใหม่รายที่มีอายุระหว่างถึงปีและผู้ป่วยโรคเบาหวานใหม่รายที่มีอายุมากกว่าปี คุณต้องการมอบหมายครึ่งหนึ่งให้กับการรักษา ทำไมไม่พลิกเหรียญและบนหัวรักษาผู้ป่วยเด็กทั้งหมดและที่หางรักษาผู้ป่วยสูงอายุทั้งหมด แต่ละคนจะมี100051510003050%โอกาสที่จะได้รับการรักษาอย่างเหมาะสมดังนั้นมันจะไม่ทำให้อคติกับผลลัพธ์ของการรักษาโดยเฉลี่ย แต่มันจะทิ้งข้อมูลจำนวนมาก มันจะไม่น่าแปลกใจถ้าผู้ป่วยเบาหวานหรือผู้ป่วยอายุน้อยหันไปตอบสนองดีขึ้นหรือแย่ลงกว่าผู้ป่วยสูงอายุที่มีโรคเบาหวานชนิดที่ 2 หรือขณะตั้งครรภ์ ผลการรักษาที่สังเกตได้อาจไม่เอนเอียง แต่ตัวอย่างเช่นมันจะมีค่าเบี่ยงเบนมาตรฐานที่มากกว่าที่จะเกิดขึ้นจากการสุ่มมอบหมายและแม้ว่าตัวอย่างขนาดใหญ่คุณจะไม่สามารถพูดได้มากนัก หากคุณใช้การบ้านแบบสุ่มดังนั้นความน่าจะเป็นสูงประมาณรายในแต่ละกลุ่มอายุจะได้รับการรักษาดังนั้นคุณจะสามารถเปรียบเทียบการรักษากับการรักษาที่ไม่มีในแต่ละกลุ่มอายุ 500

คุณอาจทำได้ดีกว่าใช้การมอบหมายแบบสุ่ม หากคุณสังเกตเห็นปัจจัยที่คุณคิดว่าอาจส่งผลต่อการตอบสนองต่อการรักษาคุณอาจต้องการตรวจสอบให้แน่ใจว่าอาสาสมัครที่มีคุณสมบัตินั้นแยกกันมากกว่าที่จะเกิดขึ้นผ่านการมอบหมายแบบสุ่ม การมอบหมายแบบสุ่มช่วยให้คุณทำได้ดีพอสมควรพร้อมปัจจัยทั้งหมดพร้อมกันเพื่อให้คุณสามารถวิเคราะห์รูปแบบที่เป็นไปได้มากมายหลังจากนั้น


ขอบคุณดักลาส คำตอบนี้สมเหตุสมผลสำหรับฉัน สำหรับบันทึกฉันไม่ได้คิดอะไรมากเท่าตัวอย่างหรือ @ ตัวอย่างของ whuber ฉันกำลังคิดแทนที่จะเป็นกรณีที่เราจะกำจัดการพิจารณาเพียงไม่กี่เวกเตอร์การรักษา (พิจารณากรณีที่ลูกค้าพูดว่า "คุณสามารถปฏิบัติต่อบุคคลนี้หรือคนนั้น แต่ไม่ใช่ทั้งคู่") แต่ฉันคิดว่าประเด็นทั่วไปของคุณถือได้แม้ในกรณีที่รุนแรงกว่าที่ฉันมีอยู่ในใจ
user697473

ฉันคิดว่าถ้าคุณกำจัดเวกเตอร์เพียงไม่กี่ตัวคุณก็จะไม่เปลี่ยนจำนวนข้อมูลที่คุณสามารถแยกได้มาก การหาปริมาณอย่างแม่นยำอาจยุ่ง - มีขอบเขตไร้เดียงสาซึ่งอาจมองในแง่ร้ายเกินไป
Douglas Zare

@DouglasZare ฉันมีคำถามเกี่ยวกับตัวอย่างสุดขีดของคุณ ฉันเชื่อว่าเป้าหมายคือการค้นหาว่าการรักษานั้นมีประสิทธิภาพสำหรับประชากรที่มีผู้ป่วยทั้งเด็กและผู้ใหญ่หรือไม่ จากนั้นวิธีการของคุณจะสร้างสองตัวอย่างที่ไม่สามารถถือเป็นตัวอย่างตัวแทนจากการกระจายผลลัพธ์ที่เป็นไปได้ที่ทุกคนเข้ารับการรักษาและการกระจายผลลัพธ์ที่เป็นไปได้ซึ่งทุกคนควบคุม ดังนั้นผลการรักษาที่คุณสังเกตเห็นนั้นมีอคติFtFc
KevinKim

1

ในตัวอย่างของคุณคุณสามารถปล่อยให้ 2 และ 5 ออกมาได้และไม่ขัดแย้งกับตัวเอง ที่ระดับไอเท็มยังคงมีโอกาสเท่ากับ 1 หรือ 0 เมื่อมีโอกาสเพียง 1: 1 ในการเลือก 1 หรือ 6 แต่ตอนนี้สิ่งที่คุณทำโดยการลบ 3 และ 4 ชัดเจนมากขึ้น


ขอบคุณจอห์น ใช่คุณถูกต้อง. ดูเหมือนว่าเราสามารถกำจัดเวกเตอร์ที่ได้รับมอบหมายการรักษาได้มากเท่าที่เราต้องการในการผสมใด ๆ ตราบใดที่เราใช้เวกเตอร์ที่เหลือในวิธีที่ให้แต่ละหน่วยความน่าจะเป็นเท่ากับการมอบหมายการรักษา
697473

ฉันไม่คิดว่าคุณจะได้สิ่งที่ฉันพูด สิ่งที่ฉันได้นำเสนอคือกรณีที่โฆษณาไร้สาระสำหรับการโต้แย้งของคุณที่โต้แย้งกับมัน
จอห์น

ตัวอย่างของคุณรุนแรงมาก แต่ฉันไม่เห็นอะไรที่ไร้สาระเกี่ยวกับเรื่องนี้ เป็นการสาธิตที่ถูกต้องของจุด: แผนการมอบหมาย nonrandom (เช่นการใช้เวกเตอร์เพียง 1 และ 6) สามารถนำไปสู่การประมาณค่าที่เป็นกลางโดยอิสระจากผลการรักษาโดยเฉลี่ย ตามมาว่าเราไม่จำเป็นต้องสุ่มมอบหมายให้ได้รับการประเมิน ATE ที่เป็นกลาง แน่นอนว่าอาจมีสาเหตุที่ทำให้การกำจัดเวกเตอร์ 2 ถึง 5 (ดูความคิดเห็นของดักลาสแซร์ด้านบน ) ฉันยังไม่ได้คิดถึงเหตุผลเหล่านี้
697473

คุณควร. นั่นเป็นเหตุผลที่คุณไม่สามารถกำจัดพวกเขาได้
จอห์น

1

นี่คืออีกหนึ่งในตัวแปรที่ซุ่มซ่อนหรือรบกวน: เวลา (หรือดริฟท์แบบใช้เครื่องมือ, เอฟเฟกต์ของการจัดเก็บตัวอย่าง ฯลฯ )
ดังนั้นจึงมีข้อโต้แย้งกับการสุ่ม (ตามที่ดักลาสพูดว่า: คุณอาจทำได้ดีกว่าการสุ่ม) เช่นคุณสามารถทราบล่วงหน้าว่าคุณต้องการให้คดีของคุณมีความสมดุลตลอดเวลา อย่างที่คุณสามารถทราบล่วงหน้าว่าคุณต้องการมีเพศและอายุที่สมดุล

กล่าวอีกนัยหนึ่งถ้าคุณต้องการเลือกหนึ่งใน 6 รูปแบบด้วยตนเองฉันจะบอกว่า 1100 (หรือ 0011) เป็นตัวเลือกที่ไม่ดีอย่างแน่นอน โปรดทราบว่าสิ่งของที่คุณโยนออกมาครั้งแรกนั้นเป็นของที่มีความสมดุลมากที่สุดในเวลา ... และสิ่งที่แย่ที่สุดที่เหลืออยู่หลังจากจอห์นเสนอให้กำจัด 2 และ 5 (ซึ่งคุณไม่ได้ประท้วง)
กล่าวอีกนัยหนึ่งสัญชาตญาณของคุณซึ่งเป็นแบบ "น่ารัก" โชคไม่ดีที่นำไปสู่การออกแบบการทดลองที่ไม่ดี (IMHO นี่เป็นเรื่องธรรมดาอาจจะสั่งสิ่งที่ดูดีกว่า - และแน่นอนว่ามันง่ายกว่าในการติดตามลำดับตรรกะในระหว่างการทดสอบ)

คุณอาจทำได้ดีกว่าด้วยแผนการที่ไม่ได้สุ่ม แต่คุณก็สามารถทำได้แย่กว่านั้นอีกมาก IMHO คุณควรจะสามารถให้ข้อโต้แย้งทางกายภาพ / เคมี / ชีวภาพ / การแพทย์ / ... สำหรับรูปแบบที่ไม่สุ่มคุณใช้ถ้าคุณไปสำหรับรูปแบบที่ไม่สุ่ม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.