เกิดอะไรขึ้นกับการสุ่มหลอก (บางคน)


23

ฉันเจอการศึกษาที่ผู้ป่วยซึ่งอายุมากกว่า 50 ปีถูกสุ่มหลอกโดยปีเกิด ถ้าปีเกิดเป็นเลขคู่ให้ดูแลเป็นปกติถ้าจำนวนคี่แทรกแซง

ง่ายต่อการติดตั้งใช้งานยากกว่าที่จะล้มล้าง (ง่ายต่อการตรวจสอบสิ่งที่ผู้ป่วยควรได้รับ) รักษาความทรงจำได้ง่าย แต่ถึงกระนั้นฉันไม่ชอบมันฉันรู้สึกว่าการสุ่มที่เหมาะสมจะดีกว่า แต่ฉันไม่สามารถอธิบายได้ว่าทำไม

ฉันคิดผิดหรือรู้สึกว่ามีเหตุผลที่ดีที่จะชอบการสุ่มแบบ "ของจริง" หรือไม่?


1
ยินดีต้อนรับสู่เว็บไซต์! ดีใจที่เห็นโพสต์ของคุณที่นี่
Andy W

จากคำตอบข้างต้นฉันรู้สึกดีกว่าที่จะ "สุ่ม" ตามวันเกิด! วันแปลก ๆ เพื่อการรักษาแม้กระทั่งวันที่จะควบคุม ... Adalberto
AADF

6
@Adalberto เฉียงจุดหลักซึ่งเป็นที่ใด ๆที่ชัดเจนขั้นตอนที่ไม่สุ่มของการกำหนดวิชาเป็นกลุ่มไม่สามารถมั่นใจได้ของการมีคุณสมบัติที่พึงประสงค์ว่าเป็นขั้นตอนที่มีการสุ่ม สมมติว่าคุณใช้เวลาเป็นเวลาหลายปีในการศึกษาดังกล่าวหลังจากนั้นเพื่อให้ผู้ตรวจสอบชี้ให้เห็นถึงความสับสนที่ไม่คาดคิด แต่แข็งแกร่งระหว่างการรักษาและความเท่าเทียมกันของวันเกิด เนื่องจากเราไม่สามารถคาดการณ์ความเสียหายดังกล่าวทั้งหมดได้เราจึงหลีกเลี่ยงปัญหาโดยการสุ่มมอบหมาย
whuber

คำตอบ:


28

คุณมีสิทธิ์ที่จะสงสัย โดยทั่วไปเราควรใช้การสุ่มแบบ 'ของจริง' เพราะโดยทั่วไปแล้วเราไม่มีความรู้ทั้งหมดเกี่ยวกับปัจจัยที่เกี่ยวข้อง (ไม่สามารถสังเกตเห็นได้) หากหนึ่งในผู้ที่ไม่สามารถสังเกตได้เหล่านั้นมีความสัมพันธ์กับอายุที่แปลกหรือแม้กระทั่งมันก็มีความสัมพันธ์กับว่าพวกเขาได้รับการรักษาหรือไม่ หากเป็นกรณีนี้เราไม่สามารถระบุผลการรักษาได้: ผลกระทบที่เราสังเกตเห็นอาจเกิดจากการรักษาหรือเนื่องจากปัจจัยที่ไม่ได้สังเกต

นี่ไม่ใช่ปัญหากับการสุ่มอย่างแท้จริงซึ่งเราไม่คาดหวังว่าจะมีการพึ่งพาระหว่างการรักษาและไม่สามารถสังเกตเห็นได้ (แม้ว่าแน่นอนสำหรับกลุ่มตัวอย่างขนาดเล็กอาจมีอยู่)

เพื่อสร้างเรื่องราวว่าทำไมขั้นตอนการสุ่มนี้อาจเป็นปัญหาสมมติว่าการศึกษาได้รวมเฉพาะวิชาที่มีอายุ 17/18 ปีเมื่อกล่าวว่าสงครามเวียดนามเริ่มขึ้น ด้วย 17 ไม่มีโอกาสที่จะถูกเกณฑ์ทหาร (แก้ไขให้ฉันถ้าฉันทำผิดในขณะนั้น) ในขณะที่มีโอกาสนั้นตอนอายุ 18 สมมติว่าโอกาสนั้นไม่มีสิทธิ์และประสบการณ์สงครามนั้นเปลี่ยนผู้คนก็หมายความว่าหลายปีต่อมาทั้งสองกลุ่ม จะแตกต่างกันแม้ว่าพวกเขาจะห่างกันเพียง 1 ปี ดังนั้นการรักษา (ยา) ดูเหมือนว่าจะไม่ได้ผล แต่เนื่องจากมีเพียงกลุ่มทหารผ่านศึกเวียดนามที่ได้รับเท่านั้นนี่อาจเป็นเพราะความจริงที่ว่ามันไม่ได้ผลกับคนที่มีพล็อต (หรือปัจจัยอื่น ๆ ที่เกี่ยวข้องกับ เป็นทหารผ่านศึก) กล่าวอีกนัยหนึ่งคุณต้องการทั้งสองกลุ่ม (การรักษาและการควบคุม) ให้เหมือนกันยกเว้นการรักษาเพื่อระบุผลการรักษา

ดังนั้นหากคุณไม่สามารถแยกแยะได้ว่าไม่มีความแตกต่างระหว่างกลุ่ม (แต่คุณจะทำอย่างนั้นได้อย่างไรหากไม่ได้สังเกตเห็น) การสุ่มแบบจริงจะดีกว่า


ขอบคุณ ตัวอย่างที่ดี (ฉันลืมที่จะเรียกมันว่าการสุ่มหลอกฉันได้แก้ไขในคำถาม)
Jeremy Miles

2
(+1) เมื่อฉันอ่านคำถามเวียดนามเป็นตัวอย่างแรกที่ผุดขึ้นในใจทันที มันสนุกมากที่ได้เห็นว่าคุณใช้กลัดเดียวกัน ฉันคิดว่ามันเป็นตัวเลือกที่ชัดเจนที่สุดเมื่อกำหนดอายุของอาสาสมัครถึงแม้ว่าอายุในช่วงต้นถึงกลางยุค 60 นั้นใกล้เข้ามาแล้ว
พระคาร์ดินัล

ขออภัยสำหรับ ping นอกหัวข้อ: มีข้อเสนอแนะเกี่ยวกับ Meta ที่จะทำให้ [การทดลองแบบสุ่ม] เป็นคำพ้องความหมายของแท็ก [การจัดสรรแบบสุ่ม] ( stats.meta.stackexchange.com/a/4651 ) คุณมีชื่อเสียงเพียงพอในแท็กนี้เพื่อลงคะแนนสำหรับคำแนะนำนี้ที่นี่: stats.stackexchange.com/tags/random-allocation/synonyms - ตอนนี้ต้องมี 4 upvotes เพื่อผ่าน หากคุณไม่เห็นด้วยกับข้อเสนอให้พิจารณาแสดงความคิดเห็นใน Meta เพื่ออธิบายว่าทำไม ฉันจะลบความคิดเห็นนี้ในไม่ช้า ไชโย
อะมีบาพูดว่า Reinstate Monica

18

มันเป็นแบบฝึกหัดที่ดีในการรักษามุมมองที่แตกเป็นครั้งคราวดังนั้นฉันขอเริ่มด้วยการเสนอเหตุผลสองสามประการเพื่อสนับสนุนการสุ่มหลอกแบบนี้ โดยหลักแล้วพวกมันจะแตกต่างจากการสุ่มตัวอย่างแบบอื่นเล็กน้อยเช่นการได้รับตัวอย่างของสื่อสิ่งแวดล้อมที่จุดของกริดในสนามหรือการสุ่มตัวอย่างต้นไม้อื่น ๆ ในสวนผลไม้ดังนั้นการสุ่มตัวอย่างนี้อาจสนุกกับข้อดีที่เปรียบเทียบกันได้ .

การเปรียบเทียบที่นี่สมบูรณ์แบบ: อายุเป็น "gridded" โดยเริ่มต้นที่จุดเริ่มต้นของศูนย์และมอบหมายให้กับกลุ่มที่สลับกันตามตาราง (หนึ่งมิติ) นี้ ข้อดีของวิธีการนี้คือการรับประกันความกว้างแม้การกระจายตัวอย่างข้ามสนามหรือสวนผลไม้ (หรืออายุในกรณีนี้) ซึ่งช่วยได้แม้กระทั่งอิทธิพลที่เกี่ยวข้องกับตำแหน่ง (หรือเวลา) สิ่งนี้มีประโยชน์โดยเฉพาะอย่างยิ่งเมื่อทฤษฎีแนะนำว่าสถานที่ตั้งเป็นปัจจัยหลักในการตอบสนองที่แตกต่างกัน ยิ่งไปกว่านั้นยกเว้นกลุ่มตัวอย่างเล็ก ๆ จริงๆทำการวิเคราะห์ข้อมูลราวกับว่าพวกเขาเป็นตัวอย่างแบบสุ่มอย่างง่ายที่แนะนำข้อผิดพลาดค่อนข้างน้อย นอกจากนี้ยังมีการสุ่มบางอย่างที่เป็นไปได้: ในเขตข้อมูลเราสามารถเลือกที่มาและการวางแนวของตาราง ในกรณีปัจจุบันเราอย่างน้อยสามารถสุ่มได้ว่าหลายปีเป็นเรื่องการควบคุมหรือการรักษา

ข้อดีอีกอย่างของการสุ่มตัวอย่างแบบ gridded คือการตรวจจับความแปรปรวนที่แปลเป็นภาษาท้องถิ่น ในฟิลด์นี้จะเป็น "กระเป๋า" ของการตอบสนองที่ผิดปกติ ในทางสถิติเราอาจคิดว่าสิ่งเหล่านี้เป็นอาการของความสัมพันธ์เชิงพื้นที่ ในสถานการณ์ปัจจุบันหากมีโอกาสที่ช่วงอายุที่ค่อนข้างแคบจะได้รับการตอบสนองที่ผิดปกติการออกแบบแบบ gridded เป็นทางเลือกที่ยอดเยี่ยมเพราะการออกแบบแบบสุ่มโดยบังเอิญสามารถมีช่องว่างขนาดใหญ่ในกลุ่มใดกลุ่มหนึ่ง (แต่การออกแบบที่ดีกว่าอาจแบ่งเป็น: ใช้พาริตี้ของอายุเพื่อสร้างชั้นวิเคราะห์สองชั้นจากนั้นแยกแยะผู้ป่วยแต่ละกลุ่มออกเป็นกลุ่มควบคุมและรักษา)

9แนวโน้มที่จะเชื่อมโยงกับปัจจัยที่สำคัญสำหรับการทดสอบ เรื่องนี้ทำให้เกิดความกังวลในคำถามน้อยกว่าสมมุติ: มันเป็นเรื่องจริง ณ จุดนี้คำตอบก่อนหน้าในหัวข้อนี้สามารถนำเสนอความคิดเพิ่มเติมที่ฉันอยากทำดังนั้นฉันจะหยุดและเชิญคุณให้อ่านอีกครั้ง


(+1) โดยเฉพาะอย่างยิ่งสำหรับการตั้งค่าโต้แย้ง
พระคาร์ดินัล

13

ฉันเห็นด้วยตัวอย่างที่คุณให้ไว้นั้นไม่น่ากลัว แต่ ...

หากตัวแทนที่เกี่ยวข้อง (บุคคลที่เกี่ยวข้องกับการแทรกแซงหรือคนที่ได้รับการแทรกแซง) ตระหนักถึงรูปแบบการมอบหมายพวกเขาสามารถใช้ประโยชน์จากมัน การเลือกตนเองเช่นนี้ควรชัดเจนพอสมควรว่าทำไมมันจึงเป็นปัญหาในการออกแบบการทดลองส่วนใหญ่

ตัวอย่างหนึ่งที่ฉันรู้ในด้านอาชญวิทยาจะเป็นเช่นนี้ การทดลองครั้งนี้มีวัตถุประสงค์เพื่อทดสอบผลของการยับยั้งหนึ่งคืนในคุกหลังจากข้อพิพาทภายในประเทศเทียบกับเพียงแค่ขอให้ผู้กระทำผิดออกไปค้างคืน เจ้าหน้าที่ได้รับหนังสือเล่มเล็ก ๆ แผ่นหนึ่งและสีของแผ่นงานปัจจุบันด้านบนนั้นหมายถึงการระบุสิ่งที่รักษา perp ในเหตุการณ์ที่ควรได้รับ

สิ่งที่เกิดขึ้นก็คือเจ้าหน้าที่ตั้งใจไม่เชื่อฟังการออกแบบการศึกษาและเลือกแผ่นงานตามความชอบส่วนตัวสำหรับสิ่งที่ควรทำเพื่อ perp มันไม่ได้เป็นไปได้อย่างมากที่จะสงสัยว่าเรื่องเหลวไหลที่คล้ายกันของปีเป็นอย่างน้อยเป็นไปได้ในตัวอย่างของคุณ


ตัวอย่างที่ดีขอบคุณ แต่ส่วนหนึ่งของเหตุผลคือความเหลวไหลนั้นยากกว่ามาก - พวกเขาไม่สามารถโต้แย้งได้ว่าแผ่นนั้นเป็นสีเหลืองเพราะฉันสามารถไปและตรวจสอบวันเกิดและดูว่าพวกเขาได้รับมอบหมายอย่างถูกต้องหรือไม่
Jeremy Miles

3
ฉันเห็นด้วย @JeremyMiles มันเป็นอีกสาเหตุหนึ่งที่ทำให้การศึกษาแบบสุ่มสองครั้งตาบอด มันเป็นเพียงข้อโต้แย้งที่ตั้งใจป้องกันการสุ่มหลอก - มันง่ายกว่าที่จะหลีกเลี่ยงการรักษาที่ตั้งใจไว้มากกว่าการสุ่มตัวอย่างที่เกิดขึ้นจริง (อันที่จริงตัวอย่างของฉันไม่ใช่ตัวอย่างของการสุ่มหลอก แต่มันแสดงให้เห็นถึงจุดรวบรัด)
Andy W

ขึ้นอยู่กับวิธีการสุ่มตัวอย่าง (จริง) - ผู้ที่เกี่ยวข้องในการศึกษาทำบางส่วนเพื่อหลีกเลี่ยงปัญหาการโค่นล้ม หากคุณใช้การสุ่มตัวอย่างจริงคุณต้องมีการเก็บบันทึกที่ดีเพื่อให้แน่ใจว่าบุคคลที่พิจารณาการสุ่มส่งสัญญาณสื่อสารกับผู้ให้การรักษาและผู้ส่งมอบทำสิ่งที่ถูกต้อง จากตัวอย่างของคุณถ้าพวกเขาใช้หมายเลขบ้าน (พูด) เจ้าหน้าที่อาจมีเวลาในการเปลี่ยนสถานะที่ยากขึ้นแม้ว่าจะไม่ได้สุ่ม
Jeremy Miles

1
ขออภัยสำหรับ ping นอกหัวข้อ: มีข้อเสนอแนะเกี่ยวกับ Meta ที่จะทำให้ [การทดลองแบบสุ่ม] เป็นคำพ้องความหมายของแท็ก [การจัดสรรแบบสุ่ม] ( stats.meta.stackexchange.com/a/4651 ) คุณมีชื่อเสียงเพียงพอในแท็กนี้เพื่อลงคะแนนสำหรับคำแนะนำนี้ที่นี่: stats.stackexchange.com/tags/random-allocation/synonyms - ตอนนี้ต้องมี 4 upvotes เพื่อผ่าน หากคุณไม่เห็นด้วยกับข้อเสนอให้พิจารณาแสดงความคิดเห็นใน Meta เพื่ออธิบายว่าทำไม ฉันจะลบความคิดเห็นนี้ในไม่ช้า ไชโย
อะมีบาพูดว่า Reinstate Monica

0

การสุ่มอย่างสมบูรณ์โดยยึดตามการแจกแจงแบบสุ่มนั้นไม่สามารถคาดเดาได้ในกรณีของคุณเป็นที่ทราบกันดีว่าจะมีการมอบหมายกรณีให้กับการแทรกแซงหรือการควบคุมก่อนการยืนยันสิทธิ์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.