ตำรา / การอ่านเกี่ยวกับสิ่งที่ต้องทำเมื่อคุณไม่สามารถสร้างการทดสอบในอุดมคติได้?


14

การฝึกอบรมทางสถิติของฉันมีรากฐานมาจากสถิติทางคณิตศาสตร์และการเรียนวิธีการเหล่านี้ใน MS ของฉันค่อนข้างน่าตกใจในขณะนี้ ขณะนี้เป็นเรื่องยากสำหรับฉันที่จะสามารถเข้าใจวิธีการ "ใช้งาน" เหล่านี้เนื่องจากฉันไม่มีประสบการณ์ในอุตสาหกรรม

หนึ่งในหัวข้อที่เราได้พูดถึงในชั้นเรียนวิธีการของฉันคือแนวคิดของการออกแบบการทดลอง

ตัวอย่างเช่นฉันต้องการทำการทดลองเกี่ยวกับประสิทธิผลของโปรแกรมการศึกษาที่อ้างว่าเพิ่มคะแนนการทดสอบของนักเรียน K-12

ในชั้นเรียนวิธีการพวกเขาได้สอนสิ่งต่อไปนี้เพื่อติดตามปัญหาดังกล่าว: ตรวจสอบให้แน่ใจว่าคุณมีคำถามการวิจัยที่ดีวิธีการรวบรวมข้อมูลที่ดีการทดลองแบบสุ่มกลุ่มการรักษาที่เป็นเนื้อเดียวกัน ไม่) ขนาดเท่ากันอย่างสมบูรณ์และจากนั้นเรียกใช้การทดสอบ (หรือการทดสอบสมมติฐานที่ไม่ใช่พารามิเตอร์) และมันก็ดีและสวยหรูใช่ไหม?เสื้อ

ฉันมีศรัทธาเล็กน้อยว่านี่คือวิธีการทำงานในความเป็นจริง

ฉันได้เรียนรู้แล้วว่าคุณอาจต้องทำการสุ่มตัวอย่างเพื่อความสะดวก แต่นอกจากนั้นฉันก็ไม่รู้ว่าจะใช้การออกแบบการทดลองอะไรนอกจากสิ่งที่ฉันเรียนรู้จากตำรา

มีหนังสือเล่มไหนอ่าน ฯลฯ ที่สำรวจปัญหาเหล่านี้ในทางปฏิบัติ (และในอุดมคติแล้วก็ไม่ควรปัดเศษคณิตศาสตร์ - ฉันไม่ต้องการการพิสูจน์อย่างละเอียดของทุกสิ่ง แต่ฉันไม่ต้องการบอกว่าทุกอย่างคือ " ชัดเจน "ตัวอย่างเช่น)?


3
การอนุมานเชิงสาเหตุพยายามตอบคำถามว่า "เราจะทำให้ความสัมพันธ์เชิงสาเหตุเกิดขึ้นได้อย่างไรแม้ว่าเราจะไม่สามารถทำการทดลองแบบสุ่มได้"
หน้าผา AB

คำตอบ:


11

มีสองสาขาที่การทดลองแบบสุ่มเป็นไปไม่ได้เกือบทุกครั้ง: เป็นสาขาสังคมศาสตร์และเศรษฐศาสตร์ ในกรณีเหล่านี้คุณสามารถทำได้ "การทดลองเสมือน" เท่านั้น ลองค้นหาด้วยคำหลักทดลองเสมือนการศึกษาสังเกตและสังคมศาสตร์ ; คุณจะได้รับหนังสือข้อความดีๆ ฉันสามารถแนะนำหนังสือสองเล่มที่ยอดเยี่ยมในเรื่องนี้: หนังสือเล่มที่สองโดย Shadish และ Cook เป็นหนังสือคลาสสิก:

  1. การต่อต้านและการอนุมานเชิงสาเหตุ: วิธีการและหลักการวิจัยทางสังคมโดยมอร์แกนและการชนะ
  2. การออกแบบการทดลองและกึ่งทดลองสำหรับการอนุมานสาเหตุทั่วไปโดย William R. Shadish และ Thomas D. Cook

กระดาษคลาสสิกที่ใช้เทคนิคที่เรียกว่า "การจับคู่คะแนนความชอบ" ในการตั้งค่าที่ไม่ใช่การทดลองสำหรับการอนุมานสาเหตุโดยDehejia และ Wahbaก็ขอแนะนำเช่นกัน

คำแนะนำเพิ่มเติม:

  1. การออกแบบการศึกษาแบบสังเกตโดย Paul R. Rosenbaum
  2. การอนุมานเชิงสาเหตุสำหรับสถิติสังคมและชีวการแพทย์: การแนะนำโดยอิมเบนและรูบิน

หากคุณกำลังมองหาที่เวลาการทดลองเสมือนชุดหนังสือดังกล่าวข้างต้นมีบางบทที่อุทิศให้กับพวกเขา แต่เป็นหนังสือที่ทุ่มเทโดยยีน v. ออกแบบกระจกและการวิเคราะห์การทดลอง Time-Series และฉันจะตรวจสอบบทความของเขาอนุกรมเวลาขัดขวาง

เรื่องไม่สำคัญ: Gene V Glass ประกาศเกียรติคุณคำว่า "การวิเคราะห์เมตาดาต้า "


3
ที่เกี่ยวข้องกับการนี้ผมจะแนะนำ Rosenbaum ของการออกแบบเชิงการศึกษา เป็นรุ่นทางเทคนิคที่ค่อนข้างน้อยกว่าหนังสือผู้แต่งObservational Studies (ยังมีสูตรไม่กี่สูตร แต่มีทฤษฏีน้อยกว่าและไม่มีการพิสูจน์ ~) มันเป็นหนังสือที่ค่อนข้างใหม่ (2010) และมีตัวอย่างที่ดีและคำอธิบายมากมาย
Karl Ove Hufthammer

@KarlOveHufthammer คำแนะนำที่ดี
นักพยากรณ์

4

นี่คือที่การออกแบบเสมือนจริงจะมีประโยชน์ ในหลาย ๆ สถานการณ์ในทางปฏิบัติการออกแบบการทดลองไม่สามารถทำได้เพราะแม้ว่าคุณจะได้รับการรักษา แต่คุณไม่สามารถทำการสุ่มให้กับกลุ่มหรืออาจมีเพียงกลุ่มเดียว

ในตัวอย่างการศึกษาของคุณคุณอาจไม่สามารถควบคุมผู้ที่ได้รับการรักษาเพราะคุณตั้งใจที่จะทำการแทรกแซงให้กับเด็กทุกคนในโรงเรียนเดียว อย่างไรก็ตามคุณสามารถเปรียบเทียบคะแนนของพวกเขากับคะแนนจากปีก่อนหน้าหรือสุ่มห้องเรียนเพื่อให้บางห้องเรียนได้รับการแทรกแซงก่อนที่คนอื่นหรือเปรียบเทียบโรงเรียนหลายแห่งรวมถึงโรงเรียนที่ไม่ได้รับการแทรกแซง

มันอาจสมเหตุสมผลที่จะทำการออกแบบอนุกรมเวลาที่คุณมีเพียงกลุ่มเดียว แต่ทำการวัดอย่างต่อเนื่องและจัดการรักษาในช่วงระยะเวลาการศึกษาของคุณ ด้วยวิธีนี้คุณสามารถดูว่าความชันของตัวแปรตามช่วงเวลาเปลี่ยนไปหลังการรักษาหรือไม่โดยสัมพันธ์กับความชันโดยรวมของการศึกษาทั้งหมด จำนวนการวัดอาจต่ำถึง 3 แต่ยิ่งดี

ดังนั้นข้อเสนอแนะของฉันคืออ่านข้อมูลเกี่ยวกับการออกแบบการศึกษากึ่งทดลอง


คุณมีหนังสือแนะนำไหม ฉันพบหนังสือประเภทสังคมศาสตร์จำนวนมาก แต่ไม่มีใครทำเพื่อผู้ชมเชิงสถิติจริงๆ
Clarinetist

2

การปฏิบัติที่ละเอียดรอบคอบทั่วๆไปและแม่นยำที่สุดคือ Judea Pearl 2009, "Causality", 2nd ed., Cambridge University Press

โดยเฉพาะอย่างยิ่งมันทำให้ชัดเจนว่าเวรกรรมไม่ใช่ปัญหาทางสถิติจริง ๆ - แม้ว่าข้อมูลที่ไม่ จำกัด ไม่สามารถแก้ไขได้ มันแนะนำภาษาที่แม่นยำเพื่อแสดงความรู้เชิงคุณภาพและเชิงทฤษฎีที่จำเป็นสำหรับการอนุมานสาเหตุเมื่อสิ่งที่เกี่ยวกับข้อมูลเป็นสิ่งที่ไม่ดี คุณจะเห็นว่าการสุ่มแบบล้มเหลวเป็นเพียงหนึ่งในหลาย ๆ ปัญหา นอกจากนี้ยังรวมถึงกรอบทางคณิตศาสตร์อื่น ๆ ทั้งหมดเช่นโดย Imbens, Rubin และ Rosenbaum ฉันไม่สามารถพูดเกินจริงได้ว่าวิธีการของเขาเข้าถึงได้สวยงามและทรงพลังแค่ไหน

ฉันขอแนะนำอย่างยิ่ง อย่างไรก็ตามคุณควรอ่านในลักษณะที่ไม่เป็นเชิงเส้น (บทที่ 5 และ 11 สามารถเข้าถึงได้มากขึ้นและจากนั้นคุณสามารถย้อนกลับผ่านบทที่ 1, 3 และ 7 เพื่อทำความเข้าใจทฤษฎีทั่วไป)

เมื่อคุณเข้าใจพื้นฐานคุณสามารถดูความก้าวหน้าล่าสุดได้อย่างง่ายดายตัวอย่างเช่นเมื่อเป็นไปได้ที่จะ "ส่ง" การค้นพบสาเหตุจากบริบทหนึ่งไปยังอีกบริบทหนึ่งซึ่งไม่จำเป็นต้องเป็นไปได้แม้จะมีการสุ่ม (Pearl, Judea และ Elias Bareinboim 2014, "ความถูกต้องจากภายนอก: จากแคลคูลัสไปจนถึงการขนส่งข้ามประชากร" วิทยาศาสตร์สถิติ)


0

บางทีนี่อาจเป็นสิ่งที่คุณกำลังมองหา ...

สถิติสำหรับผู้ทดสอบ

การออกแบบและวิเคราะห์การทดลอง

การออกแบบและวิเคราะห์การทดสอบด้วย R (ไม่เกี่ยวข้องกับชื่อก่อนหน้า)

การปรับปรุงกระบวนการโดยใช้ข้อมูล (ออนไลน์ฟรีหรือเป็น PDF บทที่ 5 ครอบคลุม DoE)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.