คุณ“ ควบคุม” สำหรับปัจจัย / ตัวแปรอย่างไร


19

เพื่อความเข้าใจของฉัน "การควบคุม" สามารถมีความหมายสองอย่างในสถิติ

  1. กลุ่มควบคุม: ในการทดสอบจะไม่มีการรักษาให้กับสมาชิกของกลุ่มควบคุม ตัวอย่าง: ยาหลอกเทียบกับยา: คุณให้ยาแก่กลุ่มหนึ่งและไม่ให้อีกกลุ่มหนึ่ง (กลุ่มควบคุม) ซึ่งเรียกอีกอย่างว่า "การทดลองที่ควบคุม"

  2. การควบคุมตัวแปร: เทคนิคการแยกเอฟเฟกต์ของตัวแปรอิสระเฉพาะ ชื่ออื่นที่ให้กับเทคนิคนี้คือ "การบัญชีสำหรับ", "การถือค่าคงที่", "การควบคุมสำหรับ", ตัวแปรบางตัว ตัวอย่างเช่น: ในการศึกษาดูฟุตบอล (เหมือนหรือไม่ชอบ) คุณอาจต้องการใช้เอฟเฟกต์ของเพศเมื่อเราคิดว่าเพศเป็นสาเหตุของความลำเอียงนั่นคือผู้ชายอาจชอบมากกว่าผู้หญิง

ดังนั้นคำถามของฉันมีไว้สำหรับจุด (2) สองคำถาม:

คุณ "ควบคุม" / "บัญชีสำหรับ" ตัวแปรโดยทั่วไปได้อย่างไร ใช้เทคนิคอะไร (ในแง่ของการถดถอยกรอบ ANOVA)

ในตัวอย่างด้านบนการเลือกชายและหญิงจะเป็นการควบคุมแบบสุ่มหรือไม่? นั่นคือ "การสุ่ม" เป็นหนึ่งในเทคนิคในการควบคุมเอฟเฟกต์อื่น ๆ หรือไม่?


3
ในแง่ของการถดถอยและ ANOVA การควบคุมตัวแปรมักหมายถึงตัวแปรนั้นรวมอยู่ในตัวแบบ
เกลน

ดังที่เกลนกล่าวว่าการรวมมันไว้ในโมเดลเป็นวิธีที่จะไป อย่างไรก็ตามการสุ่มใช้เพื่อป้องกันอคติจากเอฟเฟกต์ที่ไม่รวมอยู่ในโมเดล เมื่อมีการสร้างการออกแบบคนมักจะถ่วงดุลเพื่อให้แน่ใจว่าสิ่งที่ต้องการเกี่ยวกับจำนวนเดียวกันของแต่ละเพศในการรักษาแต่ละครั้ง ปัญหาเกี่ยวกับการพึ่งพาการสุ่มและถ่วงดุลโดยเฉพาะคือพวกมันแปลงอคตินั้นเป็นความแปรปรวนดังนั้นจึงเป็นการยากที่จะสังเกตว่าปัจจัยใดที่คุณใช้งานอยู่
neverKnowsBest

คำตอบ:


16

ดังที่ได้กล่าวไปแล้วการควบคุมโดยปกติหมายถึงการรวมตัวแปรในการถดถอย (ตามที่ระบุโดย @EMS สิ่งนี้ไม่รับประกันความสำเร็จในการบรรลุเป้าหมายนี้เขาเชื่อมโยงกับสิ่งนี้ ) มีคำถามและคำตอบที่ได้รับคะแนนโหวตสูงอยู่แล้วในหัวข้อนี้เช่น:

คำตอบที่ได้รับการยอมรับในคำถามเหล่านี้ทั้งหมดรักษาที่ดีมากของคำถามที่คุณจะถามภายในสังเกตการณ์ (ผมจะบอกว่าหาความสัมพันธ์) กรอบคำถามดังกล่าวมากขึ้นสามารถพบได้ที่นี่

อย่างไรก็ตามคุณกำลังถามคำถามของคุณโดยเฉพาะภายในกรอบการทดลองหรือ ANOVA คุณสามารถให้ความคิดเห็นเพิ่มเติมในหัวข้อนี้ได้

ภายในกรอบการทดลองคุณสามารถควบคุมตัวแปรโดยการสุ่มแต่ละบุคคล (หรือหน่วยการสังเกตอื่น ๆ ) ในเงื่อนไขการทดลองที่แตกต่างกัน สมมติฐานที่สำคัญคือความแตกต่างเพียงอย่างเดียวระหว่างเงื่อนไขคือการรักษาทดลอง เมื่อการสุ่มอย่างถูกต้อง (เช่นแต่ละคนมีโอกาสเท่ากันที่จะอยู่ในแต่ละเงื่อนไข) นี่เป็นข้อสมมติฐานที่สมเหตุสมผล นอกจากนี้การสุ่มเท่านั้นยังช่วยให้คุณสามารถอนุมานสาเหตุจากการสังเกตของคุณได้เนื่องจากนี่เป็นวิธีเดียวที่จะทำให้แน่ใจว่าไม่มีปัจจัยอื่นใดที่มีผลต่อผลลัพธ์ของคุณ

อย่างไรก็ตามมันก็จำเป็นที่จะต้องควบคุมตัวแปรภายในกรอบทดลองคือเมื่อมีอีกปัจจัยหนึ่งที่ทราบว่ายังมีผลต่อตัวแปรตามนั้นด้วย เพื่อเพิ่มกำลังทางสถิติและสามารถควบคุมตัวแปรนี้ได้เป็นอย่างดี ขั้นตอนทางสถิติตามปกติที่ใช้สำหรับการนี้คือการวิเคราะห์ความแปรปรวนร่วม (ANCOVA) ซึ่งโดยทั่วไปก็แค่เพิ่มตัวแปรให้กับแบบจำลอง

ตอนนี้จุดเริ่มต้น: เพื่อให้ ANCOVA มีเหตุผลมันเป็นสิ่งสำคัญอย่างยิ่งที่การมอบหมายให้กลุ่มนั้นเป็นแบบสุ่มและค่าความแปรปรวนร่วมที่ถูกควบคุมนั้นไม่มีความสัมพันธ์กับตัวแปรการจัดกลุ่ม
สิ่งนี้มักจะถูกมองข้ามซึ่งนำไปสู่ผลลัพธ์ที่ไม่สามารถตีความได้ บทแนะนำที่อ่านได้จริงเกี่ยวกับปัญหาที่แน่นอนนี้ (เช่นเมื่อใดที่จะใช้ ANCOVA หรือไม่ก็ตาม) มอบให้โดยMiller & Chapman (2001) :

แม้จะมีเทคนิคการรักษามากมายในสถานที่หลายแห่ง แต่การวิเคราะห์ความแปรปรวนร่วม (ANCOVA) ยังคงเป็นวิธีที่ใช้กันอย่างแพร่หลายในการจัดการกับความแตกต่างที่สำคัญของกลุ่มผู้ร่วมทุนที่มีศักยภาพโดยเฉพาะอย่างยิ่งในการวิจัยทางพยาธิวิทยา บทความที่ตีพิมพ์ถึงข้อสรุปที่ไม่มีมูลความจริงและข้อความสถิติบางฉบับละเลยประเด็น มีการทบทวนปัญหาของ ANCOVA ในกรณีดังกล่าว ในหลายกรณีไม่มีวิธีใดที่จะบรรลุเป้าหมายที่น่าสนใจอย่างยิ่งของ "การแก้ไข" หรือ "การควบคุมสำหรับ" ความแตกต่างของกลุ่มที่แท้จริงใน covariate ที่มีศักยภาพ ด้วยความหวังว่าจะลดการใช้ ANCOVA ในทางที่ผิดและส่งเสริมการใช้อย่างเหมาะสมการอภิปรายที่ไม่ใช้เทคนิคถูกจัดทำขึ้นโดยเน้นความสับสนที่สำคัญที่ไม่ค่อยได้พูดถึงในตำราและการนำเสนอทั่วไปเพื่อเสริมการวิพากษ์ทางคณิตศาสตร์


มิลเลอร์, GA, และแชปแมน, JP (2001) การวิเคราะห์ความเข้าใจผิดของความแปรปรวนร่วม วารสารจิตวิทยาผิดปกติ , 110 (1), 40–48 ดอย: 10.1037 / 0021-843X.110.1.40


เพียงเพื่อเน้นจุดในคำถามนี้ (ซึ่งถูกถามซ้ำบ่อยมาก) ก็เป็นเรื่องดีที่จะพิจารณาว่าการรวมตัวแปรในแบบจำลองนั้นไม่รับประกันว่าจะ "ควบคุม" สำหรับผลกระทบแม้ภายใต้สมมติฐานที่แข็งแกร่งมากเกี่ยวกับตัวแปรที่เป็น เกี่ยวข้องกับตัวแปรที่ขึ้นต่อกัน ดูบทความที่เชื่อมโยงในความคิดเห็นอื่นของฉัน
ely

1
@EMS จุดที่ดี ฉันได้เพิ่มข้อความเตือนและลิงค์ไปยังจุดเริ่มต้นของข้อความ รู้สึกอิสระที่จะแก้ไขข้อความของฉันถ้าคุณรู้สึกว่ามีเพิ่มมากขึ้น
Henrik

0

ในการควบคุมตัวแปรคุณสามารถแบ่งกลุ่มสองกลุ่มในลักษณะที่เกี่ยวข้องแล้วเปรียบเทียบความแตกต่างของปัญหาที่คุณกำลังทำการวิจัย ฉันสามารถอธิบายสิ่งนี้ได้ด้วยตัวอย่างเท่านั้นไม่ใช่แบบเป็นทางการ B-school คือปีที่ผ่านมาดังนั้นจึงมี

ถ้าคุณจะพูดว่า:

บราซิลมีฐานะดีกว่าประเทศสวิตเซอร์แลนด์เนื่องจากบราซิลมีรายได้ประชาชาติ 3524 พันล้านเหรียญสหรัฐและสวิตเซอร์แลนด์เพียง 551 พันล้านเหรียญ

คุณจะถูกต้องในแง่ที่แน่นอน แต่ใครก็ตามที่อายุมากกว่า 12 ปีที่มีความรู้เกี่ยวกับโลกจะสงสัยว่ามีบางอย่างผิดปกติในคำสั่งนั้นเช่นกัน

มันจะเป็นการดีกว่าถ้าจะยกระดับประชากรสวิตเซอร์แลนด์ให้เป็นของบราซิลแล้วเปรียบเทียบรายได้อีกครั้ง ดังนั้นหากประชากร Switzerlands มีขนาดเท่ากับบราซิลรายได้ของพวกเขาจะเป็น:

(210 ล้าน / 8,5 ล้าน) * 551 พันล้านดอลลาร์ = 13612 ล้านดอลลาร์

นี่เองที่ทำให้พวกเขาร่ำรวยกว่าบราซิลถึง 4 เท่าตัวที่ 3524 พันล้านดอลลาร์

และใช่คุณยังสามารถใช้วิธีต่อหัวซึ่งคุณเปรียบเทียบรายได้เฉลี่ย แต่วิธีการข้างต้นคุณสามารถนำไปใช้ได้หลายครั้ง


1
คุณดูเหมือนจะอธิบายรูปแบบของการทำให้เป็นมาตรฐานมากกว่า "ควบคุม" ในแง่ที่มีความหมายในคำถาม
whuber

จริงๆแล้วฉันคิดว่ามันเหมือนกัน หากคุณไม่คิดอย่างนั้นรู้สึกอิสระที่จะอธิบายความแตกต่างระหว่างคนทั้งสอง
Heccate Newb

ฉันไม่คิดว่าฉันต้องเพิ่มคำตอบอื่น ๆ ที่ปรากฏในกระทู้นี้แล้ว
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.