ตัวแปรตัวบ่งชี้สำหรับข้อมูลไบนารี: {-1,1} vs {0,1}


10

ฉันสนใจในการโต้ตอบการรักษาตัวแปรร่วมในบริบทของการทดลอง / ทดลองควบคุมแบบสุ่มกับการรักษาแบบไบนารีตัวบ่งชี้ที่ได้รับมอบหมายTT

ฉันได้เห็นทั้งและทั้งนี้ขึ้นอยู่กับวิธี / แหล่งที่มาที่เฉพาะเจาะจงสำหรับอาสาสมัครที่ได้รับการรักษาและไม่ได้รับการรักษาตามลำดับT={1,0}T={1,1}

มีกฎของหัวแม่มือเมื่อใช้หรือหรือไม่?{1,0}{1,1}

การตีความแตกต่างกันอย่างไร


FWIW ... ลิงค์แรกนี้ให้ภาพรวมที่ค่อนข้างครอบคลุมเกี่ยวกับรูปแบบการเข้ารหัสที่แตกต่างกัน ... ats.ucla.edu/stat/r/library/contrast_coding.htm ลิงก์ที่สองนี้อธิบายตัวบ่งชี้ (จำลอง) เอฟเฟกต์และมุมฉาก (ตรงกันข้าม) ... Faculty.cas.usf.edu/mbrannick/regression/anova1.html
Mike Hunter

คำตอบ:


10

การตีความของตัวประมาณค่าของตัวแปรตัวบ่งชี้และการสกัดกั้นแตกต่างกัน มาเริ่มกันที่ :{1,0}

สมมติว่าคุณมีรูปแบบดังต่อไปนี้

yi=β0+treatmentβ1

ที่ไหน

treatment={0if placebo1if drug

ในกรณีนั้นคุณจะได้สูตรต่อไปนี้:yi

yi={β0+0β1=β0if placeboβ0+1β1=β0+β1if drug

ดังนั้นการตีความของคือผลของยาหลอกและการตีความของคือความแตกต่างระหว่างผลของยาหลอกกับผลของยา ด้วยเหตุนี้คุณสามารถตีความเป็นการปรับปรุงที่ยาเสนอβ 1 β 1β0β1β1


ตอนนี้เรามาดู :{1,1}

คุณมีโมเดลต่อไปนี้ (อีกครั้ง):

yi=β0+treatmentβ1

แต่ที่ไหน

treatment={1if placebo1if drug

ในกรณีนั้นคุณจะได้สูตรต่อไปนี้:yi

yi={β0+1β1=β0β1if placeboβ0+1β1=β0+β1if drug

การตีความที่นี่คือเป็นค่าเฉลี่ยของผลของยาหลอกและผลของยาและคือความแตกต่างของการรักษาสองแบบกับค่าเฉลี่ยนั้นβ0β1


แล้วคุณจะใช้อันไหน

การตีความของในนั้นเป็นพื้นฐาน คุณตั้งค่าการรักษามาตรฐานและการรักษาอื่น ๆ (อาจมีหลายรายการ) จะถูกเปรียบเทียบกับมาตรฐาน / พื้นฐานนั้น โดยเฉพาะอย่างยิ่งเมื่อคุณเริ่มเพิ่ม covariates อื่น ๆ นี้ยังคงง่ายต่อการตีความเกี่ยวกับคำถามทางการแพทย์มาตรฐาน: ยาเหล่านี้เปรียบเทียบกับยาหลอกหรือยาที่จัดตั้งขึ้นได้อย่างไรβ0{0,1}

แต่ในที่สุดมันก็เป็นเรื่องของการตีความซึ่งฉันอธิบายไว้ข้างต้น ดังนั้นคุณควรประเมินสมมติฐานของคุณและตรวจสอบว่าการตีความใดที่ทำให้ข้อสรุปตรงไปตรงมาที่สุด


6
ค่าคงที่เมื่อใช้การเข้ารหัส -1, 1 คือค่าเฉลี่ย iff จำนวนผู้ตอบแบบสอบถามในกลุ่มที่ได้รับการรักษาเหมือนกับจำนวนผู้ตอบในกลุ่มควบคุม
Maarten Buis

@ MaartenBuis มันคือค่าเฉลี่ยของ iff การออกแบบนั้นมีความสมดุล แต่อย่างอื่นก็ยังคงเป็นค่าเฉลี่ยของค่าเฉลี่ยของทั้งสองกลุ่มซึ่งเป็นสิ่งที่ฉันหมายถึง ฉันเปลี่ยนถ้อยคำเพื่อสะท้อนสิ่งนี้ y
JAD

9
เป็นประโยชน์ ฉันพยายามกระตุ้นให้ใช้ตัวบ่งชี้คำแทนที่จะหลอกตา (เช่นในคำถามเดิม!) ด้วยเหตุผลอย่างน้อยสองประการ อันดับแรกฉันเคยได้ยินเรื่องราวที่มีการนำเสนอลดลงมากเกินไปเพราะคำเช่น "หลอกตาทางเพศ" ถูกตีความอย่างเหยียดหยามว่าเป็นการดูถูกเหยียดหยามหรือก่อกวนโดยคนช่างน้อยกว่า ประการที่สองคำว่าหุ่นจำลองทำให้อุปกรณ์ทั้งหมดดูเหมือนเป็นเรื่องเหลวไหลหรือหลบขณะที่มันเป็นวิธีที่สะอาดและสง่างามอย่างสมบูรณ์แบบ ฉันไม่ได้มีโอกาสมากที่จะเปลี่ยนวิธีปฏิบัติที่ยึดที่มั่นในบางสาขา แต่นี่คือความพยายาม
Nick Cox

ตกลงมันฟังดูเป็นมืออาชีพมากขึ้นเช่นกัน นอกจากนี้ยังเป็นคำอธิบายที่ดีกว่าว่ามันกำลังทำอะไรอยู่
JAD

2
ดีใจที่คุณเห็นด้วย นี่เป็นวิธีง่ายๆในการอธิบาย: มันเรียกว่าตัวบ่งชี้เพราะมันบ่งบอก!
Nick Cox

6

ในบริบทของการถดถอยเชิงเส้นเป็นวิธีที่เป็นธรรมชาติมากขึ้น (และมาตรฐาน) สำหรับการเข้ารหัสตัวแปรไบนารี (ไม่ว่าจะวางไว้ที่ด้านซ้ายมือของมือขวาของการถดถอย) ดังที่ @Jarko Dubbeldam อธิบายคุณสามารถใช้การตีความอื่น ๆ และความหมายของสัมประสิทธิ์จะแตกต่างกันxi{0,1}

เพื่อให้ตัวอย่างวิธีอื่น ๆ การเข้ารหัสตัวแปรเอาท์พุทเป็นมาตรฐานเมื่อการเขียนโปรแกรมหรือ deriving คณิตศาสตร์ต้นแบบเครื่องเวกเตอร์สนับสนุน (เมื่อเรียกไลบรารีคุณต้องการส่งผ่านข้อมูลในรูปแบบที่ไลบรารีคาดหวังซึ่งอาจเป็นสูตร 0, 1)yi{1,1}

ลองใช้สัญกรณ์ที่เป็นมาตรฐานสำหรับสิ่งที่คุณกำลังทำ / ใช้


สำหรับโมเดลเชิงเส้นใด ๆ ที่มีคำดักจับสองวิธีจะเทียบเท่าในแง่ที่ว่าพวกมันเกี่ยวข้องกับการแปลงเชิงเส้นอย่างง่าย ในทางคณิตศาสตร์มันไม่สำคัญว่าคุณจะใช้ data matrixหรือ data matrixโดยที่เต็มอันดับหรือไม่ ในโมเดลเชิงเส้นทั่วไปค่าสัมประสิทธิ์โดยประมาณของคุณทั้งสองวิธีจะสัมพันธ์กับการแปลงเชิงเส้นและค่าที่ติดตั้งจะเหมือนกันXX~=XAAAy^


+1 ผมไม่ได้คิดของการตั้งค่าที่ถูกนำมาใช้ {1,1}
JAD

AdaBoost เป็นอีกตัวอย่างหนึ่งที่ใช้yi{1,1}
ฟรานซิส

5
โดยทั่วไปแล้วคุณสามารถพูดได้ว่ามีการใช้กันอย่างแพร่หลายในการจัดหมวดหมู่เพราะมันทำให้การใช้ฟังก์ชั่นสัญญาณเป็นวิธีที่เป็นไปได้ในการจำแนก {1,1}
JAD

@matthewgunn ผู้เขียนกำลังพูดถึง covariates เช่นอินพุตไม่ใช่เอาต์พุต {-1, 1} เหมาะสมสำหรับเวกเตอร์สนับสนุนสำหรับเอาต์พุต แต่ไม่สำคัญสำหรับอินพุต ดูที่นี่: en.wikipedia.org/wiki/Support_vector_machine#Linear_SVM
Francisco Arceo

@ ฟรานซิสโกอาร์เซโอพอยท์ ฉันแก้ไขให้แม่นยำยิ่งขึ้น
Matthew Gunn

2

นี่เป็นนามธรรมมากกว่า (และอาจไร้ประโยชน์) แต่ฉันจะสังเกตว่าการแทนสองแบบนี้ในความหมายทางคณิตศาสตร์จริงๆแล้วการเป็นตัวแทนกลุ่มและมีมอร์ฟิซึ่มระหว่างพวกมัน

ความหมายของตัวแปรตัวบ่งชี้คือหัวใจของบูลีนคือ "factor is true" หรือ "factor is false" จากสองเหตุการณ์และคุณอาจถามว่า "ปัจจัยของเหตุการณ์ทั้งสองนี้เทียบเท่ากันเช่นพวกเขาทั้งจริงหรือเท็จทั้งคู่" ในตรรกะแบบบูลแห่งนี้อยู่T_2 นี้กำหนดโครงสร้างกลุ่ม\ตอนนี้และทั้งรูปแบบการเป็นตัวแทนของกลุ่มนี้ด้วยการดำเนินงานของกลุ่มและตามลำดับ มอร์ฟิซึ่มส์จากการแสดงครั้งแรกถึงครั้งที่สองได้รับจากTT1T2T1T2Z21,01,1ab=1(a+b)ab=abϕ(a)=2a1.

การเป็นตัวแทนนี้ยังรวมถึงตัวแปรตัวบ่งชี้อย่างต่อเนื่องเช่นความน่าจะเป็น ถ้าคือความน่าจะเป็นที่จะเป็นจริงแล้วน่าจะเป็นสำหรับที่จะเป็นจริงคือ(1-P) ภายใต้มอร์ฟนี้เป็นTT' ปริมาณเป็นตัวบ่งชี้ที่ลงนามระหว่าง -1 ถึง 1 ดังนั้นการคำนวณเกี่ยวกับความน่าจะเป็นของการดำเนินการบูลีนมักจะง่ายกว่ามากในพื้นฐานนี้T T T p p = p p + ( 1 - p ) ( 1 - p ) t ( p ) = 2 p - 1 t t = t t tpTTTpp=pp+(1p)(1p)t(p)=2p1tt=ttt


นี่เป็นเรื่องที่น่าประทับใจ แต่ฉันพบว่ามันเพียงพอที่จะกล่าวว่าการโต้ตอบที่ถูกต้องระหว่าง {-1, 1} และ {0, 1} ต้องเป็นแบบหนึ่งต่อหนึ่ง: ไม่จำเป็นต้องเรียกใช้สิ่งใดนอกเหนือจากคณิตศาสตร์ของโรงเรียนมัธยม เราจำเป็นต้องพูดถึงข้อมูลเดียวกันเพียงแค่เขียนรหัสต่างกัน
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.