อัตราต่อรองเป็นวิธีการแสดงโอกาส อัตราต่อรองเป็นเพียงนั้น: หนึ่งอัตราต่อรองหารด้วยอีก นั่นหมายถึงอัตราส่วนอัตราต่อรองคือสิ่งที่คุณคูณอัตราต่อรองโดยสร้างอีกอัตราหนึ่ง มาดูกันว่าพวกเขาทำงานอย่างไรในสถานการณ์ทั่วไปนี้
การแปลงระหว่างอัตราต่อรองและความน่าจะเป็น
อัตราต่อรองของการตอบกลับแบบไบนารีYคืออัตราส่วนของโอกาสที่มันเกิดขึ้น (เขียนด้วย1 ), เขียนPr(Y=1) , ต่อโอกาสที่มันไม่ได้ (เขียนด้วย0 ), เขียนPr(Y=0) :
Odds(Y)=Pr(Y=1)Pr(Y=0)=Pr(Y=1)1−Pr(Y=1).
นิพจน์ที่เทียบเท่ากันทางด้านขวาแสดงว่าพอเพียงกับรุ่นPr(Y=1)เพื่อค้นหาอัตราต่อรอง โปรดทราบว่าเราสามารถแก้ไขได้
Pr(Y=1)=Odds(Y)1+Odds(Y)=1−11+Odds(Y).
การถดถอยโลจิสติก
การถดถอยแบบลอจิสติกเป็นลอการิทึมของอัตราต่อรองของเป็นฟังก์ชันเชิงเส้นของตัวแปรอธิบาย โดยทั่วไปการเขียนตัวแปรเหล่านี้เป็นและรวมถึงเทอมคงที่ที่เป็นไปได้ในฟังก์ชันเชิงเส้นเราอาจตั้งชื่อสัมประสิทธิ์ (ซึ่งประมาณจากข้อมูล) เป็นและ\เป็นทางการผลิตรูปแบบนี้x 1 , … , x p β 1 , … , β p β 0Yx1,…,xpβ1,…,βpβ0
log(Odds(Y))=β0+β1x1+⋯+βpxp.
อัตราต่อรองที่สามารถกู้คืนได้โดยการยกเลิกลอการิทึม:
Odds(Y)=exp(β0+β1x1+⋯+βpxp).
ใช้ตัวแปรเด็ดขาด
ตัวแปรตามหมวดหมู่เช่นกลุ่มอายุเพศการปรากฏตัวของโรคต้อหินฯลฯถูกรวมเข้าด้วยกันโดยใช้ "การเข้ารหัสแบบจำลอง" เพื่อแสดงให้เห็นว่าการเข้ารหัสนั้นไม่สำคัญอย่างไรฉันจะให้ตัวอย่างง่ายๆของกลุ่มเล็ก ๆ กลุ่มหนึ่ง ลักษณะทั่วไปของมันไปยังหลายกลุ่มควรจะชัดเจน ในการศึกษานี้หนึ่งตัวแปรคือ "ขนาดนักเรียน" ซึ่งมีสามประเภทคือ "ใหญ่", "ปานกลาง" และ "เล็ก" (การศึกษาถือว่าสิ่งเหล่านี้เป็นหมวดหมู่ล้วน ๆ โดยไม่สนใจคำสั่งโดยธรรมชาติ) โดยสังหรณ์ใจแต่ละหมวดหมู่มีอัตราต่อรองของตัวเองพูดสำหรับ "ใหญ่",สำหรับ "ปานกลาง" และสำหรับ "เล็ก" . นี่หมายความว่าทุกสิ่งเท่าเทียมกันα M α SαLαMαS
Odds(Y)=exp(αL+β0+β1x1+⋯+βpxp)
สำหรับใครก็ตามในหมวดหมู่ "ใหญ่"
Odds(Y)=exp(αM+β0+β1x1+⋯+βpxp)
สำหรับทุกคนในหมวดหมู่ "ปานกลาง" และ
Odds(Y)=exp(αS+β0+β1x1+⋯+βpxp)
สำหรับผู้ที่อยู่ในหมวดหมู่ "เล็ก"
การสร้างค่าสัมประสิทธิ์ที่สามารถระบุตัวตนได้
ฉันมีสีทั้งสองค่าสัมประสิทธิ์แรกที่จะเน้นพวกเขาเพราะผมต้องการให้คุณแจ้งให้ทราบว่าพวกเขาอนุญาตให้เปลี่ยนแปลงง่ายที่จะเกิดขึ้น: เราสามารถเลือกหมายเลขใด ๆและโดยเพิ่มไปและลบมันจากแต่ละ ,และ , เราจะไม่เปลี่ยนอัตราต่อรองที่คาดการณ์ใด ๆ นี่เป็นเพราะการเทียบเท่าที่ชัดเจนของแบบฟอร์มบีตา0 α L α M α Sγβ0αLαMαS
αL+β0=(αL−γ)+(γ+β0),
เป็นต้น แม้ว่าสิ่งนี้จะไม่มีปัญหาสำหรับตัวแบบ - มันยังคงทำนายสิ่งเดียวกัน - มันแสดงให้เห็นว่าพารามิเตอร์นั้นไม่สามารถตีความได้ในตัวเอง สิ่งที่ยังคงเหมือนเดิมเมื่อเราทำกลยุทธ์การบวกลบนี้คือความแตกต่างระหว่างค่าสัมประสิทธิ์ ตามอัตภาพเพื่อจัดการกับการขาดความสามารถในการระบุตัวบุคคลนี้ (และโดยค่าเริ่มต้นซอฟต์แวร์) เลือกหมวดหมู่หนึ่งในแต่ละตัวแปรว่า "ฐาน" หรือ "อ้างอิง" และเพียงกำหนดว่าค่าสัมประสิทธิ์จะเป็นศูนย์ สิ่งนี้จะลบความกำกวม
กระดาษจะแสดงหมวดหมู่อ้างอิงก่อน "ใหญ่" ในกรณีนี้ ดังนั้นจะถูกลบออกจากและและเพิ่มลงในเพื่อชดเชยα L , α M , α S β 0αLαL,αM,αSβ0
อัตราต่อรองสำหรับบุคคลสมมุติที่ตกอยู่ในหมวดหมู่ฐานทั้งหมดจึงเท่ากับบวกกลุ่มคำศัพท์ที่เกี่ยวข้องกับ "covariates" อื่น ๆ ทั้งหมด - ตัวแปรที่ไม่ใช่หมวดหมู่:β0
Odds(Base category)=exp(β0+β1X1+⋯+βpXp).
ไม่มีคำศัพท์ที่เกี่ยวข้องกับตัวแปรเด็ดขาดใด ๆ ปรากฏที่นี่ (ฉันเปลี่ยนสัญกรณ์เล็กน้อย ณ จุดนี้: betasตอนนี้เป็นค่าสัมประสิทธิ์ของcovariatesเท่านั้นในขณะที่รุ่นเต็มมีอัลฟาสำหรับหมวดหมู่ต่างๆ)α jβiαj
เปรียบเทียบอัตราต่อรอง
ให้เราเปรียบเทียบราคา สมมติว่าบุคคลสมมุติเป็น
ผู้ป่วยเพศชายอายุระหว่าง 80 - 89 ปีที่มีต้อกระจกสีขาว, ไม่มีมุมมองด้านเงินทุน, และนักเรียนตัวเล็ก ๆ ดำเนินการโดยนายทะเบียนผู้เชี่ยวชาญ, ...
เชื่อมโยงกับผู้ป่วยรายนี้ (เรียกเขาว่าชาร์ลี) เป็นค่าสัมประสิทธิ์โดยประมาณสำหรับแต่ละหมวดหมู่:สำหรับกลุ่มอายุของเขาเพื่อเป็นเพศชายและอื่น ๆ เมื่อใดก็ตามที่คุณลักษณะของเขาเป็นพื้นฐานสำหรับหมวดหมู่ของมันค่าสัมประสิทธิ์เป็นศูนย์โดยการประชุมตามที่เราได้เห็น เนื่องจากนี่เป็นโมเดลเชิงเส้นสัมประสิทธิ์จะเพิ่ม ดังนั้นสำหรับอัตราต่อรองฐานที่ได้รับข้างต้นอัตราต่อรองสำหรับผู้ป่วยรายนี้จะได้รับโดยการเพิ่มระบบα ชายα80-89αmale
α80-89+αmale+αno Glaucoma+⋯+αspecialist registrar.
นี่คือจำนวนเงินที่แน่นอนของอัตราต่อรองของผู้ป่วยรายนี้แตกต่างจากฐาน หากต้องการแปลงจากอัตราต่อรองให้ยกเลิกการทำลอการิทึมและจำได้ว่าสิ่งนี้เปลี่ยนเป็นการเพิ่มการคูณ ดังนั้นอัตราเดิมพันพื้นฐานจะต้องคูณด้วย
exp(α80-89)exp(αmale)exp(αno Glaucoma)⋯exp(αspecialist registrar).
ตัวเลขเหล่านี้คือตัวเลขที่ระบุในตารางภายใต้ "Adjusted OR" (อัตราต่อรองที่ปรับ) (มันถูกเรียกว่า "ปรับปรุง" เนื่องจาก covariatesรวมอยู่ในแบบจำลองพวกเขาไม่มีบทบาทในการคำนวณใด ๆ ของเราดังที่คุณเห็นมันถูกเรียกว่า "อัตราส่วน" เพราะมันเป็นจำนวนที่แม่นยำโดย ซึ่งอัตราต่อรองพื้นฐานจะต้องคูณเพื่อสร้างอัตราต่อรองที่คาดการณ์ของผู้ป่วย: ดูย่อหน้าแรกของโพสต์นี้) ตามลำดับในตารางพวกเขาคือ , ,และต่อไป อ้างอิงจากบทความผลิตภัณฑ์ของพวกเขาทำงานออกไป34.5ดังนั้นx1,…,xpexp(α80-89)=1.58exp(αmale)=1.28exp(αno Glaucoma)=1.0034.5
Odds(Charlie)=34.5×Odds(Base).
(โปรดสังเกตว่าหมวดหมู่ฐานทั้งหมดมีอัตราต่อรองที่เนื่องจากการรวมในผลิตภัณฑ์จะไม่เปลี่ยนแปลงนั่นคือวิธีที่คุณจะเห็นหมวดหมู่พื้นฐานในตาราง) 1.00=exp(0)1
การคืนผลลัพธ์เป็นความน่าจะเป็น
สุดท้ายให้เราแปลงผลลัพธ์นี้เป็นความน่าจะเป็น เราก็บอกว่าน่าจะเป็นพื้นฐานที่คาดการณ์ไว้คือ0.736ดังนั้นการใช้สูตรที่เกี่ยวข้องกับอัตราต่อรองและความน่าจะเป็นที่ได้รับตั้งแต่เริ่มแรกเราอาจคำนวณ0.736%=0.00736
Odds(Base)=0.007361−0.00736=0.00741.
ดังนั้นอัตราต่อรองของชาร์ลีคือ
Odds(Charlie)=34.5×0.00741=0.256.
ในที่สุดการแปลงกลับเป็นความน่าจะเป็น
Pr(Y(Charlie)=1)=1−11+0.256=0.204.