ออฟเซ็ตสามารถใช้ในรูปแบบการถดถอยใด ๆ แต่เป็นเรื่องธรรมดามากเมื่อทำงานกับข้อมูลนับสำหรับตัวแปรตอบกลับของคุณ อ็อฟเซ็ตเป็นเพียงตัวแปรที่ถูกบังคับให้มีค่าสัมประสิทธิ์เท่ากับ1ในโมเดล (โปรดดูหัวข้อ CV ที่ยอดเยี่ยมเช่นนี้: ควรใช้การชดเชยในการถดถอยแบบปัวซองเมื่อใด )
เมื่อนำมาใช้อย่างถูกต้องกับข้อมูลนับนี้จะช่วยให้คุณสร้างแบบจำลองอัตราแทนการนับ หากสิ่งนั้นเป็นสิ่งที่น่าสนใจ ดังนั้นนี่คือบริบทที่มีการใช้งานออฟเซ็ตบ่อยที่สุด ลองพิจารณา Poisson GLiM พร้อมลิงค์บันทึก (ซึ่งก็คือลิงก์แบบบัญญัติ)
ln(λ)ln(λtime)ln(λ)−ln(time)ln(λ)ln(λ)=β0+β1X=β0+β1X⇒=β0+β1X=β0+β1X+1×ln(time)≠=β0+β1X+β2×ln(time)when β2≠1(counts)(rates)(still rates)(counts again)
(อย่างที่คุณเห็นกุญแจสำคัญในการใช้การชดเชยอย่างถูกต้องคือการสร้างชดเชยไม่ t ฉันm จ .) ln(time)time
เมื่อสัมประสิทธิ์ไม่ใช่1คุณจะไม่ได้ทำแบบจำลองอีกต่อไป แต่เนื่องจากβ 2 ∈ ( - ∞ , 1 ) ∪ ( 1 , ∞ )มอบความยืดหยุ่นที่มากขึ้นเพื่อให้พอดีกับข้อมูลรุ่นที่ไม่ใช้ln ( t i m e )เนื่องจากการชดเชยจะเหมาะสมกว่า (แม้ว่าพวกเขาอาจ ยังพอดีมากเกินไป) ln(time)1β2∈(−∞,1)∪(1,∞)ln(time)
ไม่ว่าคุณควรจะนับจำนวนรูปแบบหรืออัตราจริง ๆ ขึ้นอยู่กับคำถามที่แท้จริงของคุณ คุณควรสร้างแบบจำลองที่สอดคล้องกับสิ่งที่คุณต้องการรู้
เท่าที่ความหมายสำหรับไม่ใช่1ให้พิจารณาตัวอย่างที่เวลาไม่ใช่ตัวแปรที่เป็นปัญหา ลองนึกภาพการศึกษาจำนวนของภาวะแทรกซ้อนการผ่าตัดในโรงพยาบาลต่างๆ โรงพยาบาลแห่งหนึ่งมีรายงานภาวะแทรกซ้อนจากการผ่าตัดอีกหลายแห่ง แต่พวกเขาอาจอ้างว่าการเปรียบเทียบนั้นไม่ยุติธรรมเพราะพวกเขาทำการผ่าตัดอีกหลายครั้ง ดังนั้นคุณตัดสินใจที่จะลองควบคุมสิ่งนี้ คุณสามารถใช้บันทึกจำนวนการทำศัลยกรรมเป็นค่าชดเชยซึ่งจะช่วยให้คุณศึกษาอัตราการเกิดภาวะแทรกซ้อนต่อการผ่าตัด นอกจากนี้คุณยังสามารถใช้บันทึกจำนวนการผ่าตัดเป็นตัวแปรร่วมอื่นได้ สมมุติว่าสัมประสิทธิ์แตกต่างจาก1อย่างมาก ถ้าβ 2 > 1β211β2>1แล้วโรงพยาบาลที่ทำศัลยกรรมมากกว่าจะมีอัตราแทรกซ้อนสูงกว่า (อาจเป็นเพราะพวกเขากำลังรีบหางานให้ทำมากขึ้น) หากโรงพยาบาลที่ทำมากที่สุดมีภาวะแทรกซ้อนน้อยกว่าต่อการผ่าตัด (บางทีพวกเขาอาจมีแพทย์ที่ดีที่สุดและทำมากขึ้นและทำดีกว่า) β2<1
มาดูกันว่ามันจะเกิดอะไรขึ้นถ้าตัวแปรที่เป็นปัญหานั้นมีเวลาซับซ้อนกว่าเล็กน้อย การแจกแจงปัวซงเกิดขึ้นจากกระบวนการปัวซองซึ่งเวลาระหว่างเหตุการณ์ถูกแจกแจงแบบยกกำลังและด้วยเหตุนี้มีการเชื่อมต่อตามธรรมชาติกับการวิเคราะห์การอยู่รอด ในการวิเคราะห์การเอาตัวรอดเวลาในเหตุการณ์มักไม่ถูกแจกแจงแบบเอกซ์โปเนนเชียล แต่ความอันตรายพื้นฐานอาจมากหรือน้อยกว่าเมื่อเวลาผ่านไป ดังนั้นให้พิจารณากรณีที่คุณกำลังสร้างแบบจำลองจำนวนเหตุการณ์ที่เกิดขึ้นตามจุดเริ่มต้นที่เป็นธรรมชาติ ถ้านั่นหมายถึงอัตราของเหตุการณ์เร่งขึ้นในขณะที่ถ้าβ 2 < 1β2>1β2<1นั่นหมายถึงอัตราของเหตุการณ์กำลังช้าลง
สำหรับตัวอย่างที่เป็นรูปธรรมในอดีตลองจินตนาการถึงการสแกนที่นับจำนวนเซลล์มะเร็งเป็นระยะเวลาหนึ่งหลังจากที่เนื้องอกเริ่มต้นถูกกำจัดออกไป สำหรับผู้ป่วยบางรายเวลาผ่านไปมากขึ้นตั้งแต่การผ่าตัดและคุณต้องการคำนึงถึงเรื่องนี้ เนื่องจากเมื่อมะเร็งฟื้นกลับมาตั้งหลักแล้วมันจะเริ่มเติบโตอย่างทวีคูณอัตราจะเพิ่มขึ้นตลอดเวลาตั้งแต่การผ่าตัดโดยไม่ต้องรักษาเพิ่มเติม
สำหรับตัวอย่างที่เป็นรูปธรรมของสิ่งหลังให้พิจารณาจำนวนคนที่ตายจากโรคระบาดที่เราไม่ได้รับการรักษา ในตอนแรกผู้คนจำนวนมากตายเพราะพวกเขามีความเสี่ยงต่อโรคนั้นมากขึ้นหรือมีระบบภูมิคุ้มกันที่ได้รับอันตรายอยู่แล้วเป็นต้นเมื่อเวลาผ่านไปเนื่องจากจำนวนประชากรของผู้คนที่เหลืออยู่มีความไวต่อโรคลดลง (ขออภัยตัวอย่างนี้เป็นโรคมาก)