หากต้องการขยายคำตอบของ @ ken-butler เล็กน้อย โดยการเพิ่มทั้งตัวแปรต่อเนื่อง (ชั่วโมง) และตัวแปรตัวบ่งชี้สำหรับค่าพิเศษ (ชั่วโมง = 0 หรือที่ไม่ใช่การให้นมบุตร) คุณคิดว่ามีผลเชิงเส้นสำหรับค่า "ไม่ใช่พิเศษ" และกระโดดแบบแยกใน ทำนายผลลัพธ์ด้วยค่าพิเศษ มันช่วย (สำหรับฉันอย่างน้อย) ดูกราฟ ในตัวอย่างด้านล่างเราจำลองค่าจ้างรายชั่วโมงเป็นฟังก์ชั่นของชั่วโมงต่อสัปดาห์ที่ผู้ตอบแบบสอบถาม (ผู้หญิงทุกคน) ทำงานและเราคิดว่ามีบางสิ่งที่พิเศษเกี่ยวกับ "มาตรฐาน" 40 ชั่วโมงต่อสัปดาห์:
รหัสที่สร้างกราฟนี้ (ใน Stata) สามารถดูได้ที่นี่: http://www.stata.com/statalist/archive/2013-03/msg00088.html
ดังนั้นในกรณีนี้เราได้กำหนดตัวแปรต่อเนื่องเป็นค่า 40 แม้ว่าเราต้องการให้มันได้รับการปฏิบัติแตกต่างจากค่าอื่น ๆ ในทำนองเดียวกันคุณจะให้สัปดาห์ของคุณเลี้ยงลูกด้วยนมค่า 0 แม้ว่าคุณจะคิดว่ามันแตกต่างในเชิงคุณภาพจากค่าอื่น ๆ ฉันตีความความคิดเห็นของคุณด้านล่างว่าคุณคิดว่านี่เป็นปัญหา นี่ไม่ใช่กรณีและคุณไม่จำเป็นต้องเพิ่มคำศัพท์โต้ตอบ อันที่จริงแล้วคำศัพท์โต้ตอบนั้นจะถูกลบเนื่องจากความสมบูรณ์แบบหากคุณลองใช้ นี่ไม่ใช่ข้อ จำกัด เพียงแค่บอกคุณว่าเงื่อนไขการโต้ตอบไม่ได้เพิ่มข้อมูลใหม่ใด ๆ
สมมติว่าสมการถดถอยของคุณมีลักษณะดังนี้:
y^=β1weeks_breastfeeding+β2non_breastfeeding+⋯
ที่ไหนคือหมายเลขของสัปดาห์ที่ผ่านมาเลี้ยงลูกด้วยนม (รวมค่า 0 สำหรับผู้ที่ไม่ได้ให้นมลูก) และn o n _ ขR อีs T ฉอีอีวันที่ฉันn กรัมเป็นตัวแปรตัวบ่งชี้ที่ 1 เมื่อมีคนไม่ได้ให้นมลูกและ 0 มิฉะนั้นweeks_breastfeedingnon_breastfeeding
พิจารณาสิ่งที่เกิดขึ้นเมื่อมีคนเลี้ยงลูกด้วยนมแม่ สมการการถดถอยช่วยให้:
y^=β1weeks_breastfeeding+β20+⋯=β1weeks_breastfeeding+⋯
ดังนั้นเป็นผลเชิงเส้นตรงจากจำนวนสัปดาห์ที่ให้นมลูกสำหรับผู้ที่ให้นมลูกβ1
พิจารณาสิ่งที่เกิดขึ้นเมื่อมีคนไม่ให้นมลูก:
y^=β10+β21+⋯=β2+⋯
ดังนั้นให้ผลของการไม่ให้นมบุตรและจำนวนสัปดาห์ที่ให้นมบุตรลดลงจากสมการβ2
คุณสามารถเห็นได้ว่าไม่มีประโยชน์ในการเพิ่มคำการโต้ตอบเนื่องจากคำการโต้ตอบนั้นมีอยู่แล้ว (โดยนัย) ในนั้น
อย่างไรก็ตามมีบางสิ่งที่แปลกเกี่ยวกับแม้ว่ามันจะวัดผลกระทบของการเลี้ยงลูกด้วยนมโดยการเปรียบเทียบผลลัพธ์ที่คาดหวังของผู้ที่ไม่ได้เลี้ยงลูกด้วยนมแม่กับผู้ที่ให้นมลูก แต่ทำเช่นนั้นเพียง 0 สัปดาห์ ... ชอบกับ "เรียงลำดับของวิธี แต่ประโยชน์ในทางปฏิบัติไม่ชัดเจนทันที มันอาจสมเหตุสมผลกว่าที่จะเปรียบเทียบ "ผู้ไม่ให้นมบุตร" กับผู้หญิงที่เลี้ยงลูกด้วยนม 12 สัปดาห์ (ประมาณ 3 เดือน) ในกรณีที่คุณเพิ่งให้ "-breastfeeders ไม่ใช่" มูลค่า 12 W อีอีk s _ ขR อีs T ฉอีอีวันที่ฉันn กรัมβ2weeks_breastfeeding. ดังนั้นค่าที่คุณมอบหมายให้สำหรับ "ไม่ใช่ breastfeeders" ไม่มีอิทธิพลต่อค่าสัมประสิทธิ์การถดถอยβ 2ในแง่ที่ว่ามันกำหนดด้วยซึ่ง "ไม่ใช่ -breastfeeders "ถูกเปรียบเทียบ แทนที่จะเป็นปัญหานี่เป็นสิ่งที่มีประโยชน์ทีเดียวweeks_breastfeedingβ2