ในแพ็คเกจทางสถิติจำนวนมากรวมถึง SAS, SPSS และที่มากกว่านั้นมีตัวเลือก "ระงับการสกัดกั้น" ทำไมคุณต้องการทำเช่นนั้น?
ในแพ็คเกจทางสถิติจำนวนมากรวมถึง SAS, SPSS และที่มากกว่านั้นมีตัวเลือก "ระงับการสกัดกั้น" ทำไมคุณต้องการทำเช่นนั้น?
คำตอบ:
หากมีเหตุผลบางอย่างที่คุณรู้ว่าตัด (โดยเฉพาะอย่างยิ่งถ้ามันเป็นศูนย์) คุณสามารถหลีกเลี่ยงการสูญเสียความแปรปรวนในข้อมูลของคุณสำหรับการประเมินสิ่งที่คุณรู้อยู่แล้วและมีความมั่นใจมากขึ้นในค่าที่คุณไม่ต้องประมาณการ
ตัวอย่างที่ค่อนข้างธรรมดาคือถ้าคุณรู้แล้ว (จากความรู้ในโดเมน) ว่าตัวแปรหนึ่งคือ (โดยเฉลี่ย) หลาย ๆ ตัวและคุณกำลังพยายามหาหลายตัว
พิจารณากรณีของ covariate แน่ชัด 3 ระดับ หากมีการสกัดกั้นนั่นจะต้องมีตัวแปรตัวบ่งชี้ 2 ตัว การใช้การเข้ารหัสตามปกติสำหรับตัวแปรตัวบ่งชี้สัมประสิทธิ์สำหรับตัวแปรตัวบ่งชี้อย่างใดอย่างหนึ่งคือความแตกต่างเฉลี่ยเมื่อเปรียบเทียบกับกลุ่มอ้างอิง โดยการหยุดการสกัดกั้นคุณจะมี 3 ตัวแปรที่แสดงถึงการแบ่ง covariate แทนที่จะเป็นเพียง 2 สัมประสิทธิ์คือค่าประมาณค่าเฉลี่ยสำหรับกลุ่มนั้น อีกตัวอย่างที่ชัดเจนของการทำเช่นนี้คือในสาขารัฐศาสตร์ซึ่งอาจศึกษา 50 รัฐของสหรัฐอเมริกา แทนที่จะมีการสกัดกั้นและ 49 ตัวบ่งชี้ตัวแปรสำหรับรัฐมันมักจะดีกว่าที่จะระงับการสกัดกั้นและแทนที่จะมี 50 ตัวแปร
เพื่อแสดงจุดของ @Nick Sabbe ด้วยตัวอย่างที่เฉพาะเจาะจง
ฉันเคยเห็นนักวิจัยนำเสนอแบบจำลองอายุของต้นไม้เป็นฟังก์ชั่นความกว้างของมัน สามารถสันนิษฐานได้ว่าเมื่อต้นไม้อยู่ที่อายุศูนย์มันจะมีความกว้างเป็นศูนย์อย่างมีประสิทธิภาพ ดังนั้นการสกัดกั้นจึงไม่จำเป็น