เวอร์ชั่นสั้น:
เรารู้ว่าการถดถอยโลจิสติกและการถดถอยแบบ probit สามารถตีความได้ว่าเกี่ยวข้องกับตัวแปรแฝงอย่างต่อเนื่องที่ได้รับการแยกตามเกณฑ์คงที่บางส่วนก่อนที่จะสังเกต การตีความตัวแปรแฝงที่คล้ายกันมีให้สำหรับการพูดการถดถอยของปัวซองหรือไม่ วิธีการเกี่ยวกับการถดถอยแบบทวินาม (เช่น logit หรือ probit) เมื่อมีผลลัพธ์ที่ไม่ต่อเนื่องกันมากกว่าสองรายการ ในระดับทั่วไปส่วนใหญ่มีวิธีการตีความ GLM ใด ๆ ในแง่ของตัวแปรแฝงหรือไม่?
รุ่นยาว:
วิธีมาตรฐานในการสร้างแรงจูงใจให้กับโมเดล probit สำหรับผลลัพธ์ไบนารี (เช่นจาก Wikipedia ) มีดังต่อไปนี้ เรามีไม่มีใครสังเกต / แฝงผลตัวแปรที่มีการกระจายตามปกติเงื่อนไขในการทำนายXตัวแปรแฝงนี้อยู่ภายใต้กระบวนการ thresholding เพื่อให้ผลที่ไม่ต่อเนื่องเราจริงสังเกตคือถ้า ,ถ้า<\ สิ่งนี้นำไปสู่ความน่าจะเป็นของให้เพื่อให้อยู่ในรูปแบบของ CDF ปกติพร้อมค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานฟังก์ชันของ thresholdและความชันของการถดถอยของบนX U = 1 Y ≥ γ U = 0 Y < γ U = 1 X γ Y X Y Xตามลำดับ ดังนั้นรูปแบบ probit เป็นแรงบันดาลใจเป็นวิธีการประเมินความลาดชันจากการถดถอยนี้แฝงของบนX
นี่คือตัวอย่างในพล็อตด้านล่างจาก Thissen & ออร์แลนโด (2001) ผู้เขียนเหล่านี้กำลังพูดถึงเทคนิคโมเดล ogive ปกติจากทฤษฎีการตอบสนองของรายการซึ่งดูเหมือนว่า probit regression สำหรับจุดประสงค์ของเรา (โปรดทราบว่าผู้เขียนเหล่านี้ใช้แทนและความน่าจะเป็นเขียนด้วยแทน )X T P
เราสามารถตีความถดถอยโลจิสติในสวยมากตรงทางเดียวกัน ความแตกต่างเพียงอย่างเดียวคือตอนนี้ไม่มีใครสังเกตอย่างต่อเนื่องดังนี้โลจิสติกกระจายไม่กระจายปกติให้Xการโต้แย้งเชิงเหตุผลว่าทำไมถึงตามการกระจายโลจิสติกมากกว่าการแจกแจงแบบปกติค่อนข้างชัดเจนน้อยลง ... แต่เนื่องจากผลลัพธ์ของเส้นโค้งลอจิสติกที่ดูคล้ายกับ CDF ปกติสำหรับการใช้งานจริง (หลังจาก rescaling) มันจะชนะ ' มีแนวโน้มที่จะมีความสำคัญในทางปฏิบัติซึ่งเป็นรูปแบบที่คุณใช้ ประเด็นก็คือทั้งสองรุ่นมีการตีความตัวแปรที่ซ่อนเร้นตรงไปตรงมาX Y
ฉันต้องการทราบว่าเราสามารถใช้การตีความตัวแปรแฝงที่คล้ายกัน (หรือนรกที่ไม่เหมือนใคร) ที่คล้ายกันกับ GLM อื่น ๆ - หรือแม้แต่กับGLM ใด ๆ
แม้แต่การขยายโมเดลด้านบนเพื่ออธิบายผลลัพธ์ของ Binomial ด้วย (เช่นไม่ใช่ผลลัพธ์ของ Bernoulli) ก็ไม่ชัดเจนสำหรับฉัน สันนิษฐานได้ว่าเราสามารถทำได้โดยการจินตนาการว่าแทนที่จะมีขีด จำกัดเพียงครั้งเดียวเรามีหลายขีด จำกัด แต่เราจะต้องกำหนดข้อ จำกัด บางประการเกี่ยวกับเกณฑ์เช่นเดียวกับที่เว้นระยะเท่ากัน ฉันค่อนข้างแน่ใจว่าสิ่งนี้สามารถใช้งานได้แม้ว่าฉันจะไม่ได้ทำรายละเอียดγ
การย้ายไปที่กรณีของการถดถอยของปัวซองดูเหมือนชัดเจนน้อยลงสำหรับฉัน ฉันไม่แน่ใจว่าแนวคิดของเกณฑ์จะเป็นวิธีที่ดีที่สุดในการคิดแบบจำลองในกรณีนี้หรือไม่ ฉันยังไม่แน่ใจด้วยว่าการกระจายแบบไหนที่เราสามารถนึกถึงผลลัพธ์ที่แฝงอยู่ว่ามี
ทางออกที่ต้องการมากที่สุดสำหรับวิธีนี้จะเป็นวิธีทั่วไปในการตีความGLM ใด ๆในแง่ของตัวแปรแฝงที่มีการแจกแจงหรืออื่น ๆ - แม้ว่าโซลูชันทั่วไปนี้จะตีความการตีความตัวแปรแฝงที่แตกต่างกว่าปกติสำหรับ logit / probit regression แน่นอนว่ามันจะเย็นกว่านี้หากวิธีการทั่วไปเห็นด้วยกับการตีความปกติของ logit / probit แต่ยังขยายไปถึง GLM อื่นตามธรรมชาติ
แต่ถึงแม้ว่าการตีความตัวแปรแฝงดังกล่าวจะไม่สามารถใช้ได้ในกรณีทั่วไปของ GLM ฉันก็อยากจะได้ยินเกี่ยวกับการตีความตัวแปรแฝงของกรณีพิเศษเช่นกรณี Binomial และ Poisson ที่ฉันกล่าวถึงข้างต้น
อ้างอิง
Thissen, D. & Orlando, M. (2001) ทฤษฎีการตอบกลับข้อสอบสำหรับรายการที่ทำคะแนนในสองหมวดหมู่ ใน D. Thissen & Wainer, H. (Eds.), การให้คะแนนการทดสอบ (หน้า 73-140) Mahwah, นิวเจอร์ซีย์: Lawrence Erlbaum Associates, Inc.
แก้ไข 2016-09-23
มีความหมายเล็กน้อยที่ GLM ใด ๆ เป็นแบบจำลองตัวแปรแฝงซึ่งก็คือเราสามารถดูพารามิเตอร์ของการแจกแจงผลลัพธ์ที่ประเมินว่าเป็น "ตัวแปรแฝง" ได้เสมอนั่นคือเราไม่ได้สังเกตโดยตรง ตัวอย่างเช่นพารามิเตอร์ rate ของปัวซองเราแค่อนุมานจากข้อมูล ฉันคิดว่านี่เป็นการตีความที่น่ารำคาญและไม่ใช่สิ่งที่ฉันกำลังมองหาเพราะจากการตีความนี้โมเดลเชิงเส้นใด ๆ (และแน่นอนว่าแบบจำลองอื่น ๆ อีกมากมาย!) คือ "แบบจำลองตัวแปรแฝง" ตัวอย่างเช่นในการถดถอยปกติเราประมาณ "แฝง"ของปกติที่ได้รับY X Y γ. ดังนั้นนี่น่าจะทำให้การสร้างแบบจำลองตัวแปรแฝงด้วยการประมาณพารามิเตอร์เพียงอย่างเดียว สิ่งที่ฉันกำลังมองหาในกรณีการถดถอยของปัวซองจะมีลักษณะเป็นแบบจำลองทางทฤษฎีมากขึ้นว่าทำไมผลลัพธ์ที่สังเกตควรมีการแจกแจงปัวซองในตอนแรกเนื่องจากมีสมมติฐานบางอย่าง (ที่คุณต้องกรอก)! การกระจายตัวของแฝง , กระบวนการคัดเลือกหากมีอย่างใดอย่างหนึ่ง, แล้ว (อาจจะเป็นรูปทรงเหรอ?) เราควรจะสามารถตีความค่าสัมประสิทธิ์ GLM โดยประมาณในแง่ของพารามิเตอร์ของการแจกแจง / กระบวนการแฝงเหล่านี้คล้ายกับวิธีที่เราทำได้ ตีความค่าสัมประสิทธิ์การถดถอยจาก probit ในแง่ของการเปลี่ยนแปลงค่าเฉลี่ยในตัวแปรแฝงปกติและ / หรือการเปลี่ยนแปลงในเกณฑ์\