นอกเหนือจากคำตอบที่ยอดเยี่ยมของ Kjetil ฉันต้องการเพิ่มตัวอย่างเฉพาะบางอย่างเพื่อช่วยอธิบายความหมายของการแจกแจงแบบมีเงื่อนไขซึ่งอาจเป็นแนวคิดที่เข้าใจยาก
สมมติว่าคุณสุ่มตัวอย่างปลา 100 ตัวจากทะเลสาบและคุณสนใจที่จะดูว่าอายุของปลามีผลต่อตัวแปรผลลัพธ์อย่างไรบ้าง:
- น้ำหนักปลา (น้ำหนัก);
- ไม่ว่าปลาจะยาวกว่า 30 ซม.
- จำนวนเกล็ดปลา
ตัวแปรผลลัพธ์แรกนั้นต่อเนื่องที่สองคือไบนารี (0 = ปลาไม่เกิน 30 ซม. 1 = ปลายาวกว่า 30 ซม.) และที่สามคือตัวแปรนับ
การถดถอยเชิงเส้นอย่างง่าย
อายุมีผลต่อน้ำหนักอย่างไร คุณจะกำหนดรูปแบบการถดถอยเชิงเส้นอย่างง่ายของแบบฟอร์ม:
Weight=β0+β1∗Age+ϵ
ที่ 's เป็นอิสระกันกระจายตามการแจกแจงแบบปกติที่มีค่าเฉลี่ย 0 และส่วนเบี่ยงเบนมาตรฐาน\ในแบบจำลองนี้ค่าเฉลี่ยของตัวแปรน้ำหนักสำหรับปลาทั้งหมดในทะเลสาบที่มีอายุเท่ากันนั้นถือว่าแตกต่างกันตามอายุ หมายถึงเงื่อนไขเป็นตัวแทนจาก{} มันถูกเรียกว่าเงื่อนไขเพราะมันเป็นน้ำหนักเฉลี่ยสำหรับทุกปลาในทะเลสาบกับอายุเดียวกัน (น้ำหนักเฉลี่ยที่ไม่มีเงื่อนไขจะเป็นน้ำหนักเฉลี่ยของปลาทุกตัวในทะเลสาบโดยไม่คำนึงถึงอายุ) ϵσβ0+β1∗Age
การถดถอยโลจิสติกไบนารีแบบง่าย
อายุมีผลต่อหรือไม่ว่าปลามีความยาวมากกว่า 30 ซม. คุณกำลังจะกำหนดรูปแบบการถดถอยแบบไบนารีโลจิสติกอย่างง่ายของแบบฟอร์ม:
log(p1−p)=β0+β1∗Age
โดยที่หมายถึงความน่าจะเป็นแบบมีเงื่อนไขว่าปลาในยุคที่กำหนดนั้นมีความยาวมากกว่า 30 ซม. ในโมเดลนี้ความหมายตามเงื่อนไขของตัวแปร "หรือไม่ว่าปลาจะยาวกว่า 30 ซม." ซึ่งสอดคล้องกับปลาทุกตัวในทะเลสาบที่มีอายุเท่ากันนั้นจะถือว่าแปรผันเป็นเส้นตรงตามอายุหลังจากได้รับอาหารเข้าสู่การเปลี่ยนแปลงโลจิท logit-เปลี่ยนหมายถึงเงื่อนไขเป็นตัวแทนจาก{} แบบจำลองนี้ใช้งานได้เพราะเราสันนิษฐานว่าการแจกแจงค่าของตัวแปร "ไม่ว่าปลานั้นจะมีความยาวมากกว่า 30 ซม." สำหรับอายุที่กำหนดหรือไม่นั้นคือการแจกแจงเบอร์นูลลี โปรดจำไว้ว่าสำหรับการแจกแจงนี้ความแปรปรวนเป็นฟังก์ชันของค่าเฉลี่ยดังนั้นหากเราสามารถประเมินค่าเฉลี่ยได้เราก็สามารถประเมินความแปรปรวนได้pβ0+β1∗Agepและความแปรปรวนเป็น .) ดูเพิ่มเติมhttps://www.theanalysisfactor.com/link-functions-and-errors-in-logistic-regression/p∗(1−p)
การถดถอยปัวซองแบบง่าย
อายุมีผลต่อจำนวนเกล็ดปลาอย่างไร คุณกำลังจะกำหนดรูปแบบการถดถอยแบบปัวซองอย่างง่ายของแบบฟอร์ม:
log(μ)=β0+β1∗Age
โดยที่หมายถึงค่าเฉลี่ยตามเงื่อนไขของตัวแปรผลลัพธ์ "จำนวนเกล็ดปลา" สำหรับปลาอายุที่กำหนด (นั่นคือจำนวนเกล็ดปลาที่คาดไว้สำหรับปลาทุกตัวในทะเลสาบในช่วงอายุที่กำหนด) ในโมเดลนี้ค่าเฉลี่ยตามเงื่อนไขของตัวแปรผลลัพธ์จะถือว่าแปรผันเป็นเส้นตรงตามอายุหลังจากป้อนเข้าสู่การแปลงบันทึก เข้าสู่ระบบเปลี่ยนหมายถึงเงื่อนไขเป็นตัวแทนจาก{} แบบจำลองนี้ใช้งานได้เพราะเราสันนิษฐานว่าการกระจายของค่าตัวแปร "จำนวนเกล็ดปลา" สำหรับปลาทั้งหมดในทะเลสาบที่มีอายุเท่ากันนั้นคือการแจกแจงปัวซอง จำได้ว่าสำหรับการแจกแจงนี้ค่าเฉลี่ยและความแปรปรวนเท่ากันดังนั้นมันก็เพียงพอที่จะทำแบบจำลองค่าเฉลี่ยของมันμβ0+β1∗Age
เพื่อสรุปผลการกระจายเงื่อนไขหมายถึงการกระจายของค่าผลสำหรับค่าเฉพาะของตัวแปรทำนาย (s) รวมอยู่ในรูปแบบ แบบจำลองการถดถอยแต่ละประเภทที่แสดงไว้ด้านบนกำหนดสมมติฐานการกระจายบางอย่างเกี่ยวกับการแจกแจงแบบมีเงื่อนไขของตัวแปรผลลัพธ์ที่กำหนดอายุ จากสมมติฐานการกระจายเหล่านี้แบบจำลองดำเนินการเพื่อกำหนดว่า (1) ค่าเฉลี่ยของการแจกแจงแบบมีเงื่อนไขแตกต่างกันอย่างไรเมื่อฟังก์ชันของอายุ (การถดถอยเชิงเส้นอย่างง่าย), (2) ค่าเฉลี่ย logit-transformed ของการแจกแจงแบบมีเงื่อนไข อายุ (การถดถอยโลจิสติกแบบไบนารีอย่างง่าย) หรือ (3) ค่าเฉลี่ยการแปลงล็อกของการแจกแจงแบบมีเงื่อนไขจะแตกต่างกันไปตามหน้าที่ของอายุ
สำหรับแต่ละประเภทของรูปแบบหนึ่งสามารถกำหนดสารตกค้างที่สอดคล้องกันเพื่อวัตถุประสงค์ในการตรวจสอบรูปแบบ โดยเฉพาะอย่างยิ่งเพียร์สันและส่วนเบี่ยงเบนสามารถกำหนดสำหรับโมเดลการถดถอยโลจิสติกและปัวซอง