จากคำถามก่อนหน้านี้คุณได้เรียนรู้ว่า GLM ถูกอธิบายในแง่ของการแจกแจงความน่าจะเป็น, ตัวทำนายเชิงเส้นและฟังก์ชันลิงก์gและถูกอธิบายว่าเป็นηg
ηE( Y| X)= Xβ= μ = g- 1( η)
โดยที่คือฟังก์ชันการเชื่อมโยง logit และYสันนิษฐานว่าเป็นไปตามการแจกแจงเบอร์นูลลีก.Y
Yi∼B(μi)
แต่ละต่อไปนี้การกระจาย Bernoulli มีเป็นของตัวเองเฉลี่ยμ ฉันที่เป็นเงื่อนไขในการX เราจะไม่ได้สมมติว่าแต่ละY ฉันมาจากการกระจายเดียวกันกับค่าเฉลี่ยเท่ากัน (นี้จะเป็นตัดเท่านั้นรูปแบบY ฉัน = กรัม- 1 ( μ ) ) แต่ที่พวกเขาทั้งหมดมีวิธีการที่แตกต่างกัน เราคิดว่าY ฉัน 's เป็นอิสระเช่นเราไม่ต้องกังวลเกี่ยวกับสิ่งต่างๆเช่นอัตระหว่างภายหลังY ฉันค่า ฯลฯYi μiXYiYi=g−1(μ)YiYi
IIDสมมติฐานที่เกี่ยวข้องกับความผิดพลาดในการถดถอยเชิงเส้น (เช่น Gaussian GLM) ซึ่งรูปแบบคือ
yi=β0+β1xi+εi=μi+εi
ที่เพื่อให้เรามีIIDเสียงรอบμฉัน นี่คือเหตุผลที่มีความสนใจในการวินิจฉัยที่เหลือและให้ความสนใจกับสิ่งตกค้างกับติดตั้งพล็อต ตอนนี้ในกรณีของ GLM เช่นการถดถอยโลจิสติกก็ไม่ง่ายเพราะไม่มีสารเติมแต่งระยะเสียงเช่นเดียวกับรูปแบบเกาส์ (ดูที่นี่ , ที่นี่และที่นี่εi∼N(0,σ2)μi) เรายังต้องการให้ส่วนที่เหลือเป็นแบบ "สุ่ม" รอบศูนย์และเราไม่ต้องการที่จะเห็นแนวโน้มใด ๆ ในพวกเขาเพราะพวกเขาจะแนะนำว่ามีผลกระทบบางอย่างที่ไม่ได้รับการพิจารณาในรูปแบบ แต่เราไม่คิดว่ามันเป็น ปกติและ / หรือIID ดูเพิ่มเติมที่ความสำคัญของสมมติฐาน iid ในชุดการเรียนรู้ทางสถิติ
ในฐานะที่เป็น sidenote ที่แจ้งให้ทราบว่าเราสามารถแม้แต่จะวางสมมติฐานที่ว่าแต่ละมาจากชนิดเดียวกันของการกระจาย มีรูปแบบ (ไม่ใช่ GLM) ที่คิดว่าแตกต่างกันY ฉัน 's สามารถมีการกระจายที่แตกต่างกันกับพารามิเตอร์ที่แตกต่างกันคือว่าข้อมูลของคุณมาจากส่วนผสมของการกระจายที่แตกต่างกัน ในกรณีเช่นนี้เราจะสมมติว่าค่าY iนั้นเป็นอิสระเนื่องจากค่าที่ขึ้นต่อกันมาจากการแจกแจงที่แตกต่างกันด้วยพารามิเตอร์ที่แตกต่างกัน (เช่นข้อมูลโลกแห่งความเป็นจริงทั่วไป) เป็นสิ่งที่ในกรณีส่วนใหญ่จะซับซ้อนเกินไป .YiYiYi