ฉันคิดว่าการลองคิดว่านี่เป็นโมเดลเชิงเส้นทั่วไป สิ่งที่คุณมีคือรูปแบบการถดถอยแบบเก่าที่เรียบง่าย โดยเฉพาะอย่างยิ่งเนื่องจากคุณมีตัวแปรอธิบายบางอย่างและ EV ต่อเนื่อง แต่ไม่มีการโต้ตอบระหว่างกันนี่อาจเรียกว่า ANCOVA แบบคลาสสิก
ฉันจะบอกว่า # 3 ไม่ใช่ข้อสันนิษฐานจริงๆที่คุณต้องกังวล และสำหรับเรื่องนั้นคุณต้องกังวลเกี่ยวกับข้อ 2 จริงๆหรือ แต่ฉันจะแทนที่สิ่งเหล่านี้ด้วยสมมติฐานที่ต่างกันสองประการ:
2' ความสม่ำเสมอของความแปรปรวน
3 ' ความธรรมดาของสิ่งตกค้าง
นอกจากนี้ # 4 เป็นสิ่งสำคัญในการตรวจสอบ แต่ฉันไม่คิดว่ามันเป็นข้อสันนิษฐานต่อ se ให้คิดเกี่ยวกับวิธีการตรวจสอบสมมติฐาน
ความเป็นอิสระมักจะ 'ตรวจสอบ' ในตอนแรกโดยคิดว่าข้อมูลควรเป็นอย่างไรและมีการรวบรวมอย่างไร นอกจากนี้ยังสามารถตรวจสอบได้โดยใช้สิ่งต่าง ๆ เช่นการทดสอบรัน , การทดสอบDurbin-Watsonหรือตรวจสอบรูปแบบของความสัมพันธ์อัตโนมัติ -คุณสามารถดูความสัมพันธ์บางส่วนได้ด้วยตนเอง (โปรดทราบว่าสิ่งเหล่านี้สามารถประเมินได้เมื่อเทียบกับ covariate ต่อเนื่องของคุณ)
ด้วยตัวแปรอธิบายเชิงหลักความสม่ำเสมอของความแปรปรวนสามารถตรวจสอบได้โดยการคำนวณความแปรปรวนในแต่ละระดับของปัจจัยของคุณ มีการคำนวณเหล่านี้มีการทดสอบหลายที่ใช้ในการตรวจสอบว่าพวกเขาเป็นเรื่องเดียวกันกับหลักทดสอบ Levene ของแต่ยังทดสอบสีน้ำตาล Forsyth ทดสอบที่เรียกว่าการทดสอบสมุนจะไม่แนะนำ; หากคุณต้องการข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ที่ฉันพูดถึงที่นี่Fm a x. (โปรดทราบว่าการทดสอบเหล่านี้สามารถนำไปใช้กับโควาเรียต์แบบแบ่งของคุณได้ซึ่งแตกต่างจากข้างต้น) สำหรับ EV ต่อเนื่องฉันต้องการพล็อตค่าคงที่ของฉันกับค่าโควาเรียตต่อเนื่องและตรวจสอบด้วยสายตา
ปกติของคลาดเคลื่อนสามารถประเมินผ่านการทดสอบบางอย่างเช่นชาปิโร-Wilkหรือการทดสอบ Kolmogorov-Smirnovแต่บ่อยครั้งที่ดีที่สุดคือการประเมินสายตาผ่านQQ พล็อต (โปรดทราบว่าสมมติฐานนี้โดยทั่วไปมีความสำคัญน้อยที่สุดของชุดหากไม่ตรงตามค่าคาดคะเนเบต้าของคุณจะยังคงไม่ลำเอียงแต่ค่า p ของคุณจะไม่ถูกต้อง)
มีหลายวิธีในการประเมินอิทธิพลของการสังเกตการณ์ส่วนตัวของคุณ เป็นไปได้ที่จะได้รับค่าตัวเลขที่จัดทำดัชนีสิ่งนี้ แต่วิธีที่ฉันชอบถ้าคุณทำได้ก็คือการบีบข้อมูลของคุณ นั่นคือคุณวางจุดข้อมูลแต่ละจุดตามลำดับและปรับแบบจำลองของคุณใหม่ จากนั้นคุณสามารถตรวจสอบว่า betas ของคุณกระเด็นไปรอบ ๆ หากการสังเกตนั้นไม่ใช่ส่วนหนึ่งของชุดข้อมูลของคุณ วัดนี้เรียกว่าdfbeta ต้องมีการเขียนโปรแกรมเล็กน้อย แต่มีวิธีมาตรฐานที่ซอฟต์แวร์สามารถคำนวณให้คุณได้โดยอัตโนมัติ เหล่านี้รวมถึงการใช้ประโยชน์และระยะคุก
เกี่ยวกับคำถามของคุณตามที่ระบุไว้เดิมถ้าคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับฟังก์ชั่นการเชื่อมโยงและทั่วไปรูปแบบเชิงเส้นผมกล่าวว่าเป็นธรรมอย่างกว้างขวางที่นี่ โดยทั่วไปสิ่งที่สำคัญที่สุดที่ควรพิจารณาเพื่อเลือกฟังก์ชั่นลิงค์ที่เหมาะสมคือลักษณะของการกระจายการตอบสนองของคุณ เนื่องจากคุณเชื่อว่าคือ Gaussian การเชื่อมโยงตัวตนนั้นเหมาะสมและคุณสามารถคิดถึงสถานการณ์นี้โดยใช้แนวคิดมาตรฐานเกี่ยวกับตัวแบบการถดถอย Y
เกี่ยวกับ "การวัดขนาดของตัวแปรอธิบายที่ถูกต้อง" ฉันขอให้คุณอ้างอิงระดับการวัดของ Steven (เช่นหมวดหมู่ลำดับที่ช่วงเวลาและอัตราส่วน) สิ่งแรกที่ต้องตระหนักก็คือวิธีการถดถอย (รวมถึง GLiM) ไม่ได้ตั้งสมมติฐานเกี่ยวกับตัวแปรอธิบายแทนวิธีการที่คุณใช้ตัวแปรอธิบายในแบบจำลองของคุณสะท้อนความเชื่อของคุณเกี่ยวกับพวกเขา นอกจากนี้ฉันมักจะคิดว่าระดับของสตีเฟนนั้นสูงเกินไป สำหรับการรักษาทางทฤษฎีมากขึ้นของหัวข้อที่ดูที่นี่