สมมติฐานของโมเดลเชิงเส้นทั่วไป


14

ฉันสร้างโมเดลเชิงเส้นแบบทั่วไปพร้อมตัวแปรตอบกลับเดียว (กระจายต่อเนื่อง / ปกติ) และตัวแปรอธิบาย 4 ตัว (3 ตัวซึ่งเป็นปัจจัยและตัวที่สี่คือจำนวนเต็ม) ฉันใช้การแจกแจงข้อผิดพลาดแบบเกาส์กับฟังก์ชั่นลิงค์ตัวตนแล้ว ขณะนี้ฉันกำลังตรวจสอบว่าแบบจำลองเป็นไปตามสมมติฐานของโมเดลเชิงเส้นทั่วไปซึ่ง ได้แก่ :

  1. ความเป็นอิสระของ Y
  2. ฟังก์ชั่นลิงค์ที่ถูกต้อง
  3. สเกลที่ถูกต้องของการวัดตัวแปรอธิบาย
  4. ไม่มีข้อสังเกตที่มีอิทธิพล

คำถามของฉันคือฉันจะตรวจสอบว่าแบบจำลองตรงตามสมมติฐานเหล่านี้ได้อย่างไร ดูเหมือนว่าจุดเริ่มต้นที่ดีที่สุดคือการวางแผนการตอบสนองต่อตัวแปรอธิบายแต่ละตัว อย่างไรก็ตามตัวแปรอธิบาย 3 ตัวนั้นจัดอยู่ในหมวดหมู่ (ที่มีระดับ 1-4) ดังนั้นฉันควรมองหาอะไรในแปลง

นอกจากนี้ฉันต้องตรวจสอบความหลากหลายและความสัมพันธ์ระหว่างตัวแปรอธิบายหรือไม่? ถ้าใช่ฉันจะทำสิ่งนี้กับตัวแปรอธิบายอย่างละเอียดได้อย่างไร

คำตอบ:


20

ฉันคิดว่าการลองคิดว่านี่เป็นโมเดลเชิงเส้นทั่วไป สิ่งที่คุณมีคือรูปแบบการถดถอยแบบเก่าที่เรียบง่าย โดยเฉพาะอย่างยิ่งเนื่องจากคุณมีตัวแปรอธิบายบางอย่างและ EV ต่อเนื่อง แต่ไม่มีการโต้ตอบระหว่างกันนี่อาจเรียกว่า ANCOVA แบบคลาสสิก

ฉันจะบอกว่า # 3 ไม่ใช่ข้อสันนิษฐานจริงๆที่คุณต้องกังวล และสำหรับเรื่องนั้นคุณต้องกังวลเกี่ยวกับข้อ 2 จริงๆหรือ แต่ฉันจะแทนที่สิ่งเหล่านี้ด้วยสมมติฐานที่ต่างกันสองประการ:

2' ความสม่ำเสมอของความแปรปรวน
3 ' ความธรรมดาของสิ่งตกค้าง

นอกจากนี้ # 4 เป็นสิ่งสำคัญในการตรวจสอบ แต่ฉันไม่คิดว่ามันเป็นข้อสันนิษฐานต่อ se ให้คิดเกี่ยวกับวิธีการตรวจสอบสมมติฐาน

ความเป็นอิสระมักจะ 'ตรวจสอบ' ในตอนแรกโดยคิดว่าข้อมูลควรเป็นอย่างไรและมีการรวบรวมอย่างไร นอกจากนี้ยังสามารถตรวจสอบได้โดยใช้สิ่งต่าง ๆ เช่นการทดสอบรัน , การทดสอบDurbin-Watsonหรือตรวจสอบรูปแบบของความสัมพันธ์อัตโนมัติ -คุณสามารถดูความสัมพันธ์บางส่วนได้ด้วยตนเอง (โปรดทราบว่าสิ่งเหล่านี้สามารถประเมินได้เมื่อเทียบกับ covariate ต่อเนื่องของคุณ)

ด้วยตัวแปรอธิบายเชิงหลักความสม่ำเสมอของความแปรปรวนสามารถตรวจสอบได้โดยการคำนวณความแปรปรวนในแต่ละระดับของปัจจัยของคุณ มีการคำนวณเหล่านี้มีการทดสอบหลายที่ใช้ในการตรวจสอบว่าพวกเขาเป็นเรื่องเดียวกันกับหลักทดสอบ Levene ของแต่ยังทดสอบสีน้ำตาล Forsyth ทดสอบที่เรียกว่าการทดสอบสมุนจะไม่แนะนำ; หากคุณต้องการข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ที่ฉันพูดถึงที่นี่Fmax. (โปรดทราบว่าการทดสอบเหล่านี้สามารถนำไปใช้กับโควาเรียต์แบบแบ่งของคุณได้ซึ่งแตกต่างจากข้างต้น) สำหรับ EV ต่อเนื่องฉันต้องการพล็อตค่าคงที่ของฉันกับค่าโควาเรียตต่อเนื่องและตรวจสอบด้วยสายตา

ปกติของคลาดเคลื่อนสามารถประเมินผ่านการทดสอบบางอย่างเช่นชาปิโร-Wilkหรือการทดสอบ Kolmogorov-Smirnovแต่บ่อยครั้งที่ดีที่สุดคือการประเมินสายตาผ่านQQ พล็อต (โปรดทราบว่าสมมติฐานนี้โดยทั่วไปมีความสำคัญน้อยที่สุดของชุดหากไม่ตรงตามค่าคาดคะเนเบต้าของคุณจะยังคงไม่ลำเอียงแต่ค่า p ของคุณจะไม่ถูกต้อง)

มีหลายวิธีในการประเมินอิทธิพลของการสังเกตการณ์ส่วนตัวของคุณ เป็นไปได้ที่จะได้รับค่าตัวเลขที่จัดทำดัชนีสิ่งนี้ แต่วิธีที่ฉันชอบถ้าคุณทำได้ก็คือการบีบข้อมูลของคุณ นั่นคือคุณวางจุดข้อมูลแต่ละจุดตามลำดับและปรับแบบจำลองของคุณใหม่ จากนั้นคุณสามารถตรวจสอบว่า betas ของคุณกระเด็นไปรอบ ๆ หากการสังเกตนั้นไม่ใช่ส่วนหนึ่งของชุดข้อมูลของคุณ วัดนี้เรียกว่าdfbeta ต้องมีการเขียนโปรแกรมเล็กน้อย แต่มีวิธีมาตรฐานที่ซอฟต์แวร์สามารถคำนวณให้คุณได้โดยอัตโนมัติ เหล่านี้รวมถึงการใช้ประโยชน์และระยะคุก

เกี่ยวกับคำถามของคุณตามที่ระบุไว้เดิมถ้าคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับฟังก์ชั่นการเชื่อมโยงและทั่วไปรูปแบบเชิงเส้นผมกล่าวว่าเป็นธรรมอย่างกว้างขวางที่นี่ โดยทั่วไปสิ่งที่สำคัญที่สุดที่ควรพิจารณาเพื่อเลือกฟังก์ชั่นลิงค์ที่เหมาะสมคือลักษณะของการกระจายการตอบสนองของคุณ เนื่องจากคุณเชื่อว่าคือ Gaussian การเชื่อมโยงตัวตนนั้นเหมาะสมและคุณสามารถคิดถึงสถานการณ์นี้โดยใช้แนวคิดมาตรฐานเกี่ยวกับตัวแบบการถดถอย Y

เกี่ยวกับ "การวัดขนาดของตัวแปรอธิบายที่ถูกต้อง" ฉันขอให้คุณอ้างอิงระดับการวัดของ Steven (เช่นหมวดหมู่ลำดับที่ช่วงเวลาและอัตราส่วน) สิ่งแรกที่ต้องตระหนักก็คือวิธีการถดถอย (รวมถึง GLiM) ไม่ได้ตั้งสมมติฐานเกี่ยวกับตัวแปรอธิบายแทนวิธีการที่คุณใช้ตัวแปรอธิบายในแบบจำลองของคุณสะท้อนความเชื่อของคุณเกี่ยวกับพวกเขา นอกจากนี้ฉันมักจะคิดว่าระดับของสตีเฟนนั้นสูงเกินไป สำหรับการรักษาทางทฤษฎีมากขึ้นของหัวข้อที่ดูที่นี่


1
เนื่องจาก Op มีฟังก์ชันเชื่อมโยงฉันคิดว่าเขาหมายถึงโมเดลเชิงเส้นทั่วไปที่ใช้ฟังก์ชันเชื่อมโยงกับ Y และฉันจะเรียกความเป็นอิสระของ Y เป็นข้อสมมติ สมมติฐานที่ฉันคิดว่าเหมาะสมกว่าว่าองค์ประกอบข้อผิดพลาดในแบบจำลองนั้นเป็นอิสระ เนื่องจากฉันคิดว่าส่วนที่เหลือของสิ่งที่ Gung เขียนนั้นถูกต้อง
Michael R. Chernick

@MichaelChernick ฉันเห็นด้วยกับคุณ ฉันได้แก้ไขคำตอบของฉันเล็กน้อยเพื่อแก้ไขปัญหาเหล่านี้ แจ้งให้เราทราบหากคุณคิดว่ามันยังต้องการงานมากกว่านี้
gung - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.