ฉันสามารถใช้การกระจายปกติ GLM กับฟังก์ชั่นบันทึกการเชื่อมโยงใน DV ที่ได้รับการแปลงบันทึกได้หรือไม่?
ใช่; หากสมมติฐานมีความพึงพอใจในระดับนั้น
การทดสอบความสม่ำเสมอของความแปรปรวนเพียงพอที่จะพิสูจน์การใช้การแจกแจงแบบปกติหรือไม่?
ทำไมความเท่าเทียมกันของความแปรปรวนถึงเป็นปกติ?
ขั้นตอนการตรวจสอบส่วนที่เหลือถูกต้องหรือไม่เพื่อปรับการเลือกรุ่นฟังก์ชั่นลิงก์?
คุณควรระวังในการใช้ทั้งฮิสโทแกรมและการทดสอบความพอดีเพื่อตรวจสอบความเหมาะสมของสมมติฐานของคุณ:
1) ระวังการใช้ฮิสโตแกรมในการประเมินความเป็นมาตรฐาน (ดูที่นี่ด้วย )
ในระยะสั้นขึ้นอยู่กับสิ่งที่ง่ายเหมือนการเปลี่ยนแปลงเล็กน้อยในทางเลือกของคุณของความกว้างหรือแม้กระทั่งที่ตั้งของขอบเขตของถังขยะคุณอาจได้รับการแสดงผลที่แตกต่างกันของรูปร่างของข้อมูล:
นั่นคือสองฮิสโตแกรมของชุดข้อมูลเดียวกัน การใช้แบนด์วิดท์ที่แตกต่างกันหลายอย่างอาจมีประโยชน์ในการดูว่าการแสดงผลนั้นไวต่อสิ่งนั้นหรือไม่
2) ระวังการใช้ความดีของการทดสอบพอดีเพื่อสรุปว่าข้อสันนิษฐานของความมีเหตุผลนั้นสมเหตุสมผล การทดสอบสมมติฐานอย่างเป็นทางการไม่ได้ตอบคำถามที่ถูกต้อง
เช่นดูลิงก์ภายใต้ข้อ2 ที่นี่
เกี่ยวกับความแปรปรวนที่ถูกกล่าวถึงในเอกสารบางฉบับที่ใช้ชุดข้อมูลที่คล้ายกัน "เพราะการแจกแจงมีความแปรปรวนแบบเอกพันธ์ที่ GLM พร้อมกับการแจกแจงแบบเกาส์ถูกใช้" หากไม่ถูกต้องฉันจะปรับหรือตัดสินใจการกระจายได้อย่างไร
ในสถานการณ์ปกติคำถามไม่ได้เป็นข้อผิดพลาดของฉัน (หรือการแจกแจงตามเงื่อนไข) ปกติหรือไม่ - พวกเขาจะไม่เป็นเราไม่จำเป็นต้องตรวจสอบ คำถามที่เกี่ยวข้องมากขึ้นคือ 'ระดับของความไม่เป็นมาตรฐานที่มีอยู่ในปัจจุบันส่งผลกระทบต่อการอ้างถึงของฉันอย่างไร "
ฉันแนะนำการประเมินความหนาแน่นของเคอร์เนลหรือ QQplot ปกติ (พล็อตของส่วนที่เหลือเทียบกับคะแนนปกติ) หากการแจกแจงนั้นดูเป็นเรื่องปกติคุณก็ไม่ต้องกังวลอะไร ในความเป็นจริงแม้ว่ามันจะไม่ธรรมดา แต่ก็อาจไม่สำคัญมากขึ้นอยู่กับสิ่งที่คุณต้องการ (ช่วงเวลาการคาดการณ์ปกติจริง ๆ จะขึ้นอยู่กับความเป็นปกติตัวอย่างเช่น แต่สิ่งอื่น ๆ อีกมากมายมักจะทำงานในขนาดกลุ่มตัวอย่างขนาดใหญ่ )
พอสนุกในกลุ่มตัวอย่างขนาดใหญ่ปกติจะมีความสำคัญน้อยลง (นอกเหนือจาก PIs ตามที่ได้กล่าวไว้ข้างต้น) แต่ความสามารถของคุณในการปฏิเสธภาวะปกติจะยิ่งใหญ่ขึ้นเรื่อย ๆ
แก้ไข: จุดที่เกี่ยวกับความเท่าเทียมกันของความแปรปรวนคือจริง ๆสามารถส่งผลกระทบต่อการอนุมานของคุณแม้ในขนาดตัวอย่างที่มีขนาดใหญ่ แต่คุณอาจไม่ควรประเมินด้วยการทดสอบสมมติฐานเช่นกัน การคาดเดาความแปรปรวนผิดนั้นเป็นปัญหาไม่ว่าการกระจายตัวของคุณจะเป็นอะไร
ฉันอ่านว่าค่าเบี่ยงเบนมาตรฐานที่ปรับขนาดควรอยู่ที่ Np สำหรับแบบจำลองเพื่อให้พอดีใช่ไหม?
เมื่อคุณพอดีกับโมเดลปกติจะมีพารามิเตอร์สเกลซึ่งในกรณีนี้ความเบี่ยงเบนที่ปรับขนาดของคุณจะอยู่ที่ Np แม้ว่าการกระจายของคุณจะไม่ปกติ
ในความเห็นของคุณการกระจายปกติพร้อมลิงค์บันทึกเป็นตัวเลือกที่ดี
ในกรณีที่ไม่มีการรู้สิ่งที่คุณกำลังวัดหรือสิ่งที่คุณใช้ในการอนุมานฉันยังคงไม่สามารถตัดสินได้ว่าจะแนะนำการกระจายอื่นสำหรับ GLM หรือไม่
อย่างไรก็ตามหากสมมติฐานอื่น ๆ ของคุณมีความสมเหตุสมผล (อย่างน้อยควรมีการตรวจสอบความเป็นเส้นตรงและความเท่าเทียมกันของความแปรปรวนและแหล่งที่มาของการพึ่งพาอาศัยกัน) ในสถานการณ์ส่วนใหญ่ฉันจะทำสิ่งต่าง ๆ เช่นการใช้ - มีเพียงความประทับใจเล็กน้อยของการเบ้ในส่วนที่เหลือซึ่งแม้ว่าจะเป็นผลกระทบที่แท้จริงแล้วก็ไม่ควรมีผลกระทบอย่างมีนัยสำคัญต่อการอนุมานเหล่านั้น
ในระยะสั้นคุณควรจะสบายดี
(ในขณะที่ฟังก์ชั่นการกระจายและลิงค์อื่นอาจทำได้ดีขึ้นเล็กน้อยในแง่ของความเหมาะสม แต่ในสถานการณ์ที่ จำกัด พวกเขาก็มีแนวโน้มที่จะเข้าใจมากขึ้นด้วย)