'Y ต้องกระจายตามปกติ'
ต้อง?
ในกรณีที่คุณพูดถึงว่ามันเป็นภาษาเลอะเทอะ (ตัวย่อ'ข้อผิดพลาดใน Y จะต้องกระจายตามปกติ' ) แต่พวกเขาไม่ได้ (จริงๆ) บอกว่าการตอบสนองจะต้องกระจายตามปกติหรืออย่างน้อยก็ดูเหมือนจะไม่ ฉันว่าคำพูดของพวกเขาตั้งใจเช่นนั้น
เนื้อหาหลักสูตรของ Penn State
YYiE(Yi)=β0+β1xi
Yi
Yi∼N(β0+β1xi,σ2)
YYi
YiY
หน้าเว็บสถิติ
เป็นคำอธิบายสั้น ๆ ง่ายมากและมีสไตล์ ฉันไม่แน่ใจว่าคุณควรทำสิ่งนี้อย่างจริงจัง ตัวอย่างเช่นมันพูดเกี่ยวกับ
.. ขอให้ตัวแปรทั้งหมดเป็นแบบหลายตัวแปรปกติ ...
ดังนั้นมันจึงไม่ใช่แค่เพียงตัวแปรตอบสนอง
และตัวบ่งชี้ 'หลายตัวแปร' นั้นคลุมเครือ ฉันไม่แน่ใจว่าจะตีความได้อย่างไร
บทความวิกิพีเดีย
มีบริบทเพิ่มเติมอธิบายไว้ในวงเล็บ:
สามัญถดถอยเชิงเส้นคาดการณ์มูลค่าที่คาดว่าจะได้รับในปริมาณที่ไม่รู้จัก (ตัวแปรตอบสนองตัวแปรสุ่ม) เช่นการรวมกันเชิงเส้นของชุดของค่าสังเกต (พยากรณ์) นี่ก็หมายความว่าการเปลี่ยนแปลงค่าคงที่ในตัวทำนายจะนำไปสู่การเปลี่ยนแปลงค่าคงที่ในตัวแปรการตอบสนอง (เช่นตัวแบบการตอบสนองแบบเชิงเส้น) นี่คือความเหมาะสมเมื่อตัวแปรตอบสนองมีการแจกแจงแบบปกติ(สังหรณ์ใจเมื่อตัวแปรตอบสนองสามารถเปลี่ยนแปลงได้อย่างไม่มีกำหนดในทิศทางใดทิศทางหนึ่งโดยไม่มี "ศูนย์ค่า" คงที่หรือมากกว่าโดยทั่วไปสำหรับปริมาณใด ๆ ที่แตกต่างกันเพียงเล็กน้อยเท่านั้นเช่นมนุษย์ ความสูง)
y+ϵϵ∼N(0,σ)
บรรทัดดังกล่าวได้รับการเพิ่มในวันที่ 8 มีนาคม 2012แต่โปรดทราบว่าบรรทัดแรกของบทความ Wikipedia ยังคงอ่าน"ความยืดหยุ่นทั่วไปของการถดถอยเชิงเส้นธรรมดาที่อนุญาตให้ตัวแปรตอบสนองที่มีรูปแบบการกระจายข้อผิดพลาดอื่น ๆ นอกเหนือจากการแจกแจงแบบปกติ"และไม่ใช่ ผิดมาก (ไม่ได้ทุกที่)
ข้อสรุป
ดังนั้นขึ้นอยู่กับทั้งสามตัวอย่าง (ซึ่งแน่นอนอาจสร้างความเข้าใจผิดหรืออย่างน้อยอาจจะเข้าใจผิด) ฉันจะไม่พูดว่า"ความเข้าใจผิดนี้มีการแพร่กระจาย" หรืออย่างน้อยก็ไม่ถึงกับฉันว่าเจตนาของทั้งสามตัวอย่างคือการยืนยันว่า Y ต้องกระจายตามปกติ (แม้ว่าฉันจำได้ว่าปัญหานี้เกิดขึ้นก่อนหน้านี้ใน stackexchange การสลับระหว่างข้อผิดพลาดแบบกระจายปกติและตัวแปรตอบสนองแบบกระจาย ทำง่าย)
ดังนั้นการสันนิษฐานว่า 'Y ต้องกระจายตามปกติ' ดูเหมือนจะไม่เหมือนกับความเชื่อ / ความเข้าใจผิดที่แพร่หลาย (เช่นในสิ่งที่แพร่กระจายเหมือนปลาเฮอริ่งแดง) แต่ก็เหมือนกับข้อผิดพลาดทั่วไป (ซึ่งไม่ได้แพร่กระจายแต่ทำแยกกันทุกครั้ง )
ความคิดเห็นเพิ่มเติม
ตัวอย่างข้อผิดพลาดในเว็บไซต์นี้อยู่ในคำถามต่อไปนี้
จะเกิดอะไรขึ้นถ้าการกระจายตัวของสารตกค้างเป็นปกติ แต่ y ไม่ใช่?
ฉันคิดว่านี่เป็นคำถามเริ่มต้น มันไม่ได้มีอยู่ในเนื้อหาเช่นเนื้อหาหลักสูตรของ Penn State เว็บไซต์ Wikipedia และเมื่อเร็ว ๆ นี้ระบุไว้ในความคิดเห็นของหนังสือ 'การขยายการถดถอยเชิงเส้นด้วย R'
ผู้เขียนผลงานเหล่านั้นเข้าใจเนื้อหาได้อย่างถูกต้อง อันที่จริงพวกเขาใช้วลีเช่น 'Y ต้องกระจายตามปกติ' แต่ขึ้นอยู่กับบริบทและสูตรที่ใช้คุณสามารถเห็นว่าพวกเขาทั้งหมดหมายถึง 'Y, เงื่อนไขบน X, ต้องกระจายตามปกติ' และ 'marginal Y ต้อง แจกจ่ายปกติ ' พวกเขาไม่ได้เข้าใจความคิดผิด ๆ และอย่างน้อยความคิดนั้นก็ยังไม่แพร่หลายในหมู่นักสถิติและผู้คนที่เขียนหนังสือและเนื้อหาหลักสูตรอื่น ๆ แต่การเข้าใจผิดคำพูดที่คลุมเครือของพวกเขาอาจทำให้เกิดความเข้าใจผิด