ฉันไม่แน่ใจว่าคำถามนี้อยู่ที่ไหน: ตรวจสอบข้ามหรือตรวจสอบสถานที่ทำงาน แต่คำถามของฉันเกี่ยวข้องกับสถิติอย่างชัดเจน
คำถามนี้ (หรือฉันเดาคำถาม) เกิดขึ้นระหว่างการทำงานในฐานะ "ฝึกงานด้านข้อมูล" ฉันกำลังสร้างแบบจำลองการถดถอยเชิงเส้นนี้และตรวจสอบพล็อตที่เหลือ ฉันเห็นสัญญาณชัดเจนของ heteroskedasticity ฉันจำได้ว่า heteroskedasticity บิดเบือนสถิติการทดสอบหลายอย่างเช่นช่วงความมั่นใจและการทดสอบที ดังนั้นฉันจึงใช้น้ำหนักอย่างน้อยกำลังสองตามสิ่งที่ฉันเรียนที่วิทยาลัย ผู้จัดการของฉันเห็นและแนะนำให้ฉันอย่าทำเช่นนั้นเพราะ "ฉันทำสิ่งที่ซับซ้อน" ซึ่งก็ไม่ใช่เหตุผลที่น่าเชื่อถือสำหรับฉันเลย
อีกตัวอย่างหนึ่งคือ "การลบตัวแปรอธิบายเนื่องจากค่า p ของมันไม่มีนัยสำคัญ" คำแนะนำนี้ไม่สมเหตุสมผลจากมุมมองเชิงตรรกะ จากสิ่งที่ฉันได้เรียนรู้ค่า p ที่ไม่มีนัยสำคัญอาจเป็นเพราะเหตุผลที่แตกต่าง: โอกาสการใช้โมเดลที่ไม่ถูกต้องละเมิดสมมติฐาน ฯลฯ
อีกตัวอย่างหนึ่งก็คือฉันใช้การตรวจสอบความถูกต้องไขว้ของ k-fold เพื่อประเมินโมเดลของฉัน ตามผลเป็นเพียงวิธีที่ดีกว่า2} แต่เราจะมีต่ำกว่ารุ่น 1 และเหตุผลที่มีบางสิ่งบางอย่างจะทำอย่างไรกับตัด หัวหน้างานของฉัน แต่ดูเหมือนว่าจะชอบรุ่น 2 เพราะมันมีสูง 2 เหตุผลของเขา (เช่นนั้นแข็งแกร่งหรือการตรวจสอบข้ามเป็นวิธีการเรียนรู้ของเครื่องจักรไม่ใช่วิธีทางสถิติ) ดูเหมือนจะไม่น่าเชื่อพอที่จะเปลี่ยนความคิดของฉัน C V เมตรo d อีลิตร2 R 2R 2
ในฐานะคนที่เพิ่งจบการศึกษาจากวิทยาลัยฉันรู้สึกสับสนมาก ฉันหลงใหลเกี่ยวกับการใช้สถิติที่ถูกต้องเพื่อแก้ไขปัญหาในโลกแห่งความจริง แต่ฉันไม่ทราบว่าข้อใดต่อไปนี้เป็นจริง:
- สถิติที่ฉันเรียนรู้ด้วยตนเองนั้นไม่ถูกต้องดังนั้นฉันจึงทำผิดพลาด
- มีความแตกต่างอย่างมากระหว่างสถิติเชิงทฤษฎีและแบบจำลองการสร้างใน บริษัท และแม้ว่าทฤษฎีสถิติจะถูกต้อง แต่ผู้คนก็ไม่ปฏิบัติตาม
- ผู้จัดการใช้สถิติไม่ถูกต้อง
อัปเดตเมื่อวันที่ 4/17/2017:ฉันตัดสินใจที่จะติดตามปริญญาเอก ในสถิติ ขอบคุณสำหรับคำตอบของคุณ