เพียงเพื่อให้ความกระจ่างเกี่ยวกับชื่อเรื่องเราไม่ได้ใช้การแจกแจงแบบ t เพื่อประมาณค่าเฉลี่ย (ในแง่ของการประมาณจุดอย่างน้อย) แต่เพื่อสร้างช่วงเวลาสำหรับมัน
แต่ทำไมต้องใช้การประมาณเมื่อคุณได้รับช่วงความมั่นใจอย่างแน่นอน
มันเป็นคำถามที่ดี (ตราบใดที่เราไม่ได้รับการยืนยันเกินไปใน 'ว่า' เนื่องจากสมมติฐานเพื่อให้เป็นว่าเสื้อกระจายจะไม่ถือจริง)
"คุณต้องใช้ตารางการแจกแจง t เมื่อเกิดปัญหาในการทำงานเมื่อไม่ทราบค่าเบี่ยงเบนมาตรฐานประชากร (σ) และขนาดตัวอย่างเล็ก (n <30)"
เหตุใดผู้คนจึงไม่ใช้การแจกแจงแบบ T ตลอดเวลาเมื่อไม่ทราบค่าเบี่ยงเบนมาตรฐานประชากร (แม้ว่า n> 30)
ฉันถือว่าคำแนะนำเป็น - ที่ดีที่สุด - อาจทำให้เข้าใจผิด ในบางสถานการณ์ควรใช้การแจกแจงแบบ t เมื่อองศาอิสระมีขนาดใหญ่กว่านั้น
ในกรณีที่การประมาณการตามปกตินั้นสมเหตุสมผลขึ้นอยู่กับความหลากหลายของสิ่งต่าง ๆ (และขึ้นอยู่กับสถานการณ์) อย่างไรก็ตามเนื่องจาก (กับคอมพิวเตอร์) ไม่ใช่เรื่องยากเลยที่จะใช้tถึงแม้ว่า df มีขนาดใหญ่มากคุณต้องสงสัยว่าทำไมต้องกังวลเกี่ยวกับการทำสิ่งที่แตกต่างที่ n = 30
หากขนาดตัวอย่างมีขนาดใหญ่จริง ๆ มันจะไม่สร้างความแตกต่างที่เห็นได้ชัดเจนในช่วงความเชื่อมั่น แต่ฉันไม่คิดว่า n = 30 จะใกล้เคียงกับ 'ใหญ่จริงๆ' เสมอ
มีสถานการณ์หนึ่งที่อาจทำให้รู้สึกถึงการใช้งานปกติมากกว่าt - นั่นคือเมื่อข้อมูลของคุณไม่ชัดเจนตรงตามเงื่อนไขที่จะได้รับการแจกแจงแบบ t แต่คุณยังสามารถโต้แย้งสำหรับค่าเฉลี่ยปกติของค่าเฉลี่ย (ถ้าnค่อนข้างใหญ่) อย่างไรก็ตามในสถานการณ์เหล่านั้นบ่อยครั้งที่ t เป็นค่าประมาณที่ดีในทางปฏิบัติและอาจค่อนข้างปลอดภัยกว่า [ในสถานการณ์เช่นนั้นฉันอาจจะอยากสำรวจด้วยการจำลองสถานการณ์]