ฉันเป็นคนที่ไม่มีสถิติดังนั้นพวกคุณได้โปรดช่วยฉันที่นี่ด้วย
คำถามของฉันมีดังต่อไปนี้: ความแปรปรวนร่วมหมายถึงอะไรจริง ๆ
เมื่อฉันมองหาสูตรสำหรับความแปรปรวนแบบรวมในอินเทอร์เน็ตฉันพบวรรณกรรมจำนวนมากที่ใช้สูตรต่อไปนี้ (ตัวอย่างเช่นที่นี่: http://math.tntech.edu/ISR/Mathematical_Statistics/Introduction_to_Statistical_Tests/thispage/newnode19.html ):
แต่จริง ๆ แล้วมันคำนวณอะไร เพราะเมื่อฉันใช้สูตรนี้ในการคำนวณค่าความแปรปรวนรวมของฉันมันให้คำตอบที่ผิด
ตัวอย่างเช่นพิจารณา "ตัวอย่างหลัก" เหล่านี้:
ความแปรปรวนของกลุ่มตัวอย่างผู้ปกครองนี้เป็นและค่าเฉลี่ยของมันคือˉ x P = 5
ตอนนี้สมมติว่าฉันแยกตัวอย่างผู้ปกครองนี้ออกเป็นสองตัวอย่างย่อย:
- ครั้งแรกที่ย่อยตัวอย่างเป็น 2,2,2,2,2 ที่มีค่าเฉลี่ยและแปรปรวนS 2 1 = 0
- ที่สองย่อยตัวอย่างเป็น 8,8,8,8,8 ที่มีค่าเฉลี่ยและแปรปรวนS 2 2 = 0
ตอนนี้อย่างชัดเจนโดยใช้สูตรข้างต้นในการคำนวณค่าความแปรปรวน pooled / ผู้ปกครองของทั้งสองย่อยตัวอย่างจะผลิตเป็นศูนย์เพราะและS 2 = 0 ดังนั้นสูตรนี้จริงคำนวณอะไร
ในทางกลับกันหลังจากที่ได้รับความยาวฉันพบสูตรที่สร้างความแปรปรวน pooled / parent ที่ถูกต้องคือ:
ในสูตรข้างต้นและd 2 = ¯ x 2 - ˉ xพี
ฉันพบสูตรที่คล้ายกันกับของฉันเช่นที่นี่: http://www.emathzone.com/tutorials/basic-statistics/combined-variance.html และใน Wikipedia แม้ว่าฉันจะต้องยอมรับว่าพวกเขาจะไม่เหมือนกับของฉัน
ดังนั้นอีกครั้งความแปรปรวนแบบรวมหมายความว่าอย่างไร ไม่ควรหมายถึงความแปรปรวนของตัวอย่างหลักจากสองตัวอย่างย่อยใช่หรือไม่ หรือฉันผิดที่นี่อย่างสมบูรณ์?
ขอบคุณล่วงหน้า.
แก้ไข 1: มีคนบอกว่าสองตัวอย่างย่อยของฉันด้านบนเป็นพยาธิสภาพเนื่องจากมีความแปรปรวนเป็นศูนย์ ฉันจะยกตัวอย่างให้คุณฟัง พิจารณาตัวอย่างผู้ปกครองนี้:
ความแปรปรวนของกลุ่มตัวอย่างผู้ปกครองนี้เป็นและค่าเฉลี่ยของมันคือˉ x P = 25.5
ตอนนี้สมมติว่าฉันแยกตัวอย่างผู้ปกครองนี้ออกเป็นสองตัวอย่างย่อย:
- ครั้งแรกที่ย่อยตัวอย่างเป็น 1,2,3,4,5 ที่มีค่าเฉลี่ยและแปรปรวนS 2 1 = 2.5
- ที่สองย่อยตัวอย่าง 46,47,48,49,50 มีค่าเฉลี่ยและแปรปรวนS 2 2 = 2.5
ทีนี้ถ้าคุณใช้ "สูตรของวรรณกรรม" เพื่อคำนวณความแปรปรวนพูคุณจะได้ 2.5 ซึ่งผิดทั้งหมดเพราะความแปรปรวนของผู้ปกครอง / พูรวมควรเป็น 564.7 หากคุณใช้ "สูตรของฉัน" คุณจะได้รับคำตอบที่ถูกต้อง
โปรดเข้าใจฉันใช้ตัวอย่างสุดขีดที่นี่เพื่อแสดงให้ผู้คนเห็นว่าสูตรนั้นผิดจริงๆ ถ้าฉันใช้ "ข้อมูลปกติ" ซึ่งไม่มีการเปลี่ยนแปลงมากมาย (กรณีสุดโต่ง) ผลลัพธ์จากสูตรทั้งสองนั้นจะคล้ายกันมากและผู้คนสามารถยกเลิกความแตกต่างได้เนื่องจากข้อผิดพลาดในการปัดเศษไม่ใช่เพราะสูตรนั้นเป็น ไม่ถูกต้อง.