สูตรต่อไปนี้ถูกต้องหรือไม่หากฉันต้องการวัดความคลาดเคลื่อนมาตรฐานของค่ามัธยฐานในกรณีตัวอย่างขนาดเล็กที่มีการแจกแจงแบบไม่ปกติ (ฉันใช้ไพ ธ อน)
sigma=np.std(data)
n=len(data)
sigma_median=1.253*sigma/np.sqrt(n)
สูตรต่อไปนี้ถูกต้องหรือไม่หากฉันต้องการวัดความคลาดเคลื่อนมาตรฐานของค่ามัธยฐานในกรณีตัวอย่างขนาดเล็กที่มีการแจกแจงแบบไม่ปกติ (ฉันใช้ไพ ธ อน)
sigma=np.std(data)
n=len(data)
sigma_median=1.253*sigma/np.sqrt(n)
คำตอบ:
จากความคิดเห็นของ @ mary บางตัวฉันคิดว่าสิ่งต่อไปนี้เหมาะสม เธอดูเหมือนจะเลือกค่ามัธยฐานเพราะตัวอย่างมีขนาดเล็ก
ถ้าคุณเลือกค่ามัธยฐานเพราะมันเป็นตัวอย่างเล็ก ๆ นั่นไม่ใช่เหตุผลที่ดี คุณเลือกค่ามัธยฐานเนื่องจากค่ามัธยฐานเป็นค่าที่สำคัญ มันบอกว่าบางสิ่งที่แตกต่างจากค่าเฉลี่ย คุณอาจเลือกสำหรับการคำนวณทางสถิติบางอย่างเพราะมันทนทานต่อปัญหาบางอย่างเช่นค่าผิดปกติหรือเอียง อย่างไรก็ตามขนาดตัวอย่างขนาดเล็กไม่ได้เป็นหนึ่งในปัญหาเหล่านั้นที่แข็งแกร่งต่อ ตัวอย่างเช่นเมื่อขนาดตัวอย่างเล็กลงจริง ๆ แล้วมันจะไวต่อความเบ้มากกว่าค่าเฉลี่ย
Sokal และ Rohlf ให้สูตรนี้ในหนังสือของพวกเขาBiometry (หน้า 139) ภายใต้ "ความคิดเห็นเกี่ยวกับการบังคับใช้" พวกเขาเขียน: ตัวอย่างขนาดใหญ่จากประชากรปกติ ดังนั้นฉันกลัวว่าคำตอบสำหรับคำถามของคุณจะไม่ ดูเพิ่มเติมที่นี่
วิธีหนึ่งที่จะได้รับข้อผิดพลาดมาตรฐานและช่วงความเชื่อมั่นสำหรับค่ามัธยฐานในกลุ่มตัวอย่างขนาดเล็กที่มีการแจกแจงแบบไม่ปกติจะเป็นการบูตสแตรป โพสต์นี้ให้ลิงก์ไปยังแพ็คเกจ Python สำหรับการบูตสแตรป
คำเตือน
@whuber ชี้ให้เห็นว่าการบูตการแบ่งมัธยฐานในตัวอย่างเล็ก ๆ นั้นไม่ได้ให้ข้อมูลมากนักเนื่องจากเหตุผลของ bootstrap นั้นเป็นแบบไม่แสดงอาการ (ดูความคิดเห็นด้านล่าง)
ยิ่งขนาดตัวอย่างน้อยลงเท่าใดก็ยิ่งน่าสงสัยมากเท่านั้น