ส่วน 1.7.2 ของการค้นพบสถิติการใช้ Rโดย Andy Fields และอื่น ๆ ในขณะที่แสดงรายการคุณธรรมของค่าเฉลี่ย vs มัธยฐาน:
... ค่าเฉลี่ยมีแนวโน้มที่จะคงที่ในกลุ่มตัวอย่างที่แตกต่างกัน
สิ่งนี้หลังจากอธิบายถึงคุณงามความดีของคนมัธยฐานเช่น
... ค่ามัธยฐานค่อนข้างไม่ได้รับผลกระทบจากคะแนนสูงสุดที่ปลายด้านหนึ่งของการกระจาย ...
เนื่องจากค่ามัธยฐานค่อนข้างไม่ได้รับผลกระทบจากคะแนนสูงสุดฉันจึงคิดว่ามันจะมีเสถียรภาพมากขึ้นในกลุ่มตัวอย่าง ดังนั้นฉันจึงงงงวยโดยการยืนยันของผู้เขียน เพื่อยืนยันว่าฉันใช้การจำลอง - ฉันสร้างตัวเลขสุ่ม 1M และสุ่มตัวอย่าง 100 ตัวเลข 1,000 ครั้งและคำนวณค่าเฉลี่ยและค่ามัธยฐานของแต่ละตัวอย่างแล้วคำนวณ SD ของค่าเฉลี่ยตัวอย่างและค่ามัธยฐาน
nums = rnorm(n = 10**6, mean = 0, sd = 1)
hist(nums)
length(nums)
means=vector(mode = "numeric")
medians=vector(mode = "numeric")
for (i in 1:10**3) { b = sample(x=nums, 10**2); medians[i]= median(b); means[i]=mean(b) }
sd(means)
>> [1] 0.0984519
sd(medians)
>> [1] 0.1266079
p1 <- hist(means, col=rgb(0, 0, 1, 1/4))
p2 <- hist(medians, col=rgb(1, 0, 0, 1/4), add=T)
ในขณะที่คุณสามารถดูวิธีการกระจายอย่างแน่นหนากว่าค่ามัธยฐาน
ในภาพที่แนบมานั้นฮิสโทแกรมสีแดงมีไว้สำหรับคนกลาง - อย่างที่คุณเห็นมันมีความสูงน้อยกว่าและมีหางที่อ้วนขึ้นซึ่งยืนยันการยืนยันของผู้แต่ง
ฉันรู้สึกงุนงงกับสิ่งนี้แม้ว่า! ค่ามัธยฐานที่เสถียรกว่ามีแนวโน้มที่จะแตกต่างกันมากในที่สุดในตัวอย่างอย่างไร ดูเหมือนขัดแย้ง! ข้อมูลเชิงลึกใด ๆ ที่จะได้รับการชื่นชม
rnorm
rcauchy