เรามาเริ่มต้นด้วยการพล็อตข้อมูลและดูมัน นี้เป็นจำนวนที่ จำกัด มากของข้อมูลนี้จึงเป็นไปได้ค่อนข้างเฉพาะกิจที่มีมากมายของสมมติฐาน
rotten <- c(0,1,1,0,0,0,1,1,1,1,0,0,0)
rotten <- as.factor(rotten)
mass <- c(139.08,
91.48,
74.23,
129.8,
169.22,
123.43,
104.93,
103.27,
169.01,
83.29,
157.57,
117.72,
128.63)
diam <- c(17.28,
6.57,
7.12,
16.52,
14.58,
6.99,
6.63,
6.75,
15.38,
7.45,
13.06,
6.61,
7.19)
plot(mass,diam,col=rotten,lwd=2)
title("Fruits")
ดังนั้นนี่คือข้อมูลจุดสีแดงแสดงถึงผลไม้เน่า:
คุณถูกต้องโดยสมมติว่ามีผลไม้สองชนิด สมมติฐานที่ฉันทำมีดังต่อไปนี้:
- เส้นผ่าศูนย์กลางแบ่งผลไม้ออกเป็นสองกลุ่ม
- ผลไม้ที่มีเส้นผ่านศูนย์กลางมากกว่า 10 อยู่ในกลุ่มเดียวและกลุ่มอื่น ๆ ในกลุ่มที่เล็กกว่า
- มีผลไม้เน่าเพียงชิ้นเดียวในกลุ่มผลไม้ขนาดใหญ่ สมมติว่าถ้าผลไม้อยู่ในกลุ่มใหญ่การเน่าเสียจะไม่มีผลกับน้ำหนัก นี่เป็นสิ่งสำคัญเนื่องจากเรามีจุดข้อมูลเพียงจุดเดียวในกลุ่มนั้น
- หากผลไม้เป็นผลไม้ขนาดเล็กแสดงว่าการเน่าเสียมีผลต่อมวล
- สมมติว่าตัวแปรไดอะแฟรมและมวลมีการกระจายตัวตามปกติ
เนื่องจากมีการระบุว่าผลรวมของเส้นผ่านศูนย์กลางคือ 64.2 ซม. ดังนั้นจึงเป็นไปได้มากว่าผลไม้ทั้งสองมีขนาดใหญ่และสี่มีขนาดเล็ก ตอนนี้มี 3 กรณีสำหรับน้ำหนัก มีผลไม้เน่าขนาดเล็ก 2, 3 หรือ 4 ตัว ( ผลไม้ขนาดใหญ่ที่เน่าเสียไม่ส่งผลกระทบต่อมวลโดยการสันนิษฐาน ) ดังนั้นตอนนี้คุณสามารถรับน้ำหนักได้โดยการคำนวณค่าเหล่านี้
เราสามารถประมาณความน่าจะเป็นที่จะเกิดขึ้นสำหรับจำนวนของผลไม้เล็ก ๆ ที่เน่าเสีย เราใช้ความน่าจะเป็นในการประเมินน้ำหนักมวลของเราโดยขึ้นอยู่กับจำนวนผลไม้ที่เน่าเสีย:
samps <- 100000
stored_vals <- matrix(0,samps,2)
for(i in 1:samps){
numF <- 0 # Number of small rotten
numR <- 0 # Total number of rotten
# Pick 4 small fruits
for(j in 1:4){
if(runif(1) < (5/8)){ # Empirical proportion of small rotten
numF <- numF + 1
numR <- numR + 1
}
}
# Pick 2 large fruits
for(j in 1:2){
if(runif(1) < 1/5){# Empirical proportion of large rotten
numR <- numR + 1
}
}
stored_vals[i,] <- c(numF,numR)
}
# Pick out samples that had 4 rotten
fourRotten <- stored_vals[stored_vals[,2] == 4,1]
hist(fourRotten)
table(fourRotten)
# Proportions
props <- table(fourRotten)/length(fourRotten)
massBig <- mean(mass[diam>10])
massSmRot <- mean(mass[diam<10 & rotten == 1])
massSmOk <- mean(mass[diam<10 & rotten == 0])
weights <- 2*massBig + c(2*massSmOk+2*massSmRot,1*massSmOk+3*massSmRot,4*massSmRot)
Est_Mass <- sum(props*weights)
ให้เราประมาณการสุดท้ายของ691.5183g ฉันคิดว่าคุณต้องใช้สมมติฐานส่วนใหญ่ที่ได้ทำเพื่อให้ได้ข้อสรุป แต่ฉันคิดว่ามันเป็นไปได้ที่จะทำสิ่งนี้อย่างชาญฉลาด นอกจากนี้ฉันยังทดลองตัวอย่างเชิงประจักษ์เพื่อรับความน่าจะเป็นของจำนวนผลไม้เล็ก ๆ ที่เน่านั่นเป็นเพียงความเกียจคร้านและสามารถทำได้ "วิเคราะห์"