นี่คือตัวอย่างที่มีหมายเหตุ:
นี่คือบทความThe Bagplot: A Bivariate Boxplot
โดย Peter J. Rousseeuw, Ida Ruts และ John W. Tukey จากThe American Statistician
: http://venus.unive.it/romanaz/ada2/bagplot.pdf
จากนามธรรมของบทความนั้น:
"มัธยฐานเชิงลึก" คือตำแหน่งที่ลึกที่สุดและล้อมรอบด้วย "กระเป๋า" ที่มีการสังเกตการณ์ n / 2 ที่มีความลึกมากที่สุด การขยายกระเป๋าด้วยปัจจัย 3 จะทำให้“ รั้ว” (ซึ่งไม่ได้พล็อต) การสังเกตระหว่างถุงและรั้วนั้นมีการทำเครื่องหมายด้วยห่วงสีเทาอ่อนในขณะที่การสังเกตด้านนอกรั้วนั้นถูกทำเครื่องหมายเป็นค่าผิดปกติ Bagplot แสดงให้เห็นถึงตำแหน่งการแพร่กระจายความสัมพันธ์ความเบ้และส่วนท้ายของข้อมูล
นี่คือภาพประกอบของส่วนสำคัญ:
การสนทนาเพิ่มเติมสามารถพบได้ในต่อไปนี้:
จากเอกสารช่วยเหลือของaplpack
แพคเกจ (สำหรับR
ผู้ใช้):
Bagplot เป็นลักษณะทั่วไปของตัวแปรบ็อกซ์ล็อตที่รู้จักกันดี มันถูกเสนอโดย Rousseeuw, Ruts และ Tukey ในกรณี bivariate กล่องของ boxplot เปลี่ยนเป็นฮัลล์นูน, กระเป๋าของ bagplot ในกระเป๋ามี 50 เปอร์เซ็นต์ของคะแนนทั้งหมด รั้วแบ่งจุดในรั้วออกจากจุดภายนอก มันคำนวณได้โดยการเพิ่มถุง ห่วงถูกกำหนดให้เป็นรูปหลายเหลี่ยมนูนที่มีจุดทั้งหมดภายในรั้ว หากคะแนนทั้งหมดอยู่ในแนวเส้นตรงคุณจะได้รับ boxplot แบบคลาสสิก Bagplot () แผนการแปลงที่คล้ายกับที่อธิบายไว้ใน Rousseeuw et al ข้อสังเกต: ค่ามัธยฐานสองมิติเป็นค่าประมาณ มีปัญหาที่ทราบกันดีเกี่ยวกับชุดข้อมูลขนาดเล็ก (แต่ฉันคิดว่าไม่ควรทำการสรุป (กราฟิก) เช่น 10 คะแนน)
ในกรณีที่ผู้คนต้องการพล็อตถุง (ซ้อนทับหลายจุด) จะสะดวกถ้าแปลงเป็นแบบกึ่งโปร่งใส ด้วยเหตุผลนี้แฟล็กความโปร่งใสถูกเพิ่มเข้ากับคำสั่ง bagplot ถ้า transparent == TRUE เลเยอร์ alpha จะถูกตั้งค่าเป็น '99' (hex) สิ่งนี้ทำให้ bagplots ปรากฏแบบกึ่งโปร่งใส แต่เฉพาะเมื่ออุปกรณ์ส่งออกเป็น PDF และเปิดโดยใช้: pdf (file = "filename.pdf", version = "1.4") ด้วยเหตุผลนี้ค่าเริ่มต้นคือ transparent == FALSE คุณสมบัตินี้รวมถึงข้อโต้แย้งเพื่อระบุสีที่แตกต่างได้ถูกเสนอโดย Wouter Meuleman
และตัวอย่าง:
library(aplpack)
attach(mtcars)
bagplot(wt, mpg, xlab="Car Weight",
ylab="Miles Per Gallon",
main="Bagplot Example",
transparency = TRUE,
show.whiskers = FALSE,
# note that data a 'fence' separates inliers from outliers,
# and a 'loop' indicates the points outside the bag but
# inside the fence. In the 'bag' are 50 percent of all
# points
show.loophull = TRUE, # draw 'loop'?
show.baghull = TRUE) # draw 'bag'?
คำถามที่เกี่ยวข้อง: