การติดฉลาก boxplots ใน R


11

ฉันต้องการสร้าง boxplot โดยไม่มีแกนและเพิ่มลงในพล็อตปัจจุบัน (ROC curve) แต่ฉันต้องการเพิ่มข้อมูลข้อความเพิ่มเติมลงใน boxplot: เลเบลสำหรับ min และ max บรรทัดปัจจุบันของรหัสอยู่ด้านล่าง (กราฟปัจจุบันด้วย)

ขอบคุณมากสำหรับความช่วยเหลือ

boxplot(data, horizontal = TRUE, range = 0, axes=FALSE, col = "grey", add = TRUE)

อีกวิธีคือเพิ่มบรรทัดจาก 0 ถึง 1 (แทนแกน x) แต่ฉันต้องการให้ผ่านเส้นกลาง ... ตัวอย่างเช่นกราฟิกนี้

ป้อนคำอธิบายรูปภาพที่นี่

คำตอบ:


9

ฉันคิดว่าคุณจะพบสิ่งนี้สร้างสิ่งที่เหมือนแผนภาพวาดด้วยมือของคุณ

data    <- c(0.4, 0.7, 0.75, 0.82, 0.9)
endaxis <- c(0, 1)  # endpoints of axis
datamm  <- c(min(data), max(data))
boxplot(data, horizontal = TRUE, range = 0, ylim = endaxis,
                    axes = FALSE, col = "grey", add = FALSE)
arrows(endaxis, 1,  datamm, 1,  code = 1, angle = 90, length = 0.1)
valuelabels <- c(endaxis[1], round(fivenum(data)[2], digits = 2) ,
                 round(fivenum(data)[4], digits = 2), endaxis[2]  ) 
text(x = valuelabels, y = c(1.05, 1.25, 1.25, 1.05), labels = valuelabels)

R boxplot พร้อมป้ายกำกับค่า

อาจมีวิธีที่ดีกว่าในการทำมัน คุณอาจต้องปรับให้เข้ากับพล็อต ROC ของคุณรวมถึงการเปลี่ยนแปลงadd = FALSE


1
การตอบสนองของคุณดูเหมือนจะใกล้เคียงกับสิ่งที่ถามโดย OP (ดังนั้นฉันจึง +1) อย่างไรก็ตามฉันรู้สึกว่านี่ไม่ใช่ boxplot อีกต่อไปหรืออย่างน้อยมันก็หมดความสนใจในการมองหาค่าที่เป็นไปได้ จากบันทึกย่อคุณสามารถปรับแต่ง boxplot ได้มากขึ้นเล็กน้อย (ดูparsอาร์กิวเมนต์เพื่อลดอัตราส่วนของภาพ ( boxwex) และขนาดของหนวด ( staplewex)
chl

8

ลองทำสิ่งนี้เพื่อรุ่นสแตนด์อโลน:

bxp <- boxplot(rnorm(100), horizontal=TRUE, axes=FALSE)
mtext(c("Min","Max"), side=3, at=bxp$stats[c(1,5)], line=-3)

โปรดทราบว่าคุณสามารถรับข้อมูลบางอย่างเมื่อโทรboxplotโดยเฉพาะ "ห้าหมายเลข"

หากคุณต้องการให้วางทับกราฟิกอื่นให้ใช้add=Tแต่แทนที่mtextด้วยtext; คุณจะต้องตั้งค่า (ขึ้นอยู่กับวิธีที่คุณพล็อตกราฟิกอื่น ๆ )y

ตัวอย่างที่สมบูรณ์ยิ่งขึ้นได้รับโดยJohn Maindonald (รหัสควรอยู่บนเว็บไซต์ของเขา):

ป้อนคำอธิบายรูปภาพที่นี่


3

ปรับแต่งได้อย่างเต็มที่gplpl2 boxplot ...

#bootstrap
data <- data.frame(value=rnorm(100,mean = 0.5, sd = 0.2),group=0)
#processing
metaData <- ddply(data,~group,summarise,
            mean=mean(data$value),
			sd=sd(data$value),
            min=min(data$value),
			max=max(data$value),
            median=median(data$value),
			Q1=0,Q3=0
			)
bps <- boxplot.stats(data$value,coef=1.5) 
metaData$min <- bps$stats[1] #lower wisker
metaData$max <- bps$stats[5] #upper wisker
metaData$Q1 <- bps$stats[2] # 1st Quartile
metaData$Q3 <- bps$stats[4] # 3rd Quartile

#adding outliers
out <- data.frame() #initialising storage for outliers
if(length(bps$out) > 0){
	for(n in 1:length(bps$out)){
		pt <-data.frame(value=bps$out[n],group=0) 
		out<-rbind(out,pt) 
	}
}
#adding labels
labels <-data.frame(value=metaData$max, label="Upper bound")
labels <-rbind(labels,data.frame(value=metaData$min, label="Lower bound"))
labels <-rbind(labels,data.frame(value=metaData$median, label="Median"))
labels <-rbind(labels,data.frame(value=metaData$Q1, label="First quartile"))
labels <-rbind(labels,data.frame(value=metaData$Q3, label="Third quartile"))

#drawing
library(ggplot2)
p <- ggplot(metaData,aes(x=group,y=mean))
p <- p + geom_segment(aes(x=c(0.1,0,0.1),y=c(0,0,1),xend=c(0,0,-0.1),yend=c(0,1,1)))
p <- p + geom_text(aes(y=c(0,1),label=c(0,1),x=0.2))
p <- p + geom_errorbar(aes(ymin=min,ymax=max),linetype = 1,width = 0.5) #main range
p <- p + geom_linerange(aes(ymin=min,ymax=max),linetype = 1,width = 0, color="white")# white line range
p <- p + geom_linerange(aes(ymin=min,ymax=max),linetype = 2)    #main range dotted
p <- p + geom_crossbar(aes(y=median,,ymin=Q1,ymax=Q3),linetype = 1,fill='white') #box
if(length(out) >0) p <- p + geom_point(data=out,aes(x=group,y=value),shape=4) # drawning outliers if any
p <- p + scale_x_discrete(breaks=c(0))
p <- p + scale_y_continuous(name= "Value")
p <- p + geom_text(data=labels,aes(x=0.5,y=value,label=round(value,2)),colour="black",angle=0,hjust=0.5, vjust=0.5,size=3)

p <- p + opts(panel.background = theme_rect(fill = "white",colour = NA)) 
p <- p + opts(panel.grid.minor = theme_blank(), panel.grid.major = theme_blank())
p <- p + opts(axis.title.x=theme_blank())
p <- p + opts(axis.text.x = theme_blank())
p <- p + opts(axis.title.y=theme_blank())
p <- p + opts(axis.text.y = theme_blank())

p + coord_flip()

ผลลัพธ์:

ป้อนคำอธิบายรูปภาพที่นี่

... code อาจจะดูน่าเกลียดไปหน่อย


2

นี่คือการดำเนินการตามแนวทางแก้ไขปัญหาของคุณ ฉันตัดสินใจที่จะไม่แมปค่าเฉลี่ยมีพื้นที่เหลือไม่มาก เส้นจาก 0 ถึง 1 ก็ดูแปลกด้วย ขอบคุณมากทุกคน

data <- read.table("roc_average.txt")
bxp <- boxplot(data, horizontal = TRUE, range = 0, axes = FALSE, col = "grey", add = TRUE, at = 0.2, varwidth=FALSE, boxwex=0.3)
valuelabels <- c(round(fivenum(data)[2], digits = 2), round(fivenum(data)[4], digits = 2))
text(x = valuelabels, y = c(0.35, 0.35), labels = valuelabels, font = 2)
mtext(c(min(round(data, digits = 2)),max(round(data, digits = 2))), side=1, at=bxp$stats[c(1,5)], line=-3, font = 2)

เส้นโค้ง roc พร้อมพล็อตกล่อง


boxplot ควรสรุป AUC หรือไม่ หากเป็นเช่นนั้นเหตุใดค่าต่ำสุด = 0.5 คืออะไร
chl

ดูเหมือนว่าแปลกเพราะ ROC หลายรายการควรต่ำกว่า 0.5 กำลังขุดสิ่งผิดปกติ ...
Vladimir Chupakhin

นั่นคือประเด็นที่ฉันได้กลับ ROC AUC สำหรับค่าที่ต่ำกว่า 0.5 ดังนั้นกราฟิกควรจะจัดแจงใหม่ ขอบคุณมาก!
Vladimir Chupakhin

+1 เมื่อกลับมาฉันกำลังรอการอัปเดตของคุณ หากคุณกำลังทำงานกับลักษณนามที่แตกต่างกันคุณอาจมีลักษณะที่ROCR
chl

ฉันทำ ROC ด้วย ROCR
Vladimir Chupakhin
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.