โดยทั่วไปแล้วผู้ที่ไม่ใช่นักสถิติจะเข้าใจ Barchart ที่ซ้อนกันได้ดี มันมีประโยชน์ในการไต่พวกมันบนตัวชี้วัดทั่วไป (เช่น 0-100%) ด้วยสีที่ค่อยเป็นค่อยไปสำหรับแต่ละหมวดหมู่หากสิ่งเหล่านี้เป็นรายการลำดับ (เช่น Likert) ฉันชอบdotchart (Cleveland dot plot) เมื่อไม่มีรายการมากเกินไปและไม่เกิน 3-5 หมวดหมู่การตอบกลับ แต่มันเป็นเรื่องของภาพที่ชัดเจน ฉันมักจะให้% เนื่องจากเป็นการวัดที่ได้มาตรฐานและรายงานทั้ง% และจำนวนด้วย barchart ที่ไม่ได้ซ้อนเท่านั้น นี่คือตัวอย่างของสิ่งที่ฉันหมายถึง:
data(Environment, package="ltm")
Environment[sample(1:nrow(Environment), 10),1] <- NA
na.count <- apply(Environment, 2, function(x) sum(is.na(x)))
tab <- apply(Environment, 2, table)/
apply(apply(Environment, 2, table), 2, sum)*100
dotchart(tab, xlim=c(0,100), xlab="Frequency (%)",
sub=paste("N", nrow(Environment), sep="="))
text(100, c(2,7,12,17,22,27), rev(na.count), cex=.8)
mtext("# NA", side=3, line=0, at=100, cex=.8)
การแสดงผลที่ดีกว่าจะประสบความสำเร็จด้วยหรือlattice
ggplot2
รายการทั้งหมดมีหมวดหมู่การตอบสนองที่เหมือนกันในตัวอย่างนี้ แต่โดยทั่วไปเราอาจคาดหวังว่าจะแตกต่างกันดังนั้นการแสดงทั้งหมดจะไม่ซ้ำซ้อนเหมือนในกรณีนี้ อย่างไรก็ตามเป็นไปได้ที่จะให้สีเดียวกันกับแต่ละหมวดหมู่การตอบสนองเพื่อความสะดวกในการอ่าน
แต่ฉันจะบอกว่าบาร์โค้ดแบบเรียงซ้อนดีกว่าเมื่อทุกรายการมีหมวดหมู่การตอบสนองเหมือนกันเพราะพวกเขาช่วยชื่นชมความถี่ของการตอบสนองแบบหนึ่งต่อรายการ:
ฉันยังสามารถนึกถึงแผนที่ความร้อนบางประเภทซึ่งมีประโยชน์หากมีหลายรายการที่มีหมวดหมู่การตอบสนองที่คล้ายกัน
การตอบสนองที่ขาดหายไป (โดยเฉพาะเมื่อไม่ควรมองข้ามหรือแปลเป็นภาษาท้องถิ่นสำหรับรายการ / คำถามที่เฉพาะเจาะจง) ควรได้รับการรายงานโดยเฉพาะอย่างยิ่งสำหรับแต่ละรายการ โดยทั่วไปแล้ว% ของการตอบกลับสำหรับแต่ละหมวดหมู่จะคำนวณโดยไม่มี NA นี่คือสิ่งที่มักจะทำในการสำรวจหรือ psychometrics (เราพูดถึง "แสดงออกหรือตอบสนองการตอบสนอง")
PS
ฉันสามารถคิดสิ่งแฟนซีมากขึ้นเช่นภาพที่แสดงด้านล่าง (คนแรกที่ถูกสร้างขึ้นมาด้วยมือที่สองคือจากggplot2
, ggfluctuation(as.table(tab))
) แต่ฉันไม่คิดว่ามันถ่ายทอดเป็นข้อมูลที่ถูกต้องเป็น dotplot หรือ barchart ตั้งแต่รูปแบบพื้นผิวเป็นเรื่องยากที่จะ ซาบซึ้ง