เส้นตารางและพื้นหลังสีเทาเป็นแผนภูมิที่ไม่ปลอดภัยและควรใช้เป็นข้อยกเว้นเท่านั้นหรือไม่


26

ดูเหมือนว่าหน่วยงานส่วนใหญ่เห็นด้วยว่าเส้นกริดที่มืดหรือโดดเด่นในแปลงนั้นเป็น "chartjunk" โดยคำจำกัดความที่สมเหตุสมผลและเบี่ยงเบนความสนใจของผู้ชมจากข้อความในเนื้อความหลักของแผนภูมิ ดังนั้นฉันจะไม่รำคาญที่จะให้การอ้างอิงในจุดนั้น

เราทุกคนสามารถตกลงกันได้ว่าจะมีบางครั้งที่เส้นตารางสีซีดในการสร้างข้อมูลอ้างอิงสำหรับผู้ชมจะมีความจำเป็น Tufte ที่ถกเถียงกันอยู่ต้องใช้ (และใช้) เส้นตารางเป็นครั้งคราวตามที่ออกมาชี้ในบทความนี้ และฉันเห็นด้วยกับแนวทางของ Hadley Wickham ใน ggplot2 เพื่อทำให้เส้นตารางดังกล่าวเป็นสีขาวบนพื้นหลังสีเทาอ่อนเมื่อคุณจำเป็นต้องใช้มัน

สิ่งที่ฉันไม่แน่ใจเกี่ยวกับอย่างไรก็ตามคือว่าเส้นตารางและพื้นหลังสีเทาควรเป็นค่าเริ่มต้นตามที่อยู่ใน ggplot2 ตัวอย่างเช่นดูเหมือนว่าจะไม่มีเหตุผลสำหรับพื้นหลังสีเทานอกเหนือจากกรณีเส้นกริดสีขาวในการบรรเทา - ซึ่งเพิ่มเติม begs คำถามที่ว่าทั้งสองเป็นสิ่งจำเป็น ฉันเพิ่งเริ่มใช้ ggplot2 สำหรับความต้องการด้านกราฟิกส่วนใหญ่ของฉันและคิดว่ามันยอดเยี่ยม แต่มันได้ท้าทายวิธีการ "ไม่มีกล่องไม่มีพื้นหลังไม่มีเส้นตาราง" ของฉันกับกราฟิกที่ฉันใช้มาก่อน ฉันเคยคิดว่าgridlines=OFFควรจะเป็นค่าเริ่มต้นของฉันเว้นแต่จะมีเหตุผลเฉพาะสำหรับการเพิ่มพวกเขา - โดยทั่วไปวิธีการที่แนะนำในบทความนี้เช่น

แน่นอนว่ามันเป็นเรื่องตรงไปตรงมาที่จะกำหนดธีมใน ggplot2 เพื่อหลีกเลี่ยง gridlines และ background shading (และอันที่จริงแล้วเราได้ทำสิ่งนี้ในที่ทำงานของฉัน) แต่วิธีของ ggplot2 นั้นยอดเยี่ยมมากและโดยทั่วไปแล้ว ฉันขาดอะไรไป

ดังนั้น - ฉันจะขอบคุณสำหรับการอ้างอิงใด ๆ ในจุดนี้ ฉันแน่ใจว่ามันถูกคิดอย่างดีผ่าน (เช่นโดย Hadley Wickham ในการตั้งค่าเริ่มต้น ggplot2) และฉันเปิดกว้างมากที่จะชี้ไปในทิศทางที่ถูกต้อง สิ่งที่ดีที่สุดที่ฉันสามารถหาได้คือลิงค์ในกลุ่ม Google ggplot2 แต่การอ้างอิงที่เป็นประโยชน์มากที่สุดของ Cleveland ไม่สามารถหาได้จากลิงค์ที่ให้ไว้


7
โดยส่วนตัวแล้วฉันชอบเส้นกริด (จาง ๆ ) ด้วยเหตุผลที่ชัดเจน - เพื่อให้ง่ายต่อการประเมินค่าที่เกี่ยวข้องกับคะแนนในพล็อต
mark999

7
จากหน้า 141 จากหนังสือของ Hadley: "เรายังสามารถเห็นเส้นกริดเพื่อช่วยในการตัดสินตำแหน่ง (คลีฟแลนด์, 1993b) แต่พวกเขามีผลกระทบต่อภาพเพียงเล็กน้อยและเราสามารถ" ปรับ "พวกเขาออกได้พื้นหลังสีเทาให้เนื้อเรื่องคล้ายกัน (ในแง่ของการพิมพ์) กับส่วนที่เหลือของข้อความเพื่อให้แน่ใจว่ากราฟิกที่สอดคล้องกับการไหลของข้อความโดยไม่ต้องกระโดดออกมาพร้อมกับพื้นหลังสีขาวสว่างในที่สุดพื้นหลังสีเทาสร้างสนามต่อเนื่องของสีซึ่งทำให้มั่นใจว่าพล็อต ถูกมองว่าเป็นภาพเอนทิตี้เดียว "
mark999

4
Andrew Gelman ทำบล็อกเป็นจำนวนมากบนอินโฟกราฟิกในหลอดเลือดดำที่คล้ายกัน โดยส่วนตัวแล้วฉันคิดว่าชาร์ตที่ไม่มีเส้นอ้างอิงใด ๆ นั้นแย่พอ ๆ กับความหนาและความว้าวุ่นใจ มีสไตล์และเท่ห์กว่า แต่ก็ยังรบกวนความเข้าใจและความสามารถของเราในการเจาะลึกข้อมูล ความคิดนี้ไม่ได้เป็นความเรียบง่ายราวกับว่าเราทุกคนเป็นนักออกแบบเฟอร์นิเจอร์สแกนดิเนเวีย แต่ต้องสื่อสารอย่างชัดเจนซึ่งควรมีบรรทัดอ้างอิงที่ละเอียดอ่อน (แต่มีประโยชน์)
Wayne

3
ฉันสังเกตเห็นว่ามีการอภิปรายที่ดีมากมายที่นี่ แต่ทั้งหมดในความคิดเห็น - ฉันสงสัยว่าจะให้คำตอบที่เป็นทางการได้ในระดับใด - ฉันสงสัยว่าคำถามนี้จะดีที่สุดในฐานะ CW แล้วเราจะย้าย (และทำอย่างละเอียด ) ความเห็นที่ดีเหล่านี้เป็นคำตอบ
gung - Reinstate Monica

1
ฉันได้เพิ่มคำตอบในการเขียนความคิดเห็นและแปลงเป็นวิกิชุมชน
Peter Ellis

คำตอบ:


15

สิ่งหนึ่งที่อาจช่วยให้การถกเถียงกันไปข้างหน้าคือการยอมรับสิ่งที่ทำให้ผู้คนเห็นความแตกต่างระหว่างพื้นหลังและเบื้องหน้าการเรียนบทเรียนจากการทำแผนที่และนำไปใช้กับกราฟิกเชิงสถิติทั่วไปมากขึ้น

ในตอนแรกผู้คนอาจคิดว่าสีเป็นสัญญาณที่ดีว่าวัตถุใดวัตถุหนึ่งอยู่ในเบื้องหน้าหรือพื้นหลัง แต่ไม่ใช่ในกรณีนี้ ยกตัวอย่างจากตัวอย่างด้านล่างซึ่งนำมาจากบล็อกของ ESRI สร้างแผนที่ผู้คนที่ต้องการดู: ห้าหลักการออกแบบหลักสำหรับการทำแผนที่โดย Aileen Buckley

ความสับสนเบื้องหน้า

ดังนั้นถ้าฉันขอให้คุณบอกว่ารูปใด (เช่นมวลที่ดิน) และอันใดที่เป็นพื้นดิน (เช่นแหล่งน้ำ) คุณจะเลือกอันไหน ฟีนอแนนที่คล้ายกันก็เกิดขึ้นกับภาพลวงตาของแจกัน Rubin

การวิจัยเชิงทดลองบางอย่างฉันจำได้ว่าอ่านในวิธีการทำงานของแผนที่ของ Alan MacEachren แสดงให้เห็นว่าในภาพด้านบนผู้คนเลือกบริเวณที่มีแสงสว่างและความมืดที่ความถี่เท่ากันสำหรับตัวเลข (เห็นได้ชัดว่า ดังนั้นสีจึงไม่สามารถแยกแยะได้ว่าพื้นหลังแข่งขันกับเบื้องหน้าในกราฟิกสถิติใด ๆ หรือไม่ แต่ตัวชี้นำอื่นสามารถช่วยได้

ผู้คนมักจะเชื่อมโยงตัวเลขเป็นวัตถุที่ถูกปิดล้อม (นี่เป็นส่วนหนึ่งของเหตุผลที่แผนที่ด้านบนสับสนเนื่องจากไม่ได้ปิดกั้นมวล) สิ่งนี้แนะนำโดยทั่วไป (ไม่คำนึงถึงสีพื้นหลัง) องค์ประกอบในพล็อตควรมีขอบเขตที่ชัดเจนและองค์ประกอบในพล็อตควรมีสีเข้มกว่าพื้นหลัง นี่อาจเป็นอคติพื้นหลังพล็อตพฤตินัยเป็นสีขาว แต่การมีพื้นหลังสีเทานั้นไม่เป็นอันตราย ด้านอื่น ๆ สามารถใช้ในการวิเคราะห์ระหว่างพื้นหน้าและพื้นหลัง (โพสต์บล็อก ESRI กล่าวถึงบางส่วนของเหล่านี้)

หนึ่งคือเงาวางของ Excel ที่น่ารังเกียจสำหรับกราฟิก ( ตัวอย่างที่กำหนดไว้ในจดหมายข่าวนี้โดย Dan Carr ในรูปที่ 2) แม้ว่ามันควรจะมาพร้อมกับข้อแม้ที่คนอาจตีความคุณลักษณะตัวเลขที่ตำแหน่งของเงาแทนองค์ประกอบที่ตั้งใจไว้

อีกวิธีหนึ่งคือการใช้สี / ความอิ่มตัวที่แตกต่างกันสำหรับโครงร่างขององค์ประกอบในพล็อตกับการเติมภายใน ตัวอย่างได้รับด้านล่างโดยมีวงกลมด้านซ้ายสุดเป็นตัวอย่างของขอบเขตที่ไม่ชัดเจน

เติม vs เค้าร่าง

สิ่งเหล่านี้ดูเหมือนจะไม่ครบถ้วนสมบูรณ์เช่นกัน สำหรับพล็อตบรรทัดมันมักปรากฏว่าเส้นที่หนาขึ้นมาเบื้องหน้าในขณะที่เส้นที่บางกว่าจะลดลงเป็นพื้นหลัง

นี่เป็นจุดประสงค์หลักเพียงเพื่อเป็นอาหารสำหรับความคิด: การศึกษาด้วยตนเองของคุณดูเหมือนจะค่อนข้างละเอียดถี่ถ้วน (และฉันขอขอบคุณสำหรับแหล่งข้อมูลที่คุณให้ไว้!) ฉันไม่คิดว่าฉันไม่เห็นด้วยกับทรัพยากรที่คุณจัดหา แต่ฉันไม่แน่ใจว่าฉันคร่ำครวญสิ่งที่ Hadley กำลังพูดถึงด้วยแรงจูงใจของเขาสำหรับพื้นหลังสีเทาเริ่มต้น แต่ความพึงพอใจส่วนบุคคลสำหรับพื้นหลังสีเทาสามารถทำได้โดยตรวจสอบให้แน่ใจว่าองค์ประกอบในพล็อตมาที่เบื้องหน้า (นั่นคือสิ่งที่สำคัญจริงๆ) บทเรียนเหล่านี้สามารถใช้กับกริดไลน์ได้เช่นกันและหากกริดไลน์ช่วยและไม่สร้างความรำคาญ (เช่นในแบ็คกราวน์) แน่นอนว่าพวกเขาไม่ใช่ชาร์ทขยะ


5
ฉันไม่คิดว่าคำถามหลักคือการแยกความแตกต่างระหว่างพื้นหลังและเบื้องหน้า - ฉันคิดว่ามันค่อนข้างตรงไปตรงมา ความท้าทายที่แท้จริงคือการสร้างกราฟิกในวิธีที่ทำให้ง่ายและแม่นยำที่สุดเท่าที่จะเป็นไปได้เพื่อทำการเปรียบเทียบที่คุณสนใจในเส้นตารางประสบการณ์ของฉันทำให้ง่ายต่อการอ่านและเปรียบเทียบค่า - แม้ว่าฉันจะไม่ มีการทดลองอย่างเป็นทางการเพื่อสำรองข้อมูลนี้ด้วย
hadley

@Hadley ฉันเอาไปร้องเรียนว่า (หลัก) เกี่ยวกับพื้นหลังสีเทา (และเส้นตาราง) คือว่าพวกเขาเสือกว่าพวกเขาแข่งขันเพื่อขอความสนใจกับองค์ประกอบข้อมูลจริงในพล็อต สิ่งนี้สำหรับฉันแสดงให้เห็นความสับสนเบื้องหน้า / พื้นหลัง สมมติฐานของฉันอาจผิดเช่นกัน (อาจเป็นเพราะเหตุผลทางสุนทรียะล้วน ๆ ที่ผู้คนชอบหรือไม่ชอบ) การแยกความแตกต่างระหว่างพื้นหน้ากับฉากหลังอาจจะตรงไปตรงมา แต่ฉันไม่คิดว่ามันเป็นความรู้ทั่วไปดังนั้นฉันหวังว่าโพสต์ของฉันจะมีประโยชน์ในเรื่องที่เกี่ยวกับเรื่องนั้น
Andy W

11

ศาสตราจารย์วิคแฮมเขียนในหนังสือ ggplot2:

"เรายังสามารถเห็นเส้นกริดเพื่อช่วยในการตัดสินตำแหน่ง (คลีฟแลนด์, 1993b) แต่พวกเขามีผลกระทบต่อภาพเพียงเล็กน้อยและเราสามารถ" ปรับ "พวกเขาออกได้พื้นหลังสีเทาให้พล็อตสีคล้ายกัน ) ไปยังส่วนที่เหลือของข้อความเพื่อให้แน่ใจว่ากราฟิกสอดคล้องกับการไหลของข้อความโดยไม่ต้องกระโดดออกมาพร้อมกับพื้นหลังสีขาวสว่างในที่สุดพื้นหลังสีเทาจะสร้างฟิลด์ต่อเนื่องของสีซึ่งทำให้มั่นใจได้ว่าพล็อตนั้น เอนทิตีที่มองเห็น "

และ @Wayne เขียนว่า:

"โดยส่วนตัวแล้วฉันคิดว่าชาร์ตที่ไม่มีเส้นอ้างอิงใด ๆ จะแย่ไปกว่าเส้นตารางที่หนาและดูดีมีสไตล์และเจ๋งกว่า แต่ยังรบกวนความเข้าใจและความสามารถของเราในการเจาะลึกลงไปในข้อมูล เป็นนักออกแบบเฟอร์นิเจอร์สแกนดิเนเวียนทุกคน แต่ต้องสื่อสารอย่างชัดเจนซึ่งควรรวมถึงบรรทัดอ้างอิงที่ละเอียดอ่อน (แต่มีประโยชน์)

และ @Peter Flom เขียนว่า:

ฉันคิดว่าเส้นตารางจาง ๆ ควรเป็นค่าเริ่มต้นในสแกตเตอร์ล็อต พวกเขาช่วยผู้อ่าน ในทำนองเดียวกันช่องว่างระหว่างคำและบรรทัดในข้อความช่วยให้ผู้อ่าน แต่ฉันไม่ชอบพื้นหลังสีเทา ฉันพบว่ามันเสียสมาธิ ข้อความหลังจากทั้งหมดมักจะเป็นตัวอักษรสีดำบนพื้นหลังสีขาว


3

ในขณะที่ฉันมักจะหลีกเลี่ยงพื้นหลังสีเทาที่เป็นค่าเริ่มต้นบางทีเหตุผลหนึ่งที่ Hadley อาจใช้กับสีเทาคืออนุญาตให้ผู้ใช้ใช้สีที่สว่างและอิ่มตัวมากขึ้นในการแสดงข้อมูลซึ่งอาจไม่ปรากฏว่ามีประสิทธิภาพเมื่อใช้พื้นหลังสีขาว


นี่เป็นจุดประสงค์ของคำตอบสำหรับคำถามของ OP ความคิดเห็นที่ขอคำชี้แจงจาก OP หรือหนึ่งในผู้ตอบหรือคำถามใหม่ของคุณเองหรือไม่ โปรดใช้ฟิลด์ "คำตอบของคุณ" เพื่อให้คำตอบสำหรับคำถามเดิม คุณจะสามารถแสดงความคิดเห็นได้ทุกที่เมื่อชื่อเสียงของคุณคือ> 50 หากคุณมีคำถามใหม่ให้คลิกที่สีเทาASK QUESTION ที่ด้านบนของหน้า & ถามที่นั่นเราจะช่วยคุณได้อย่างถูกต้อง
gung - Reinstate Monica

2
ฉันคิดว่านี่เป็นคำตอบสำหรับคำถามอย่างน้อยบางส่วน: มีการสนทนากันที่นี่ว่าพื้นหลังสีเทาเป็นขยะของแผนภูมิหรือไม่และเหตุผลบางอย่างที่แนะนำว่าทำไมอาจไม่
Silverfish

0

ส่วนตัวผมชอบ theme_bw มืด-on-แสงหรือแม้กระทั่ง theme_minimal เพื่อรูปแบบเริ่มต้นของ ggplot2 - ดูhttp://docs.ggplot2.org/current/ggtheme.html

ธีมเริ่มต้น

ฉันพบพื้นหลังสีเทาในชุดรูปแบบเริ่มต้นที่ทำให้เสียสมาธิอย่างมาก - ดวงตาของฉันถูกดึงดูดไปยังบล็อกสีเทาแทนที่จะเป็นจุด เกิดขึ้นกับคนอื่นหรือไม่? ตัวอย่างเช่นในพล็อตของเล่นด้านบนดวงตาของฉันมักถูกวาดที่ด้านล่างขวา (ที่ไม่มีดาต้าพอยน์)

(มันจะไม่น่าสนใจที่จะเห็นการบันทึกการติดตามสายตาของคนดูแปลงเหล่านี้?)

ส่วนตัวฉันชอบสิ่งนี้:

ชุดรูปแบบมืดบนไฟ

... แต่มันเป็นเรื่องส่วนตัวฉันไม่คิดว่าควรมีกฎเดียวที่ทุกคนต้องปฏิบัติตาม

รหัสสำหรับแปลงเหล่านี้:

library(ggplot2)

n <- 100
df <- data.frame(x=runif(n, max=10), epsilon=rnorm(n))
df$y <- 2 + df$x - 0.05*df$x^2 + df$epsilon

p1 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       ggtitle("Default Theme"))
ggsave("default_theme_example.png", p1, width=10, height=8)

p2 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       theme_bw() +
       theme(panel.border=element_blank()) +
       ggtitle("Custom Theme"))
ggsave("custom_theme_example.png", p2, width=10, height=8)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.