อะไรคือกฎสำคัญในการออกแบบและสร้างแปลง?


19

พื้นหลัง:

ก่อนหน้านี้เกี่ยวกับการตรวจสอบข้ามเรามีคำถามเกี่ยวกับ:

@davidแนะนำโดยในการแสดงความคิดเห็นต่อคำถามนี้ว่าเราควรมีคำถามวิกิชุมชนที่มีกฎการสร้างภาพข้อมูลหนึ่งข้อต่อคำตอบที่ชุมชนสามารถลงคะแนนได้

คำถาม

อะไรคือกฎสำคัญในการออกแบบและสร้างข้อมูลกราฟิก?

กฎระเบียบ

  • หนึ่งกฎต่อคำตอบ
  • เป็นการดีที่ควรรวมคำอธิบายสั้น ๆ ว่าทำไมคุณคิดว่าเป็นความคิดที่ดี
  • คำตอบที่มีตัวอย่าง (รหัสและภาพ) ของการปฏิบัติที่ดีและไม่ดีที่ต้องการ

คำตอบ:


13

เนื้อหาเหนือแบบฟอร์ม : เลือกพล็อตสไตล์การระบายสีหรือพารามิเตอร์กราฟิกอื่น ๆ ที่เหมาะสมเพื่อแสดงสิ่งที่คุณต้องการให้พล็อตแสดงแทนที่จะเป็นแพ็คเกจกราฟที่คุณต้องการ


8
(+1) ฉันมักชอบวาดกราฟบนกระดาษก่อนเพื่อลดโอกาสที่การตัดสินใจออกแบบของฉันจะถูกชี้นำโดยเส้นทางที่มีความต้านทานน้อยที่สุดที่สร้างโดยซอฟต์แวร์กราฟ
Jeromy Anglim

13

การทำความคุ้นเคยกับสามมิติของสีจะมีประโยชน์ หากคุณใช้หลายสีพวกเขาควรจะมีความแตกต่างกันในหลายมิติไม่ใช่แค่หนึ่งสี

ราคา. กราฟควรอ่านได้แม้เป็นขาวดำ กฎง่าย ๆ นี้ควรคำนึงถึงการตาบอดสีเครื่องพิมพ์คุณภาพต่ำและสภาพแสงไม่ดี แม้ว่าคุณจะใช้เฉดสีที่แตกต่างกันตรวจสอบให้แน่ใจว่าค่าต่างกันพอสมควร โดยเฉพาะอย่างยิ่งแปลงควรมีสีเข้มบนพื้นหลังสีอ่อน (หรือด้านตรงข้าม) แต่ไม่เป็นสีเทาบนค่าสีเทา ตัวอย่างที่เลวร้ายที่สุดคือพล็อตสีน้ำเงินของพื้นหลังสีแดง - ทั้งคู่เป็นค่ากลางนั่นคือจะให้สีเทาคล้ายกันมากหลังจากการแปลงเป็นขาวดำ

ความอิ่มตัว ควรใช้ความอิ่มตัวด้วยการกลั่นกรอง: เส้นสีแดงบริสุทธิ์อาจใช้ได้ แต่เส้นสีแดงที่อิ่มตัวและหนาน้อยจะสามารถอ่านได้มากขึ้น (ความหนาที่เพิ่มขึ้นช่วยแยกความแตกต่างของสีและช่วยให้คุณลดความอิ่มตัว) ในทางตรงกันข้ามพื้นที่สีแดงบริสุทธิ์นั้นเจ็บปวดที่จะมองดู: อย่าใช้สีอิ่มตัวเพื่อเติมเต็มพื้นที่ บรูเออร์จานสี (ออกแบบมาสำหรับแผนที่ไม่ได้แปลงบรรทัด) ตัวอย่างให้เลือกสีของต่ำอิ่มตัว ตัวอย่างที่เลวร้ายที่สุดคือพื้นหลังอิ่มตัวอีกครั้ง (สีน้ำเงินเป็นสีแดงหรือแดงน้ำเงิน)

สี ดังที่ @gung หลีกเลี่ยงการผสมสีแดง / เขียว (สัญญาณไฟจราจร): มีคนตาบอดสีมากกว่าที่คุณคิด โดยเฉพาะอย่างยิ่งกับเว้น้อยกว่ามาก ตัวอย่างเช่นการพล็อตค่า "เบี่ยงเบน" (เช่นปริมาณที่สามารถบวกหรือลบได้) ให้ใช้เพียงสองเฉดสี (สำหรับค่าบวกและค่าลบ) เพื่อให้ผู้อ่านสามารถแยกแยะสิ่งที่สูงและต่ำได้ทันที การใช้การไล่ระดับสีแบบไม่ต่อเนื่องสามารถส่งผลให้พล็อตที่สามารถอ่านได้มากขึ้น: ขอบเขตระหว่างสีจะปรากฏให้เห็นและสร้างพล็อตรูปร่าง

คุณอาจต้องการอ่านกฎการปฏิบัติของ S. Few สำหรับการใช้สีในแผนภูมิ หรืออ้างถึงเนื้อหาเกี่ยวกับ "ทฤษฎีสี" สำหรับนักศึกษาศิลปะหรือการออกแบบ


+1, ข้อมูลดีที่นี่ จุดของคุณเกี่ยวกับคุณค่าและสีที่จะแสดงหลังจากแปลงเป็นขาวดำนั้นดีเป็นพิเศษ ลิงค์ไปยัง Few paper นั้นมีประโยชน์เช่นกัน One note: ที่ดีที่สุดคืออย่าอ้างถึงคำตอบอื่น ๆ ว่า "เหนือ" ให้ใช้ @ so-and-so แทน คำตอบนั้นขึ้นอยู่กับจำนวนโหวตที่ได้รับ
gung - Reinstate Monica

11

วางข้อมูลที่จำเป็นมากไว้ในรูปของมันเอง ไม่ต้องการให้ผู้อ่านอ้างอิงคำบรรยายภาพเช่นเพื่อระบุความหมายของสัญลักษณ์หรือสีต่าง ๆ วางข้อมูลใด ๆ (หรือข้อมูลเสริม) ที่ไม่สามารถเข้าไปในรูปได้ในคำบรรยาย แนวคิดคือการลดความพยายามที่ผู้ดูกราฟต้องการเพื่อดึงข้อมูลที่เกี่ยวข้อง - ที่ดีที่สุด: กราฟเป็นคำอธิบายที่ดีที่สุดถัดไป: ข้อมูลเพิ่มเติมที่ต้องการสามารถรวบรวมได้จากคำบรรยายภาพที่แย่ที่สุด: ผู้ดูต้องอ่านอย่างใกล้ชิด ส่วนผลลัพธ์ทั้งหมดค้นหารายละเอียดที่สำคัญเพื่อค้นหาว่าเกิดอะไรขึ้น


1
+1 และเราสามารถขยายแนวคิดนี้ต่อไป: เราต้องการทำให้เป็นเช่นนั้นผู้คนสามารถเห็นกราฟและรู้ (มากที่สุด) สิ่งที่เกิดขึ้นโดยไม่ต้องอ่านคำบรรยายภาพและเมื่อพวกเขาต้องการข้อมูลเพิ่มเติม มีอยู่ในคำบรรยายใต้ภาพเพื่อให้ผู้คนสามารถอ่านคำบรรยายใต้ภาพและรู้ว่าสิ่งที่พวกเขาต้องการโดยไม่ต้องอ่านผ่านกระดาษเพื่อค้นหารายละเอียดที่สำคัญอย่างหนึ่ง
gung - Reinstate Monica

1
@gung เนื่องจากนี่คือ CW โปรดแก้ไขคำตอบเพื่อแสดงความคิดเห็นของคุณ
David LeBauer

10

ทำพล็อตให้ง่ายที่สุด ในคำพูดของ Tufte 'ลดอัตราส่วนข้อมูล - หมึก'

ตัวอย่างเช่นหลีกเลี่ยง:

  • สีหรือรูปร่างมากกว่าที่จำเป็น
  • ทำเครื่องหมายมากกว่าที่จำเป็น
  • เอฟเฟกต์ 3 มิติในพล็อต 2-D
  • ใช้คำอธิบายแผนภูมิเมื่อวัตถุสามารถติดป้ายกำกับได้โดยตรง

ฉันไม่เห็นด้วยกับ Tufte ที่นี่ ข้อแรกส่วนใหญ่ของแรงจูงใจสำหรับกฎนี้ในหนังสือต้นฉบับของเขาคือเวลาเท่าไหร่ที่คุณต้องใช้เวลาในการวาดเส้นพิเศษและไม่จำเป็น แต่วันนี้ไม่เกี่ยวข้องเลย ประการที่สองความคิดที่แท้จริงนั้นถูกจับได้ดีกว่าโดยกฎของคลีฟแลนด์เพื่อเพิ่มความมีชีวิตชีวาของกราฟิกเนื่องจากบางครั้งพล็อตสามารถให้ข้อมูลได้มากขึ้นด้วยหมึกมากขึ้น
gung - Reinstate Monica

@gung ความพยายาม / เวลาที่ต้องการนำเสนอเป็นแรงบันดาลใจจาก Tufte ฉันจำส่วนนี้ไม่ได้ (แต่ฉันไม่มีข้อความที่มีประโยชน์)
David LeBauer

1
ฉันไม่ได้ทำมัน แต่ในVisual Book เล่มที่ 1 ของฉันฉันจำได้ว่าเขาพูดถึงกี่ครั้งที่คุณต้องวางไม้บรรทัดเพื่อวาดกราฟ บางที "ใหญ่" อาจเป็นการพูดเกินจริง แต่ฉันจำได้ว่าอ่านและคิดว่า 'ใครสนใจในตอนนี้?' ในองค์ประกอบคลีฟแลนด์สร้างข้อโต้แย้งที่น่าเชื่อถือว่ากฎของ Tufte นั้นผิดพลาด เขาระบุว่าประเด็นคือเพื่อเพิ่มการถ่ายโอนข้อมูลให้มากที่สุดและแสดงให้เห็นว่าหลักการนี้ยังช่วยกำจัดสิ่งที่ Tufte ไม่ชอบ แต่ช่วยให้ในกรณี (ซึ่งเขาแสดง) ซึ่งหมึกที่ไม่ใช่ข้อมูลพิเศษช่วยให้กราฟมีข้อมูลมากขึ้น
gung - Reinstate Monica

ฉันควรทำให้ชัดเจนฉันไม่เห็นด้วยกับคำแนะนำเฉพาะบางประการ (เช่นไม่มี 3D ไม่มีแผนภูมิขาด) ฉันเล่นโวหารกับกฎของ Tufte เป็นแนวทางสำหรับกราฟิก
gung - Reinstate Monica

@ gung ฉันตีความการอภิปรายเดียวกับเครื่องมือแก้ปัญหา - วิธีที่ง่ายสำหรับผู้อ่านที่จะเข้าใจวิธีการแทนที่จะเป็นวิธีลดการทำงานของนักออกแบบ
David LeBauer

9

ปล่อยให้เวลาในการแก้ไข การสร้างกราฟที่ดีต้องใช้เวลาและบ่อยครั้งต้องใช้หลายครั้ง (อย่างน้อยสำหรับฉัน)


6

อย่าต่อต้านสีแดงและเขียว สีอาจมีประโยชน์ แต่เมื่อใช้สีพึงระลึกเสมอว่าคนส่วนน้อยที่สำคัญคือตาบอดสีแดง - เขียว ฉันเคยแสดงข้อมูลบางอย่างแก่ใครบางคนและเขาไม่สามารถบอกได้ว่าเกิดอะไรขึ้นในกราฟของฉัน - มันเป็นของเสียและฉันรู้สึกโง่มาก รูปแบบของความตาบอดสีอื่น ๆ นั้นหาได้ยากมาก แต่สีแดงสีเขียวเป็นเรื่องธรรมดา หน้านี้มีข้อมูลที่ดีมากมาย นี่คือเคล็ดลับ:

  • หากคุณต้องการเพียงสองสีให้ใช้สีน้ำเงินและสีเหลือง - อย่าใช้สีแดงและสีเขียว
  • หากคุณต้องการการไล่ระดับสีให้เปลี่ยนจากสีน้ำเงินเป็นสีเหลืองโดยเปลี่ยนความอิ่มตัวและความสว่างพร้อมกัน - อย่าใช้รุ้ง
  • หากคุณต้องการเข้ารหัสมากกว่าสององค์ประกอบ (เช่นแต้มบน scatterplot จากกลุ่มมากกว่าสองกลุ่มหรือหลายบรรทัด) คืนค่าสีของคุณด้วยสัญลักษณ์ / รูปแบบเส้นที่แตกต่างกัน ตัวอย่างเช่นสัญลักษณ์การพล็อตที่แตกต่าง: o + <sw หรือบรรทัด: ทึบจุดประประจุด ฯลฯ (คุณยังสามารถเพิ่มสัญลักษณ์การพล็อตลงในเส้นของคุณหรือเปลี่ยนน้ำหนักเส้น)

นี่คือสิ่งที่ฉันสงสัยบ่อยๆ: การไล่ระดับสีที่ดีที่สุดคืออะไร?
steffen

4

อย่าใช้กราฟแท่งแบบเรียงซ้อน และในบันทึกที่เกี่ยวข้องหากคุณมีรายการมาตราส่วน Likert อย่ารู้สึกว่าจำเป็นต้องแสดงสัดส่วนสำหรับการตอบกลับทุกรายการ กราฟเหล่านั้นทำให้ตาของฉันมีเลือดออก

อย่าใช้แผนภูมิวงกลม

อย่าทำซ้ำข้อมูลที่มีอยู่ในกราฟโดยการโยนลงในตาราง

ใช้แบบอักษร sans serif เช่น Arial สำหรับชื่อกราฟ ฯลฯ เนื่องจากฟอนต์ประเภทเหล่านั้นได้รับการออกแบบให้ใช้แบบนั้น

โพสต์ในการออกแบบไม่เสร็จสมบูรณ์โดยไม่ต้องอ้างอิงหนังสือผมชอบกฎทางสถิติของนิ้วหัวแม่มือ บทที่ 9 เป็นบิตที่เกี่ยวข้องกับการอภิปรายที่นี่และบิตที่ฉันชี้ไปเมื่อถูกถามว่าทำไมฉันเกลียดกราฟแท่งและแผนภูมิวงกลมที่ซ้อนกัน :)

คำสารภาพ: หนึ่งในหน้าที่ให้คำปรึกษานักเรียนคนแรกของฉันสำหรับลูกค้าองค์กรพัฒนาเอกชนขนาดเล็กฉันให้รายงานที่มีกราฟแท่งแบบเรียงซ้อนจำนวนมากพิมพ์ด้วยสี (นี่คือช่วงกลางปี ​​1990) ฉันคิดว่าฉันจัดการให้ลูกสุนัขสีเหลืองสีม่วงและสีแดงเข้ามา


3

อย่ายุ่งกับขวาน อย่าตัดส่วนแรกออกเป็นร้อยเพราะความชันของกราฟดูน่าประทับใจขึ้น ภาพจะติดและผู้คนจะจดจำเอฟเฟกต์ที่ใหญ่กว่าที่วัดได้จริง


2
การตัดข้อมูลเพื่อเปลี่ยนความชันที่ปรากฏนั้นเป็นการฉ้อโกง OTOH มีคำถามจริง ๆ ว่าแกนควรรวม 0 หรือไม่และเกี่ยวข้องกับอัตราส่วนที่ใช้ คลีฟแลนด์ทำให้เกิดกรณีที่แข็งแกร่งว่ากราฟมีข้อมูลมากขึ้นหากคุณเพิ่มข้อมูลภายในหน้าต่างข้อมูลให้สูงสุดและ 'ธนาคาร' จะเอียง 45 องศา รู้จักผู้ชมของคุณที่นี่: คลีฟแลนด์ให้เหตุผลว่าผู้ชมมืออาชีพควรมีความรู้ความสามารถ แต่มีความไร้เดียงสาของผู้ชมชี้ให้เห็นคุณลักษณะเหล่านี้อย่างชัดเจนและอธิบายพวกเขาหรือ (อาจ) ไม่ใช้พวกเขา
gung - Reinstate Monica

แม้แต่ผู้ชมมืออาชีพก็จะ (ฉันสันนิษฐาน) หลายเดือนต่อมาเพียงจำเส้นที่สูงชันในกราฟและจะลืมการสกัดกั้นและทุกอย่างอื่น คุณสามารถมีข้อมูลทั้งหมดในกราฟ (แบน) โดยการติดฉลากค่าสุดขีดอย่างถูกต้องและยังคงมีข้อมูลอยู่ในนั้นว่าไม่มีอะไรเปลี่ยนแปลงเวลาจริง
xmjx

2
ฉันไม่เห็นด้วย. ฉันไม่คิดว่ามันเป็นกฎที่สมเหตุสมผลที่จะยืนยันว่าแกนทั้งหมดเริ่มต้นที่ศูนย์ถ้าเป็นสิ่งที่ถูกแนะนำ กราฟิกควรแสดงความแปรปรวนและโครงสร้างในข้อมูล - ถ้าสิ่งที่สำคัญคือความผันผวน 100,000 รอบค่าสองล้าน (และอาจแตกต่างกันระหว่างสองกลุ่ม) กราฟิกควรแสดงว่าไม่ใช่สองล้านเป็นจำนวนมาก "
Peter Ellis

โดยพื้นฐานแล้วกฎการออกแบบใด ๆ ฉันคิดว่านี่เป็นกฎที่คุณสามารถทำลายได้หากคุณเข้าใจความสำคัญจริง ๆ ของรูปแบบการพล็อตและวิธีที่ผู้ชมของคุณจะตีความมัน แต่กฎนี้มีการละเมิดบ่อย ๆ และอย่างเลวร้ายมากที่ฉันคิดว่ามันค่อนข้างปลอดภัยที่จะประกาศเสียงดัง "แผนการทั้งหมดจะต้องมีศูนย์! *" การค้นหาโดย Google ของชาวอเมริกันที่เป็นเจ้าของที่ดินแสดงให้เห็นถึงจุดนี้อย่างชัดเจน - เกือบทุกแปลงดูเหมือนว่า ในช่วงสองทศวรรษที่ผ่านมาอย่างดุเดือดในความเป็นจริงการแพร่กระจายสูงสุดคือประมาณ 5%
Matt Parker

ไม่ใช่ว่า 5% นั้นไม่เกี่ยวข้อง - และแผนการเหล่านั้นส่วนใหญ่เกี่ยวข้องกับข้อโต้แย้งเกี่ยวกับผลที่ตามมาของนโยบายที่สร้างความผันผวนนั้น แต่ฉันคิดว่าข้อโต้แย้งเหล่านั้นจะแข็งแกร่งยิ่งขึ้นหากพวกเขาเน้นว่านโยบายขนาดใหญ่ที่มีผลทางเศรษฐกิจขนาดใหญ่จริง ๆ แล้วมีผลกระทบเพียงเล็กน้อยต่อเจ้าของบ้าน
Matt Parker
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.