การจัดรูปแบบกราฟ: เมื่อใดควรเลือกใช้การเติมใต้กราฟเส้น


13

นี่เป็นคำถามการสร้างภาพข้อมูล - ฉันหวังว่ามันจะโอเคที่จะถามที่นี่

เมื่อใดจึงเหมาะสมที่จะใช้การเติมใต้กราฟเส้นสำหรับอนุกรมเวลาเช่นกราฟด้านล่าง (ซึ่งแสดงการ ping ครั้งต่อวัน)

กราฟเส้นพร้อมการเติมใต้

ฉันเดาว่าเป็นเรื่องปกติมากที่จะใช้บรรทัดธรรมดาโดยไม่มีการเติมใต้ แต่มันก็โอเคที่จะใช้การเติมสำหรับความหลากหลายในการมองเห็นหรือไม่?

ฉันมีความสนใจเป็นพิเศษในการรู้เกี่ยวกับการวิจัยการรับรู้ในหัวข้อหรือแนวทางการออกแบบใด ๆ


1
ถ้า0sขอบเขตล่างเป็นธรรมชาติและคุณแสดงให้เห็นแล้วทำไมไม่
ttnphns

1
ถามวิธีอื่น - ทำไมต้องใช้งานเติมถ้าไม่จำเป็น? ลองนึกภาพคุณต้องการเพิ่มเส้นแนวโน้มใหม่และสิ่งต่าง ๆ มีความซับซ้อนเกินความจำเป็น ฉันจะแยกหน่วยแกน y และมาตราส่วนด้วย
martin

คำตอบ:


11

มีงานศิลปะที่จะสร้างความสมดุลระหว่างความสวยงามและข้อมูลของกราฟิก ผู้ให้คำปรึกษาด้านการสร้างภาพข้อมูลที่โดดเด่นอย่าง Edward Tufte และ Stephen Few เลือกความสวยงามที่น้อยที่สุดเพื่อหลีกเลี่ยงสิ่งรบกวนจากส่วนข้อมูลของกราฟ อย่างไรก็ตามสำหรับผู้ชมบางคนความเจริญรุ่งเรืองเล็กน้อยมีความชอบธรรม - ดูตัวอย่างการประยุกต์ใช้การสร้างภาพข้อมูลในวารสารของ Alberto Cairo

มุมมองการวิจัยที่รับรู้คือองค์ประกอบกราฟิกทุกอันสื่อสารข้อความบางส่วนที่เราไม่ได้รับรู้ถึงเพราะสติคอร์เทกซ์ของเราเกี่ยวข้องกับมัน (" การประมวลผลล่วงหน้าอย่างเอาใจใส่ ") องค์ประกอบพิเศษแม้แต่องค์ประกอบที่ซ้ำซ้อนอาจส่งผลให้เกิดการประมวลผลเพิ่มเติม กราฟที่เหมาะสมขึ้นอยู่กับข้อความที่จะสื่อสารและผู้ชม

สำหรับคำถามเฉพาะของคุณบรรทัดที่เชื่อมต่อจะเน้นแนวโน้ม (และความหลากหลายของเทรนด์) พื้นที่ที่เต็มไปเน้นการเบี่ยงเบนจากพื้นฐาน แผนภูมิแท่งหรือแผนภูมิเข็มจะเน้นเหตุการณ์ที่ไม่ต่อเนื่องที่เบี่ยงเบนจากพื้นฐาน

บริบทของกราฟิกก็มีความสำคัญเช่นกัน หากคุณมีตารางของกราฟที่อัดแน่นการเติมจะช่วยเชื่อมโยงแต่ละบรรทัดเข้ากับเส้นฐาน

ในที่สุดการพิจารณาอื่นสำหรับการเพิ่มองค์ประกอบกราฟิกซ้ำซ้อน / florishes คือมันทำให้มันยากที่จะขยายกราฟที่มีองค์ประกอบข้อมูลเพิ่มเติม ตัวอย่างเช่นคุณอาจต้องการเน้นค่าพิเศษซ้อนทับเทรนด์ไลน์อื่น ๆ หรือแถบโอเวอร์เลย์เช่นในการจำลองต่อไปนี้

ป้อนคำอธิบายรูปภาพที่นี่


1
ฉันเห็นด้วยกับสิ่งนี้ หากต้องการกราฟที่มีสีสันเพราะเป็นหน้าปกของนิตยสาร / หนังสือ (และผู้คนในการตลาดต้องการสี) ควรใช้สีเพื่อแจ้ง หากกราฟดู "น่าเบื่อ" ผู้ร้ายก็คือความจริงที่ว่าข้อมูลพื้นฐานไม่น่าสนใจมากหรือไม่น่าสนใจมากในรูปแบบกราฟเส้น ในกรณีเช่นนี้มันอาจจะมีประโยชน์มากกว่าในแผนภูมิวงกลม, เรดาร์พล็อตหรืออย่างอื่น
rocinante

1
ฉันไม่แนะนำให้ใช้แผนภูมิวงกลม การรับรู้ความแตกต่างของความยาวส่วนโค้งและพื้นที่ลิ่มนั้นยากกว่าความแตกต่างของความสูง หากคุณไม่เชื่อฉันให้เปรียบเทียบแผนภูมิวงกลมในอัตราส่วน 32:34:33 กับแผนภูมิแท่งเดียวกัน อ่านอันไหนง่ายกว่ากัน?
shadowtalker

2
ฉันพูดในแง่ทั่วไปไม่ใช่เฉพาะสำหรับกราฟด้านบน แผนภูมิแต่ละประเภทมีข้อดี แผนภูมิบางประเภทไม่เหมาะสมในทุกสถานการณ์
rocinante

4

อีกสองประเด็นที่ควรพิจารณา:

ตามที่ระบุไว้ในความคิดเห็นการเติมเต็มนั้นไม่เหมาะสมอย่างมากหากแกน x ไม่ได้อยู่ที่จุดศูนย์ y ตามธรรมชาติ อาจเป็นเพราะแกน y ถูกปรับให้เริ่มที่ตัวเลขอื่นที่ไม่ใช่ศูนย์หรือเนื่องจากหน่วยที่ใช้ไม่มีการตีความค่าศูนย์ธรรมชาติ (เช่นเคลวินมีค่าศูนย์ธรรมชาติในขณะที่เซลเซียสไม่ได้)

ประการที่สองกรณีที่การเติมไม่ถูกต้องโดยเฉพาะอย่างยิ่งคือถ้าข้อมูลตัวเองอาจได้รับการพิจารณา underfill ตัวอย่างเช่นแผนภูมิเส้นของความสูงของภูเขาทำให้รู้สึกถึงการเติมเต็มสีเติมหมายถึงโลกในขณะที่ไม่แสดงถึงอากาศ

ตัวอย่างที่เกี่ยวข้องอาจเป็นข้อมูลการนับ ถ้าเราซ้อนทุกคนในแต่ละจุด x เราจะได้แผนภูมิแท่ง หากการสอดแทรกระหว่างแท่งมีเหตุผลเราจะต้องจบด้วยแผนภูมิเส้นที่มีการเติมเต็ม

นี้ภาพจาก 'การแสดงผลภาพของข้อมูลเชิงปริมาณ' อาจอธิบายได้เล็ก ๆ น้อย ๆ ที่ดีกว่า มันแสดงให้เห็นว่าหน่วยทหารใดที่อยู่ในยุโรปในช่วงสงครามครั้งที่สอง (ฉันคิดว่า) การซ้อนหน่วยในแต่ละจุดจะช่วยให้คุณมีแผนภูมิแท่งที่เติมเต็ม การวาดเส้นที่ด้านบนสุดของข้อมูลจะให้แผนภูมิเส้นที่เติมเต็ม


2
... หน่วยทหารสหรัฐฯอยู่ในยุโรปในช่วงสงครามโลกครั้งที่หนึ่ง (วันที่ 2460 และ 2461 บอกเล่าเรื่องราว)
Nick Cox

@ NickCox แน่นอน ไม่รู้เลยว่าทำไมฉันไม่เห็นสิ่งนั้น
timcdlucas

4

คำตอบสองข้อก่อนหน้านี้ครอบคลุมประเด็นสำคัญที่สำคัญ แต่มีบางสิ่งที่ควรกล่าวถึง

อันดับแรกฉันควรจะบอกว่าฉันไม่เห็นด้วยกับวิธีการที่เรียบง่ายที่สุดในการทำกราฟ - หมึกที่เหลือใช้ทั้งหมดต้องไป ความผันแปรที่ไม่มีความหมายควรเป็นสิ่งที่กวนใจ แต่พื้นที่ทึบเมื่อเทียบกับบรรทัดเดียวสามารถดึงดูดสายตาได้ดีขึ้นและสื่อสารได้รวดเร็วยิ่งขึ้น และอย่างที่คุณพูดมันสามารถเพิ่ม "ความหลากหลายของภาพ"

อย่างไรก็ตามในขณะที่ @xan ชี้ให้เห็นว่าการมองอย่างรวดเร็วนั้นตีความพื้นที่ที่แตกต่างจากบรรทัดด้วยวิธีการจิตใต้สำนึกบางส่วน

กราฟพื้นที่แสดงปริมาณทั้งหมดที่สะสมในขณะที่คุณดำเนินการตามแกน x หากคุณเปรียบเทียบกราฟสองกราฟและกราฟหนึ่งมีพื้นที่กว้างขึ้นการมองของคุณจะบอกคุณว่ากราฟนั้นมีผลรวมมากกว่าโดยไม่คำนึงถึงค่าเริ่มต้นและค่าสิ้นสุด

ในทางตรงกันข้ามกราฟเส้นแสดงค่าที่เปลี่ยนแปลง โฟกัสอยู่ที่การเปลี่ยนตำแหน่งจากจุดหนึ่งไปยังอีกจุดหนึ่งไม่ใช่จากยอดรวมสะสม

ดังนั้นเมื่อใดที่คุณควรใช้กราฟพื้นที่

  • เมื่อค่าแสดงปริมาณที่ชัดเจนพร้อมจุดศูนย์ที่แน่นอนที่แสดงบนกราฟ
  • เมื่อค่าแสดงถึงจำนวนที่เพิ่ม (หรือลบ) ในแต่ละจุดเช่นปริมาณน้ำฝนรายวันปกติหรือกำไร / ขาดทุนรายเดือน;
  • เมื่อค่าแสดงถึงการกระจายตัวของประชากรหมายความว่าพื้นที่ทั้งหมดภายใต้เส้นโค้งหมายถึงขนาดทั้งหมดของตัวอย่างเช่นเส้นโค้งระฆังของจำนวนนักเรียนที่มีคะแนนแตกต่างกัน

แนวคิดคือเมื่อคุณอ่านกราฟหากคุณใช้จุดสองจุดบนแกน x พื้นที่ที่แสดงระหว่างพวกเขาควรแสดงจำนวนที่แท้จริงของสิ่งที่สะสมในช่วงนั้น ด้วยเหตุนี้หากคุณระบุจำนวนเงินติดลบฉันขอแนะนำให้ใช้สีตรงข้ามสำหรับพื้นที่เชิงลบและบวกเพื่อเน้นว่าพวกเขายกเลิกทั้งหมด

เมื่อใดที่คุณไม่ควรใช้กราฟพื้นที่

  • เมื่อจุดศูนย์เป็นกฎเกณฑ์ (เช่นในอุณหภูมิที่ไม่ใช่สัมบูรณ์ตามที่ @ timcdlucas กล่าว), ไม่ถูกต้อง (ในการวัดที่เป็นอัตราส่วนของสองค่าเช่นอัตราแลกเปลี่ยน) หรือไม่แสดงบนกราฟด้วยเหตุผลด้านอวกาศ
  • เมื่อค่าที่แสดงโดยความสูงของเส้นแสดงถึงการวัดแบบสะสมเช่นปริมาณน้ำฝนทั้งหมดจนถึงวันที่ (สำหรับเดือน / ปี) หรือหนี้ / การออม
  • เมื่อค่านั้นแสดงถึงตำแหน่ง / มูลค่าของกิจการที่เปลี่ยนแปลงเพียงครั้งเดียวแทนที่จะเป็นการสะสม
  • เมื่อคุณต้องการเปรียบเทียบหลายบรรทัดในแผนภูมิเดียวกัน (หากคุณไม่เห็นทั้งพื้นที่คุณจะสูญเสียความหมาย - เปรียบเทียบแผนภูมิพื้นที่แบบเคียงข้างกันแทน)

เมื่อคำนึงถึงแนวทางเหล่านั้นกราฟ ping ของคุณสามารถตีความได้สองวิธี

ในอีกด้านหนึ่งถ้าคุณคิดว่าความเร็ว ping เป็นตัวแปรเดียวที่เปลี่ยนแปลงตลอดเวลาของวันแผนภูมิเส้นง่ายจะเหมาะสมที่สุด

ในทางตรงกันข้ามถ้าคุณเปรียบเทียบสองเครือข่ายที่แตกต่างกันรูปแบบความเร็วปิงวัน (หรือเครือข่ายเดียวกันในวันที่แตกต่างกัน / ช่วงเวลา) แล้วบางทีคุณอาจต้องการที่จะเน้นรวมระยะเวลาที่จำเป็นสำหรับงานเครือข่าย ตัวอย่างเช่นหากกราฟของคุณมียอดเขาหลายจุดแทนที่จะเป็นเพียงเส้นเดียวกราฟเส้นจะเน้นความแปรปรวนของความเร็วขณะที่กราฟพื้นที่จะเน้นความล่าช้าทั้งหมด

เปรียบเทียบ:
กราฟเส้น กราฟเดียวกันกับพื้นที่เต็ม
ผลรวมสะสมจะมากกว่าในช่วงครึ่งแรกของกราฟ (ซ้ายของเส้นสีแดง) กว่าช่วงที่สองแม้ว่าจุดสูงสุดจะมีค่าสูงสุดสูงกว่าทางด้านขวา การเติมเน้นบล็อกของแข็งที่ด้านซ้ายเพื่อให้สมดุลกับยอดเขาที่ดีขึ้น

(ยกโทษให้ภาพที่มีคุณภาพต่ำ - ไม่สามารถหาวิธีการให้ R ทำกราฟพื้นที่ได้ต้องส่งออกและแก้ไขแยกต่างหาก)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.