ฉันยอมรับว่าพล็อต "ดีที่สุด" ไม่มีอยู่โดยไม่เกี่ยวข้องกับชุดข้อมูลผู้อ่านและวัตถุประสงค์ สำหรับตัวแปรที่วัดได้สองตัวแผนการกระจายนั้นเป็นการออกแบบที่ทำให้คนอื่น ๆ ทั้งหมดตื่นยกเว้นจุดประสงค์ที่เฉพาะเจาะจง แต่ไม่มีผู้นำตลาดดังกล่าวเห็นได้ชัดเจนสำหรับข้อมูลที่เป็นหมวดหมู่
จุดมุ่งหมายของฉันที่นี่เป็นเพียงการพูดถึงวิธีการง่ายๆที่มักค้นพบใหม่หรือคิดค้นใหม่ แต่ก็ยังมองข้ามแม้ใน monographs หรือตำราที่ครอบคลุมกราฟิกสถิติ
ตัวอย่างแรกครอบคลุมข้อมูลเดียวกันกับที่โพสต์โดย xan:
หากต้องการชื่อตามที่มักจะเป็นนี่คือบาร์ชาร์ต twoway (ในกรณีนี้) ฉันจะไม่แคตตาล็อกข้อกำหนดอื่น ๆ ที่นี่ยกเว้นว่าบาร์ชาร์ตหลายรายการเป็นอีกทางเลือกหนึ่งที่มีรสชาติคล้ายกัน (คัดค้านเล็ก ๆ ของฉันไปที่ "หลาย barchart" คือ "หลาย" ไม่ได้ออกกฎที่พบบ่อยมากแผนภูมิแท่งแบบเรียงซ้อนหรือด้านข้างในขณะที่ "twoway" ให้ฉันชัดเจนยิ่งขึ้นหมายถึงรูปแบบแถวและคอลัมน์แม้ในทางกลับกัน อาจใช้ตัวอย่างเพื่อทำให้ชัดเจน)
ข้อดีและข้อเสียสำหรับพล็อตประเภทนี้ก็เรียบง่าย แต่ฉันจะสะกดบางอย่างออกมา เนื่องจากฉันชอบการออกแบบนี้ (ซึ่งย้อนกลับไปอย่างน้อยในช่วงทศวรรษที่ 1930) คนอื่น ๆ อาจต้องการเพิ่มการวิพากษ์วิจารณ์ที่คมชัดยิ่งขึ้น
+1 แนวคิดนี้สามารถเข้าใจได้ง่ายโดยกลุ่มที่ไม่ใช่ด้านเทคนิค ความสูงของแท่งหรือความยาวแท่งเข้ารหัสความถี่ในตัวอย่างนี้ ในตัวอย่างอื่น ๆ พวกเขาสามารถเข้ารหัสร้อยละคำนวณในแบบที่คุณต้องการเศษ ฯลฯ
2 แถวและคอลัมน์โครงสร้างตรงกับของตาราง คุณสามารถเพิ่มค่าตัวเลขได้เช่นกัน จำนวนน้อยมากและแม้กระทั่งค่าศูนย์โดยนัยชัดเจนซึ่งไม่ได้เป็นกรณีที่มีการออกแบบอื่น ๆ (เช่นแผนภูมิแท่งซ้อนกัน, แปลงโมเสค) โดยปกติแล้วการติดฉลากแถวและคอลัมน์จะมีประสิทธิภาพมากกว่าการเพิ่มคีย์หรือคำอธิบายโดยมี "การกลับไปกลับมา" ทางจิตที่ต้องการ ดังนั้นการออกแบบนี้ทำให้เกิดกราฟและความคิดแบบตารางซึ่งทำให้ผู้อ่านบางคนดูลำบาก ในทางกลับกันฉันขอยืนยันว่าความแตกต่างที่ชัดเจนระหว่างตัวเลขและตารางเป็นเพียงการแฮงค์ในอดีตล้าสมัยแล้วในขณะนี้ที่นักวิจัยสามารถจัดเตรียมเอกสารของตนเองและไม่ต้องพึ่งพานักออกแบบผู้แต่งและเครื่องพิมพ์
3 ส่วนขยายสามทางและการออกแบบที่สูงขึ้นได้ง่ายในหลักการ วางตัวแปรสองตัวขึ้นไปเป็นตัวแปรประกอบบนแกนใดแกนหนึ่งหรือทั้งสองหรือให้อาร์เรย์ของพล็อตดังกล่าว ตามธรรมชาติยิ่งการออกแบบซับซ้อนยิ่งตีความได้ยากขึ้นเท่านั้น
4 การออกแบบอย่างชัดเจนช่วยให้ตัวแปรลำดับในทั้งสองแกน คำสั่งสามารถแสดงได้ (เช่น) โดยการแรเงาที่เหมาะสมรวมถึงลำดับของหมวดหมู่บนแกนนั้น ลำดับหมวดหมู่บนแกนจะถูกกำหนดโดยความหมายของพวกเขาหรือดีกว่าที่กำหนดโดยความถี่; ลำดับตัวอักษรตามฉลากข้อความอาจเป็นค่าเริ่มต้น แต่ไม่ควรพิจารณาเป็นตัวเลือกเดียว
-1 โดยการทั่วไปในการออกแบบพล็อตอาจจะมีประสิทธิภาพน้อยลงในการแสดงบางชนิดของความสัมพันธ์ โดยเฉพาะพล็อตโมเสกสามารถทำให้การแยกออกจากอิสรภาพชัดเจนมาก ในทางกลับกันเมื่อความสัมพันธ์ระหว่างตัวแปรจัดหมวดหมู่มีความซับซ้อนหรือไม่ชัดเจนโดยทั่วไปแล้วจะไม่มีกราฟที่แสดงได้ดีกว่าความจริงที่อ่อนแอ
-2 ในบางวิธีการออกแบบไม่มีประสิทธิภาพในการใช้พื้นที่โดยออกจากห้องสำหรับการผสมข้ามทุกครั้งโดยไม่คำนึงว่าจะเกิดขึ้นหรือไม่บ่อยแค่ไหน นี่คือรองของหลักการเดียวกันถือว่าเป็นคุณธรรม การออกแบบเฉพาะด้านบนประเภทช่องว่างอย่างเท่าเทียมกันโดยไม่คำนึงถึงความถี่ การเสียสละที่มักจะเสียสละฉลากที่อ่านได้ซึ่งฉันให้คุณค่าอย่างมาก ในตัวอย่างนี้ป้ายข้อความเกิดขึ้นทั้งหมดนั้นสั้นมาก แต่มันก็ยังห่างไกลจากเรื่องปกติ
หมายเหตุ: ข้อมูลของ xan นั้นถูกประดิษฐ์ขึ้นมาเท่านั้นดังนั้นฉันจะไม่ลองตีความอีกต่อไป แต่ภูมิปัญญาบางอย่างของบ้านสมควรได้รับคำพูดสุดท้ายที่นี่: การออกแบบที่ดีที่สุดสำหรับคุณคือสิ่งที่สื่อถึงคุณและผู้อ่านได้ดีที่สุดถึงโครงสร้างของข้อมูลจริงที่คุณสนใจ
ตัวอย่างอื่น ๆ ได้แก่
คุณจะเห็นภาพความสัมพันธ์ระหว่างตัวแปรเด็ดขาด 3 ตัวได้อย่างไร
กราฟสำหรับความสัมพันธ์ระหว่างตัวแปรอันดับสอง