หลักฐานการทดลองที่สนับสนุนการสร้างภาพข้อมูลสไตล์ Tufte?


36

ถาม: มีหลักฐานการทดลองที่สนับสนุนการสร้างภาพข้อมูลแบบ Tufte แบบมินิมัลลิสต์และพูดข้อมูลบนการสร้างภาพข้อมูลแบบแผนภูมิที่ไม่ได้รับการพูดNigel Holmesหรือไม่?

ฉันถามวิธีเพิ่มแผนภูมิขยะลงในแปลง R ที่นี่และเจ้าหน้าที่ตอบโต้ก็ส่งเสียงจำนวนมากกลับมาที่ฉัน ดังนั้นแน่นอนต้องมีหลักฐานการทดลองบางอย่างที่ฉันไม่ได้เป็นส่วนตัวสนับสนุนตำแหน่งขยะแผนภูมิต่อต้านของพวกเขา --- หลักฐานมากกว่าเพียงแค่ "Tufte กล่าวเช่นนั้น" ขวา?

หากมีหลักฐานดังกล่าวมันจะขัดแย้งกับการวิจัยทางจิตวิทยามากมายที่เรามีเกี่ยวกับมนุษย์การระลึกถึงความทรงจำและการระบุรูปแบบ ดังนั้นฉันจะตื่นเต้นที่จะอ่านเกี่ยวกับเรื่องนี้อย่างแน่นอน

เกร็ดเล็ก ๆ น้อย ๆ : ที่ประชุมผมถามเอ็ดเวิร์ด Tufte วิธีการที่เขานับถือการค้นพบหลักฐานการทดลองที่ภาพเคลื่อนไหวขยะและวิดีโอปรับปรุงมนุษย์การทำความเข้าใจและการเรียกคืนหน่วยความจำ [ดูงานวิจัยที่อ้างถึงในกฎสมอง] คำตอบของเขา: "อย่าเชื่อพวกเขา" มากสำหรับวิธีการทางวิทยาศาสตร์!

ป.ล. แน่นอนฉันต้องการคนที่นี่เล็กน้อย ฉันเป็นเจ้าของหนังสือทั้งหมดของ Tufte และคิดว่างานของเขานั้นยอดเยี่ยมมาก ฉันแค่คิดว่าผู้สนับสนุนของเขามีข้อโต้แย้งบางอย่างของเขา

หมายเหตุ: นี่เป็นคำถามที่ฉันถามใน StackOverflowอีกครั้ง ผู้ดำเนินรายการปิดเพราะไม่ได้เป็นโปรแกรมเฉพาะ CrossValidated อาจเป็นบ้านที่ดีกว่า

อัปเดต: มีลิงก์ที่มีประโยชน์บางส่วนในส่วนความเห็นของโพสต์คำถามเดิมของฉัน --- คือไปยังงานของ Chambers, Cleveland และกลุ่มดาต้าที่ Stanford

UPDATE: คำถามนี้เกี่ยวกับหัวข้อที่คล้ายกัน


7
คุณคิดว่าหลักฐานที่แสดงว่าแผนภูมิสไตล์ Tufte / minimalist นั้นขัดแย้งกับการวิจัยทางจิตวิทยาทั้งหมดที่เรามีเกี่ยวกับมนุษย์ความทรงจำของพวกเขา ในขณะที่ฉันคิดว่านี่เป็นคำถามที่ดี แต่เสียงเชิงลบและการยอมรับไม่ได้ทำให้คำขอของคุณดูจริงใจมาก ไม่ใช้เวลา 10 นาทีในการทำวิจัยพื้นหลังเพื่อปฏิเสธข้อเสนอแนะของฉันในการอ่านงานของคลีฟแลนด์ที่เกี่ยวข้องกับการอภิปราย
Andy W

2
@AndyW ฉันได้เชื่อมโยง "กฎของสมอง" และการอภิปรายของการวิจัยของไนเจลโฮล์มส์ นี่คือลิงค์อื่นที่สนับสนุนการอ้างสิทธิ์ของฉันเกี่ยวกับแบบอักษรกลับไปที่ส่วนความคิดเห็นดั้งเดิม ฉันสามารถไปต่อได้ แต่ประเด็นพื้นฐานคือสมองจะมีส่วนร่วมทำความเข้าใจและจดจำภาพที่ดีขึ้นที่ตื่นเต้นและท้าทาย แต่นี้จะขึ้นอยู่กับการอ่านของฉันของ PopPsych ...
lowndrul

@AndyW ... ฉันไม่สามารถหลอกว่าเป็นผู้มีอำนาจในเรื่อง ฉันหวังว่าจะมีคนที่มีความรู้มากขึ้นจะพูดสอดในเรื่องนี้ นอกจากนี้คำถาม / ข้อเรียกร้องของฉันก็เป็นที่ยอมรับอย่างกล้าหาญ ฉันต้องการกระตุ้นการตอบสนอง ฉันรดน้ำมันเล็กน้อยเพื่อที่จะไม่ได้อ่านว่าเป็นค่าลบ นอกจากนี้สิ่งที่ต้องหายไปในการแปล ฉันคิดว่าลิงค์ของคุณไปยังงานของ Cleveland นั้นมีความเกี่ยวข้องด้วยเหตุนี้ฉันได้กล่าวถึงมันใน "UPDATE" กับคำถามของฉัน
lowndrul

ฉันคิดว่าเหตุผลของความบ้าคลั่งคือการใช้ Excel เป็นจุดอ้างอิง / จุดเริ่มต้น พวกเขาไม่ได้ทำให้แผนภูมิแย่
bill_080

ในการตอบกลับถึง @ bill_080 ฉันแน่ใจว่ามีบางคนที่ชาร์ต ฉันจะได้ถ้าฉัน chimed ค่ะ แต่บางทีคำสาบานนั้นไม่ยุติธรรม ฉันคนหนึ่งยังไม่ได้อ่านหลักฐานใด ๆ ทางเดียวหรืออื่น ๆ คำถามที่ดี!
แอรอน - คืนสถานะโมนิก้า

คำตอบ:


24

วรรณคดีนั้นกว้างใหญ่ หลักฐานการทดลองมีมากมาย แต่ไม่สมบูรณ์ สำหรับการแนะนำที่มุ่งเน้นไปที่การสืบสวนทางจิตวิทยาและกึ่งสัมพเห็น Alan M. MacEachren การทำงานของ Maps (1995; 2004 ในหนังสือปกอ่อน) ข้ามไปที่บทที่ 9 (ใกล้ถึงจุดสิ้นสุด) แล้วย้อนกลับผ่านเนื้อหาเบื้องต้นที่คุณสนใจ บรรณานุกรมกว้างขวาง (กว่า 400 เอกสาร) แต่มีความยาวในฟันเล็กน้อย แม้ว่าชื่อเรื่องจะให้ความสำคัญกับการทำแผนที่ แต่หนังสือส่วนใหญ่เกี่ยวข้องกับวิธีที่มนุษย์สร้างความหมายออกมาและตีความข้อมูลกราฟิก

อย่าคาดหวังว่าจะได้คำตอบที่ชัดเจนจากการวิจัยจำนวนมาก โปรดจำไว้ว่า Tufte, Cleveland และคนอื่น ๆ มุ่งเน้นไปที่การสร้างกราฟิกที่ช่วยให้การสื่อสารที่แม่นยำและชาญฉลาดและตีความข้อมูล ศิลปินกราฟิกและนักวิจัยคนอื่นมีจุดมุ่งหมายอื่น ๆ เช่นมีอิทธิพลต่อผู้คนสร้างการโฆษณาชวนเชื่อที่มีประสิทธิภาพลดความซับซ้อนของชุดข้อมูลที่ซับซ้อนและแสดงความรู้สึกทางศิลปะของพวกเขาภายในสื่อกราฟิก สิ่งเหล่านี้เกือบจะตรงกันข้ามกับวัตถุประสงค์ชุดแรกซึ่งเป็นวิธีการที่แตกต่างกันอย่างมากและคำแนะนำที่คุณจะได้พบ

เมื่อพิจารณาถึงสิ่งนี้ฉันคิดว่าการทบทวนงานวิจัยของคลีฟแลนด์น่าจะพอเชื่อได้ว่าคำแนะนำการออกแบบของ Tufte จำนวนมากมีเหตุผลที่สมเหตุสมผล สิ่งเหล่านี้รวมถึงการใช้ Lie Factor อัตราส่วน Data-Ink, multiples ขนาดเล็กและ chartjunk สำหรับการประเมินและออกแบบกราฟิกเชิงสถิติ


9
(+1) ย่อหน้าที่ 2 ของคุณทำให้ฉันนึกถึงการสนทนาเมื่อเร็ว ๆ นี้ (กับ Gelman, Kosara, Wickham, และกลุ่มอื่น ๆ ) เกี่ยวกับการสร้างภาพข้อมูลและการแสดงข้อมูลเช่นการแสดงข้อมูล "กับ" กราฟิกสถิติ , Infovis, อินโฟกราฟิก ฉันมาจากและที่ฉันต้องการจะไปหรือสถิติกราฟิกและการแสดงข้อมูล
chl

+1 ขอบคุณเป็นพิเศษสำหรับย่อหน้าที่สอง เช่นเดียวกับสถิติที่ใช้กันมากคำตอบนั้นขึ้นอยู่กับสาเหตุที่คำถามถูกถามและใครถามคำถามนั้น (ไม่ว่าสิ่งนี้จะลดความสำคัญของหลักฐาน; ขอบคุณสำหรับคำถาม, brianjd!)
แอรอน - Reinstate โมนิก้า

(+1) สำหรับทั้งคู่สำหรับตัวชี้ที่มีประโยชน์ @chl ลิงก์ที่ 1 และ 3 ของคุณเหมือนกัน คุณตั้งใจจะลิงค์ไปยังสิ่งนี้ในวันที่ 3 หรือไม่?
lowndrul

แค่สัญชาตญาณของฉันที่นี่ (ฉันยังไม่ได้อ่านข้อมูลอ้างอิง) แต่ฉันคิดว่ามันคงไม่ต้องใช้การศึกษาในเชิงลึกโดยเฉพาะเพื่อแสดงให้เห็นว่ากล่องสี่เหลี่ยมสไตล์ Tufte (สองแท่งและจุดศูนย์กลาง) ไกลน้อยกว่าที่เข้าใจได้ง่ายกว่า boxplot มาตรฐาน (ซึ่งมีปัญหาของตัวเอง) หมึกพิเศษไม่เพิ่มข้อมูลเพิ่มเติม แต่จะเพิ่มมวลภาพมากขึ้นซึ่งทำให้อ่านง่ายขึ้น หลักการอัตราส่วนข้อมูลและหมึกเป็นสิ่งที่ดีและสามารถใช้งานได้อย่างกล้าหาญเมื่อเผชิญกับแผนภูมิขยะแบบโอ้อวด แต่มันไม่สมบูรณ์และควรคำนึงถึงข้อ จำกัด ของระบบการรับรู้ด้วยสายตาของมนุษย์
naught101

ในการทดสอบสัญชาตญาณของคุณ @ naught101 ผมขอเชิญคุณที่จะตรวจสอบตัวอย่างที่stats.stackexchange.com/a/13915 หลักการออกแบบของ Tufte ทำงานได้ดีที่นั่นเพราะกล่องจำนวนมากต้องแสดงและเปรียบเทียบ: หมึกพิเศษใน boxplots มาตรฐานขัดขวางการเปรียบเทียบ
whuber

6

นี่คือบางส่วน;

  • Cleveland และ McGill (1984, JASA) การรับรู้เชิงกราฟิก: ทฤษฎีการทดลองและการประยุกต์ใช้กับการพัฒนาวิธีการแบบกราฟิก
  • Cleveland and McGill (1987, JRSSA) การรับรู้ทางกราฟฟิค: การถอดรหัสข้อมูลเชิงปริมาณด้วยสายตาบนการแสดงข้อมูลแบบกราฟิก
  • Lewandowsky and Spence (1989) จำแนกชั้นใน Scatterplots
  • Spence และ Lewandowsky (1991) แสดงสัดส่วนและร้อยละ
  • Spence Kutlesa และ Rose (1999) ใช้สีถึงปริมาณรหัสในการแสดงผลเชิงพื้นที่

ถาม Google สำหรับการอ้างอิงแบบเต็ม


2
จาก LewSpe91 นามธรรม: "การวิเคราะห์ลักษณะของงานและการทบทวนวรรณกรรม psychophysical ชี้ให้เห็นว่าอคติดั้งเดิมกับแผนภูมิวงกลมถูกเข้าใจผิด" ตรง! ผลลัพธ์ก็ทำให้ฉันประหลาดใจ แต่นั่นคือประเด็น: จำเป็นต้องใช้วิธีการทางวิทยาศาสตร์แทนการใช้ datavis dogma ในการพิจารณาว่าวิธีใดที่ "ดีที่สุด" ในการมองเห็นข้อมูล ถ้าเราทำฉันแน่ใจว่าจะมีผลลัพธ์ที่น่าแปลกใจมากขึ้น
lowndrul

6

เป็นเรื่องที่ควรค่าแก่การจดจำว่าการสร้างภาพข้อมูลไม่ใช่เกาะที่ถูกตัดขาดจากการสื่อสารด้วยภาพในรูปแบบอื่น ๆ ทั้งหมด หากคุณต้องการสร้างงานตามเจ้าอ้างอิงจากหลักฐานฉันขอยืนยันว่าดีที่สุดที่จะดูว่าหลักฐานนั้นแข็งแกร่งที่สุด

ฉันได้อ่านงานวิจัยที่เฉพาะเจาะจงเกี่ยวกับเทคนิคการสร้างภาพข้อมูลและการวิจัยทั่วไปในวิทยาศาสตร์พุทธิปัญญาและการวิจัยการออกแบบทั่วไปและฉันพบว่าการคิดว่าการวิจัยทั่วไปที่ทรงพลังยิ่งกว่าและละเอียดมากขึ้นนำไปใช้กับแต่ละบทสรุปอย่างไร และมีประโยชน์มากกว่าการพยายามใช้การวิจัยเฉพาะด้านที่ประยุกต์ใช้อย่างแคบซึ่งมักได้รับความทุกข์ทรมานจากกลุ่มตัวอย่างขนาดเล็กเทคนิคการวิจัยที่อ่อนแอการตรวจสอบที่แคบและ / หรือสมมติฐานที่ฝังลึก

มีหนังสือดีเลิศสองเล่มที่ฉันแนะนำเป็นบทนำเล่มหนึ่งซึ่งเป็นวิทยาศาสตร์เป็นจุดเริ่มต้นหนังสือที่มีหลักการทั่วไปเป็นจุดเริ่มต้นนำเสนอหลักฐาน:

  • วิทยาศาสตร์วิสัยทัศน์โดยสตีฟพาลเมอร์ มันเป็นสัตว์ร้ายและในฐานะนักเรียนฉันเกือบจะได้รับบาดเจ็บที่หลังในบางครั้งฉันก็โง่พอที่จะพกมันไว้ในกระเป๋าเป้สะพายหลังได้ แต่มันอาจเป็นตำราเรียนวิทยาศาสตร์ที่ดีที่สุดที่ฉันเคยเห็นและเป็นตัวอย่างที่ดี การสื่อสารด้วยภาพและด้วยวาจา เมื่อไม่นานมานี้ฉันได้ทำเลเบลบทที่มีเนื้อหาที่เกี่ยวข้องโดยตรงกับงานของฉันในการสร้างภาพและการออกแบบข้อมูลโดยคาดว่าจะมีเพียงไม่กี่ป้ายเท่านั้น: ฉันสิ้นสุดการติดฉลากทุกบทยกเว้นหนึ่งบท
  • หลักการสากลของการออกแบบโดยร็อกกด หนังสือที่มีความทะเยอทะยานและมีประโยชน์มากซึ่งทำให้เกิดการวิจัยทางวิทยาศาสตร์เกี่ยวกับความรู้ความเข้าใจกับกรณีศึกษาและตัวอย่างจากการออกแบบในทุกสาขาเป็นชุดที่มีความชัดเจนและตรงไปตรงมาถึงจุดกระจายสองหน้า ข้อเสนอแนะในทางปฏิบัติตัวอย่างการทำงานและแนะนำการอ่านเพิ่มเติม กระตุ้นมาก ๆ ตราบใดที่คุณคิดว่ามันเป็นรายการของเครื่องมือที่มีการใช้งานที่แนะนำไม่ใช่รายการของกฎ

ข้อเสียเพียงอย่างเดียวคือวิธีการนี้ใช้เวลาคิดมากขึ้นเพื่อดูว่าหลักการดังกล่าวมีผลบังคับใช้อย่างไร หากคุณกำลังมองหารายชื่อของกฎเกณฑ์ตามอำเภอใจหลาย ๆ คนในชุมชนข้อมูลที่ดูเหมือนจะเป็นฉันจะบอกว่าไม่มีใครและจะไม่มีวันยกเว้นที่ที่ผู้คนตั้งสมมติฐานและวางนัยทั่วไปที่ไม่ยุติธรรม . การวิจัยประยุกต์ที่มีคุณภาพดีกว่านั้นมีประโยชน์ แต่มันช่วยให้มีกรอบที่มั่นคงซึ่งสามารถเสียบเข้ากับ

หลักการทั่วไปส่วนใหญ่ของ Tufte เช่น data-ink และ chart-junk สามารถตรวจสอบย้อนกลับไปยังหลักการทั่วไปที่มั่นคงเช่นอัตราส่วนสัญญาณรบกวนสัญญาณภาพร่างพื้นการลดทอนและอื่น ๆ - แต่บนเส้นทางสู่การเป็นสนามเฉพาะและกำหนด พวกเขาได้รับการรวมเข้ากับสมมติฐานและข้อสรุปทั่วไปเกี่ยวกับวัตถุประสงค์และผู้ชมของคุณที่ทำให้พวกเขากลายเป็นเครื่องมือทู่ ความขัดแย้งและการถกเถียงที่ชัดเจนจำนวนมากในการวิจัยประยุกต์นั้นไม่ได้ขัดแย้งอะไรเลยถ้าคุณย้อนกลับไปพิจารณาบริบทและทำงานผ่านจากหลักการสำคัญพื้นฐานและคุณสมบัติเฉพาะของแต่ละกรณี

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.