แสดงข้อมูลประชากรอย่างมีประสิทธิภาพบนแผนที่ที่พิมพ์


29

ฉันต้องการลงจุดข้อมูลต่อไปนี้ (รวม 30 โซน) บนแผนที่ที่สามารถพิมพ์ได้ / ไม่ใช่แผนที่แบบโต้ตอบ:

  • อายุเฉลี่ย
  • รายได้ของครัวเรือนโดยเฉลี่ย
  • จำนวนครัวเรือน
  • ความหนาแน่นของประชากร
  • จำนวนคน
  • จำนวนคนงาน

คุณจะแสดง 6 เลเยอร์ด้านบนอย่างมีประสิทธิภาพบนแผนที่เดียวได้อย่างไร


1
โซนมีขนาดใหญ่เท่าใดเมื่อเทียบกับขนาดหน้า คุณสามารถใส่โครงเรื่องเล็ก ๆ ในแต่ละโซนได้หรือไม่? (เช่นแผนภูมิเรดาร์)
djq

@celenius - เป็นประเภทการสำรวจสำมะโนประชากรทั่วไปที่เขตเมืองมีขนาดเล็กกว่าเขตที่อยู่อาศัยซึ่งมีขนาดเล็กกว่าเขตชานเมือง / เขตชนบทอย่างมีนัยสำคัญ
dassouki

1
6 เลเยอร์บนแผนที่แบบคงที่นี้เป็นงานออกแบบที่ยาก ปัญหาในการป้องกันการใช้งานแผนที่แบบโต้ตอบคืออะไร?
Trevesy

@Trevesy - ส่วนใหญ่ความต้องการคือการออกแบบแผนที่ที่พิมพ์ได้ซึ่งเน้นถึงตัวแปร 6 ตัวเพื่อส่งเสริมการวิเคราะห์ด้วยภาพ
dassouki

1
ฉันมีเสรีภาพที่จะเพิ่มแท็กการสร้างภาพรู้สึกอิสระที่จะลบมันถ้าคุณคิดว่ามันไม่เหมาะสม
Andy W

คำตอบ:


20

ฉันจะบอกว่าคุณไม่สามารถรวมข้อมูลทั้งหมดนั้นไว้ในแผนที่เดียวและทำให้มันสมเหตุสมผล ฉันขอแนะนำให้คุณคิดตามแนวของหลักการของทวีคูณขนาดเล็กที่มีแผนที่เล็ก ๆ หลายแห่งในพื้นที่เดียวกันโดยใช้ตัวแปรที่แตกต่างกัน ตัวอย่าง: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

ถึงแม้คุณจะมีปัญหาที่คุณใช้หน่วยต่าง ๆ มากมายดังนั้นคุณต้องใช้กุญแจจำนวนมาก อีกวิธีในการดูข้อมูล (แต่ไม่ใช่ในแผนที่) คือการใช้ตารางที่มีค่าทั้งหมดสี (เช่น - สีที่ต่างกันสำหรับค่าเฉลี่ยต่ำกว่าค่าเฉลี่ยสูงกว่าค่าเฉลี่ย)

จะแนะนำให้คุณดูแผนที่สำมะโนประชากรสำหรับแนวคิดแผนที่เพิ่มเติม: http://www.census.gov/population/www/cen2000/censusatlas/

อาจช่วยสะท้อนเพิ่มเติมเกี่ยวกับข้อความที่คุณพยายามสื่อสารได้อย่างแน่นอน (ไม่ใช่เฉพาะข้อมูลที่คุณมี)


5
1 นี่คือไกลดีกว่าทำให้เป็นระเบียบโดยพยายามที่จะเป็นสัญลักษณ์หกตัวแปรในครั้งเดียว นอกจากนี้ทำไมไม่พิมพ์ตารางข้อมูล? หกคอลัมน์ + id, 30 แถว: มีขนาดเล็กเพียงพอและให้รายละเอียดทั้งหมดที่ทุกคนต้องการ
whuber

13

ไม่สามารถแสดงข้อมูลจำนวนมากได้อย่างมีประสิทธิภาพบนแผนที่เดียว ความเป็นไปได้สองอย่าง:

  • ผลิต 6 แผนที่

  • วิเคราะห์ข้อมูลของคุณเพื่อจำแนกภูมิภาคของคุณและแสดงผลลัพธ์ของการจำแนกประเภท การวิเคราะห์องค์ประกอบหลักสามารถช่วยในการกำหนดความสัมพันธ์ที่สำคัญที่สุดภายในตัวแปรของคุณ วิธีนี้ถูกใช้เพื่อสร้างแผนที่สังเคราะห์นี้:

ข้อความแสดงแทน

จากคนเหล่านี้:

ข้อความแสดงแทน ข้อความแสดงแทน


ปัญหาของการมี 6 แผนที่คือมันยากที่จะมองเห็นแนวโน้มใด ๆ บางครั้งมันเป็นเรื่องดีที่ได้ดูแผนที่ที่มีตัวแปรหลายตัวและดูว่าสิ่งต่างๆเข้ากันได้อย่างไร
dassouki

2
@dassouki เพื่อดูว่าสิ่งที่จัดเรียงคุณไม่จำเป็นต้องทำแผนที่พวกเขา Scatterplots ของ Bivariate จะตรงตามเกณฑ์นั้นและจะตีความได้ง่ายกว่ามาก
Andy W

3
ประโยชน์ของการมี 6 แผนที่ก็คือว่ามันง่ายต่อการระบุแนวโน้มสายตา! เมื่อคุณพยายามรวบรวมตัวแปรหกตัว (หรือมากกว่า) ลงในแผนที่เดียวมันอาจยากที่จะหารูปแบบ (หากแผนที่นี้เกี่ยวข้องกับคุณสมบัติหลายพันฉันจะเปลี่ยนคำพูดนี้แม้ว่า: การทำแผนที่บางชนิดเช่นการสร้างภาพกราฟิกส์มีประสิทธิภาพอย่างน่าทึ่งสำหรับการค้นหารูปแบบในชุดข้อมูลหลายตัวแปรที่หลากหลาย: lmi.bwh.harvard.edu/papers/papers/papers/ KindlmannTVCG2006.html )
whuber

@ จูเลียนสิ่งดีๆคุณอาจสนใจในบทความนี้ฉันเพิ่งเจอe-publications.org/ims/submission/index.php/AOAS/user/ ......มันมีแผนที่พร้อมการวิเคราะห์ PCA ที่เกี่ยวข้องของตัวแปรหลายตัวที่คล้ายกัน ข้อมูลเช่นเดียวกับรหัส R เพื่อให้แปลง
Andy W

น่าสนใจจริง ๆ ฉันจะต้องอ่านเกี่ยวกับเรื่องนี้
neuhausr

9

ฉันยอมรับว่าทวีคูณเล็ก ๆ น่าจะเป็นวิธีที่ดีในการแก้ไขปัญหานี้ เพื่อเสริมแผนที่ฉันขอแนะนำเมทริกซ์กระจายของตัวแปรของคุณซึ่งจะระบุความสัมพันธ์แบบ bivariate ในขณะที่ข้อมูลทางภูมิศาสตร์ของข้อมูลของคุณสูญเสียไปมันเป็นเรื่องง่ายกว่ามากที่จะเห็นภาพความสัมพันธ์ระหว่างตัวแปรในรูปแบบกระจายมากกว่าที่จะเปรียบเทียบสองแผนที่ (แม้เคียงข้างกัน)

หากคุณยังต้องการให้มีแนวโน้มเกี่ยวกับอวกาศคุณสามารถรวมสถิติเชิงพื้นที่ (เช่น Moran I ท้องถิ่น) ระหว่างการแจกแจงและ / หรือตัวแปรดั้งเดิม

แก้ไข: เมื่อเร็ว ๆ นี้ฉันได้เจองานบางอย่างที่ได้รับการตีพิมพ์ซ้ำอีกครั้งเกี่ยวกับสถิติทางจริยธรรมที่เผยแพร่โดย Andre-Michel Guerry (แต่เดิมในปี 1883) ที่มีเป้าหมายในการแสดงภาพความสัมพันธ์หลายตัวแปรในอวกาศ การใช้งานของผู้เขียนเหล่านั้นคล้ายกันมากกับสิ่งที่ได้รับการแนะนำในหัวข้อนี้ทวีคูณขนาดเล็กการวิเคราะห์องค์ประกอบหลักเมทริกซ์พล็อตการกระจายและภายในไดอะแกรมรูปหลายเหลี่ยม แนบมาเป็นรูปภาพจาก A.-M. สถิติเชิงจริยธรรมของ Guerry ของฝรั่งเศส: ความท้าทายสำหรับการวิเคราะห์เชิงพื้นที่หลายตัวแปร โดย: Michael Friendly Science Science, Vol. 22, ลำดับที่ 3 (สิงหาคม 2550), หน้า 368-399 ( PDFฟรี) บทความอื่น ( Dray และ Jombart, 2010 ) วิเคราะห์ข้อมูลเดียวกันและมีซอร์สโค้ดบางตัวใน R เพื่อจัดทำแปลงดังกล่าว

ภาพหนึ่งเป็นเมทริกซ์กระจายภาพอีกภาพหนึ่งเรียกว่าแผนภาพดาว (ซึ่งเป็นวิธีที่แตกต่างในการนำเสนอแผนภูมิแท่งตามที่แนะนำ Pablo) ข้อความแสดงแทน ข้อความแสดงแทน


8

นี่คือตัวอย่างที่ยอดเยี่ยมของหลายขนาดเล็กโพสต์บน (และบล็อกของ บริษัท ) แอนดรู Gelman ของสถิติการสร้างแบบจำลองเชิงสาเหตุการอนุมานและสังคมศาสตร์ แผนที่สนับสนุนการใช้บัตรกำนัลโรงเรียนตามรัฐเงื่อนไขรายได้เชื้อชาติและศาสนาประเภทต่างๆ ผู้ที่ไม่ใช่ผู้เผยแพร่ศาสนาขาวจริง ๆ ไม่ชอบบัตรกำนัลโรงเรียน! (หากคุณไปที่บล็อกจริงแม้ว่าจะปรากฏในข้อมูลการสำรวจปี 2004 พวกเขาจะได้รับการสนับสนุนเพิ่มเติมสำหรับบัตรกำนัลโรงเรียนในกลุ่มนั้น) ป้อนคำอธิบายรูปภาพที่นี่


กราฟดูเท่ แต่ระดับสีน่ากลัว เหตุใดจึงจัดลำดับความสำคัญ 50% โดยทำให้เป็นสีเทา แน่นอนมันควรใช้สี heatmap หรืออะไร? ทำไมคนผิวขาวถึงแยกศาสนา? แน่นอนว่ามันจะสมเหตุสมผลมากกว่าถ้าแยกจากเชื้อชาติและจากศาสนา?
naught101

@ naught101 ฉันสับสนเล็กน้อยจากการปฏิเสธของคุณ แน่นอนว่าสีเทานั้นถูกย่อส่วนเมื่อเทียบกับสีที่สว่างกว่าหรือเข้มกว่าที่ปลายทั้งสอง ในขณะที่ฉันไม่เข้าใจเกี่ยวกับการเบี่ยงเบนโดยพลการที่ 45%, IMO เมื่อสร้างแผนที่ขนาดเล็กหลาย ๆ แบบเช่นนี้มันมีประโยชน์ที่จะมีค่าที่ตัดกันอย่างมาก ความคิดเห็นเกี่ยวกับการแบ่งแยกศาสนา / เชื้อชาตินั้นไม่สมเหตุสมผลนักทั้ง IMO เหล่านี้เป็นหมวดหมู่ที่เกี่ยวข้องอย่างชัดเจนกับว่า indvidiual รองรับบัตรกำนัลหรือไม่และดูเหมือนว่าชุดย่อยบางส่วนที่คุณแนะนำไม่มีอยู่จริง ต่อ ...
Andy W

IE ฉันสงสัยอย่างมากว่ามี "แบล็กคา ธ อลิก" เพียงพอในการสำรวจเพื่อพูดอะไรที่สำคัญเกี่ยวกับกลุ่มดังกล่าว (หรือ "โปรเตสแตนต์ Non-Evang สเปนและโปรตุเกส) ฉันขอแนะนำให้คุณอ่านโพสต์โดย Gelman และหวังว่าจะทำให้แรงจูงใจ กลุ่มย่อย
Andy W

บางทีมันอาจเป็นเพียงแค่สีเทาที่ปรากฏบนหน้าจอของฉัน ฉันคิดว่ามันคงจะดีกว่ากับสีขาวและอาจเป็นพื้นหลังสีเทาเพื่อแยกความแตกต่าง นอกจากนี้ยังมีข้อสังเกตว่าภาพสองภาพในบล็อกของเจลแมนมีขนาดต่างกัน ... ฉันรู้สึกว่าประชากรดำสูงกว่ามาก แต่ฉันแค่ดูข้อมูลการสำรวจสำมะโนประชากรและแก้ไขให้ถูกต้อง สิ่งหนึ่งที่แปลกก็คือการสำรวจสำมะโนประชากรกำหนดต้นกำเนิดของเขาเป็น orthogonal เพื่อการแข่งขัน (มันเป็นคำถามที่แยกต่างหาก) ฉันเดาว่าความแตกต่างของ Gelman นั้นถูกนิยามไว้แตกต่างกัน ..
naught101

@ naught101 นี้ไม่ได้ข้อมูลจากการสำรวจสำมะโนประชากรมันมาจากการสำรวจอื่น ๆ (การสำรวจสำมะโนประชากรไม่ได้มีความคิดเห็นของประชาชนเกี่ยวกับเรื่องนี้)
Andy W

5

ในการเลือกระหว่างโซลูชันที่นำเสนอที่นี่คุณสามารถให้ข้อมูลสำคัญสองประการ:

  • แผนที่มีจุดประสงค์อะไร? (ค้นพบเปิดเผยหรือไม่)
  • สาธารณะเจตนาของแผนที่คืออะไร? (คุณนักวิเคราะห์เพื่อนนักวางผังเมืองสาธารณะ)

โซลูชันที่อ้างถึงในที่นี้อาจมีประสิทธิภาพแตกต่างกันไปตามวัตถุประสงค์และสาธารณะ

ฉันต้องการจะสรุปคำตอบของ Julien (หนึ่งแผนที่สังเคราะห์โดยวิธี PCA) โดยอ้างถึงเทคนิคของการทแยงมุมเมทริกซ์โดย J. Bertin มันมีประโยชน์เมื่อเราค้นหาข้อมูลทั้งหมดแทนที่จะเป็นการนำเสนอข้อมูลที่สมบูรณ์

โดยย่อมันประกอบด้วยตัวแทนแต่ละตัวแปรด้วยฮิสโตแกรมจัดเรียงฮิสโตแกรมสแต็คในลักษณะที่ค่า (โซนแผนที่) จัดเรียงในแนวทแยงมุมเพื่อให้ได้ลักษณะดังนี้

ข้อความแสดงแทน

(ที่มา: http://books.google.co.th/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )


4

นั่นเป็นข้อมูลจำนวนมากและเป็นความจริงที่ว่าแผนที่เดียวที่รวมเข้าด้วยกันในรูปแบบเฉพาะเรื่องจะส่งผลให้เกิดการนำเสนอที่ไร้ประโยชน์เพราะมลภาวะทางสายตา ในทางกลับกันมี 30 โซนดังนั้นแผนที่จำนวนมากสำหรับแต่ละโซนจะส่งผลให้เกิดมลพิษเช่นกัน

คำตอบของฉัน: เลือกว่าอันไหนเป็นข้อมูลที่สำคัญที่สุดสมมติว่า 'รายได้ของครัวเรือน' จากนั้นจัดแบ่งแผนที่เป็นหมวดหมู่ของรายได้ และในที่สุดสำหรับจุดรายได้แต่ละแห่งให้พล็อตบาร์แชทกับแอตทริบิวต์อีก 5 รายการ

ด้วยแผนที่นั้นสามารถทำการเปรียบเทียบบางอย่างเช่น: "พื้นที่ที่มีรายได้สูงมักแสดงให้เห็นคนงานจำนวนมากและอายุเฉลี่ยมากกว่า 21 ปี"

ดูตัวอย่าง ...

ข้อความแสดงแทน


4

บางทีแนวคิดเหล่านี้อาจช่วยได้บ้าง

สมมติว่าคุณมีหกมิติ:

1: นักแสดง : รายได้ของครัวเรือนตัวอย่าง 0

2, 3 และ 4: สัญลักษณ์ : แสดงจำนวนคนเป็นจุดซึ่งสามารถให้คุณเห็นพื้นหลัง: ตัวอย่างที่ 1, ตัวอย่างที่ 2โดยใช้โทนสีเทาสำหรับคนงาน / ไม่ใช่คนงานและแบบแผนชุดสีที่แตกต่างกันเพื่อแสดงอายุ

5: 3D : การใช้ความหนาแน่นของประชากรเป็นตัวอย่างภูมิประเทศ3

6: (ฉันไม่สามารถคิดถึงวิธีที่ 6 ได้!)

มันซ้ำซ้อนหรือไม่ที่จะแสดง 'จำนวนครัวเรือน', 'ความหนาแน่นของประชากร' และ 'จำนวนคน'?

ฉันจะสงสัยถ้าแผนที่ที่มีความซับซ้อนนี้จะชัดเจนกับทุกคนนอกเหนือจากคุณ หากฉันกำลังนำเสนอฉันจะแสดงแต่ละองค์ประกอบแยกกันก่อนจากนั้นจึงเพิ่มเข้าไปเพื่อให้ผู้ชมเข้าใจขั้นตอน


อีกทางเลือกหนึ่ง (ถ้าคุณไม่มีที่ว่างสำหรับกราฟเรดาร์สำหรับแต่ละโซนอาจจะสร้าง 'สัญลักษณ์' แทนข้อมูลตัวอย่างนี้4 รูปที่ 10.28ฉันคิดว่าสิ่งเหล่านี้มักจะเข้าใจยากและไม่ใช่เรื่องง่ายในการออกแบบ ชัดเจน แต่ตัวอย่างที่เชื่อมโยงสามารถใช้ในกรณีนี้


อีกความคิดที่ฉันมีก็คือการขับไล่รูปหลายเหลี่ยมไปที่ความสูงเดียวกันสำหรับรูปหลายเหลี่ยมแต่ละรูปจากนั้นใช้ส่วนของความสูงเพื่อแสดงถึงพารามิเตอร์เหล่านี้ คล้ายกับการสร้างแผนภูมิแท่งสำหรับแต่ละพื้นที่ แต่ที่แต่ละส่วนจะอยู่ด้านบนสุดในช่วงเวลาเดียวกัน สิ่งนี้จะต้องดูจาก 3D ซึ่งจะหมายถึงบางส่วนจะถูกบดบัง


ฉันรักและฉันหมายถึงคำแนะนำทั้งหมดของคุณ ฉันวางแผนที่จะใช้งาน 1-> 4 อย่างไรก็ตามสำหรับสิ่ง 3 มิติ: ฉันพบว่าเมื่อคุณทำแผนที่ 3 มิติย่านใจกลางเมืองมักจะอยู่ในระดับความสูงปิดกั้นโซนด้านหลังมากมาย
dassouki

@dassouki - ฉันยอมรับว่าเป็นกรณีปกติ บางทีคุณอาจใช้ตัวแปรที่ไม่มีช่วงขนาดใหญ่สำหรับเรื่องนี้ (อายุเฉลี่ย?) หรือถ้าเป็นเช่นนั้นคุณก็สามารถเปลี่ยนลอการิทึมได้
djq

3
@celenius คำถามที่น่าสนใจเกี่ยวกับความเป็นไปได้ซ้ำซ้อน: ความหนาแน่นของประชากรเป็นจำนวนของผู้คนเมื่อเทียบกับพื้นที่ ; จำนวนคนคือการนับแน่นอน และจำนวนครัวเรือนให้ข้อมูลเกี่ยวกับการอยู่ร่วมกันของผู้คน แม้ว่าตัวแปรทั้งสามนี้จะมีความสัมพันธ์กันอย่างชัดเจน (และสามารถสร้างปัญหาที่เกิดจากความไม่ลงรอยกันในการถดถอย) แต่ก็เป็นข้อมูลที่แตกต่างกันสามส่วน BTW มันคือ "choropleth" (โชคดีที่ Google รับรู้การพิมพ์ผิดนี้และทำการค้นหาตามที่ต้องการ)
whuber

1
@whuber - ฉันคิดว่าอาจใช้แฟลช (น่าเสียดาย!)
djq

2
ฉันสงสัยมากเกี่ยวกับข้อเสนอแนะของ 3D AFAIK ไม่มีใครแสดงว่า 3D สามารถใช้งานได้มาก การเชื่อมโยงไปยังอาชญากรรมของซานฟรานนั้นทำได้ง่ายเพียงเพราะมันง่ายมาก - รูปแบบที่ซับซ้อนมากขึ้นนั้นยากที่จะถอดรหัส ฉันไม่คิดว่า 3D เป็นวิธีที่จะไปได้ทั้งหมดในกรณีนี้
Trevesy

2

มันเป็นงานที่ท้าทาย คำตอบของฉันคือไปกับแผนที่หลายตัวแปร ลองดูแผนที่นี้สิ แผนที่จะดูไม่ว่างหากคุณแสดงตัวแปรทั้งหมดในแผนที่เดียว ตรวจสอบให้แน่ใจว่าคุณเลือกชุดรูปแบบสีที่เหมาะสมหากคุณเลือกที่จะไปกับแผนที่หลายตัวแปร


Google เอกสารถูกบล็อกในที่ที่ฉันทำงาน :(
dassouki


ไม่ทำงานอย่างใดอย่างหนึ่งและฉันไม่สามารถขูดถ้ามันไม่มีนามสกุลไฟล์ในตอนท้ายของมัน
dassouki

ยังไม่ได้ไป ....
dassouki

นั่นคือบล็อกจากด้านข้างของฉัน :( ฉันไม่รังเกียจที่จะส่งแผนที่ให้คุณทางอีเมล
Raj

0

การทำให้เข้าใจง่ายระดับหนึ่งจะเป็นการแสดงรายการเดียวเช่นความหนาแน่นของประชากรผ่านรูปกราฟแท่งคือบิดเบือนพื้นที่ของแต่ละหน่วยเพื่อให้เป็นสัดส่วนกับจำนวนประชากร:

การเลือกตั้งประธานาธิบดีสหรัฐอเมริกาปี 2551
(ที่มา: amherst.edu )

ข้อเสียเปรียบหลักคือผู้ชมจะต้องสามารถรับรู้การบิดเบือนของโซนจากรูปร่าง "ปกติ" ของพวกเขา

ข้อมูลเพิ่มเติมที่นี่: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf


1
ฉันคิดว่านี่อาจเป็นไปได้ แต่ก็ไม่มีความชัดเจนว่าสามารถใช้ cartograms กับสถานการณ์นี้ได้ดีเพียงใด (ดูพร้อมกันหลายแอตทริบิวต์ในพื้นที่เดียวกัน) ในทางทฤษฎีคุณสามารถสร้างกล่องกระดาษหลายใบเล็ก ๆ ได้หลายใบ แต่มันอาจตีความได้ยาก (คุณสูญเสียความสอดคล้องระหว่างแผนที่ซึ่งเป็นสิ่งจำเป็นสำหรับหลายรายการ) บางที cartogram สามารถรวมกับสีด้วยวิธีที่น่าสนใจมากขึ้นในการแสดงหลายแอตทริบิวต์
Andy W

1
ตัวอย่างของกราฟ
Andy W
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.