แหล่งข้อมูลออนไลน์ที่ดีพร้อมเคล็ดลับในการเชื่อมโยงกราฟระหว่างตัวแปรตัวเลขสองตัวภายใต้เงื่อนไขต่าง ๆ


22

บริบท:

ในขณะที่ฉันได้รับชุดของฮิวริสติกเกี่ยวกับวิธีการกำหนดความสัมพันธ์ระหว่างตัวแปรตัวเลขสองตัวอย่างมีประสิทธิภาพ ฉันคิดว่าคนส่วนใหญ่ที่ทำงานกับข้อมูลจะมีชุดของกฎที่คล้ายกัน

ตัวอย่างของกฎดังกล่าวอาจเป็น:

  • หากตัวแปรตัวใดตัวหนึ่งเอียงเชิงบวกให้พิจารณาการวางแผนแกนนั้นในระดับบันทึก
  • หากมีจุดข้อมูลจำนวนมาก (เช่น n> 1,000) ให้ใช้กลยุทธ์ที่แตกต่างเช่นการใช้ความโปร่งใสบางส่วนหรือสุ่มตัวอย่างข้อมูล
  • หากตัวแปรตัวใดตัวหนึ่งมีจำนวนหมวดหมู่ไม่ต่อเนื่องกันให้พิจารณาใช้ส่วนที่กระวนกระวายใจหรือเนื้อเรื่องของดอกทานตะวัน
  • หากมีสามตัวหรือมากกว่าให้ลองใช้เมทริกซ์ scatterplot
  • การปรับเทรนด์ไลน์บางรูปแบบมักมีประโยชน์
  • ปรับขนาดของอักขระการพล็อตเป็นขนาดตัวอย่าง (สำหรับ n ที่ใหญ่กว่าให้ใช้อักขระการพล็อตที่เล็กกว่า)
  • และอื่น ๆ

คำถาม:

ฉันต้องการที่จะสามารถอ้างถึงนักเรียนไปยังหน้าเว็บหรือเว็บไซต์ที่อธิบายถึงเทคนิคเหล่านี้และเทคนิคอื่น ๆ สำหรับการวางแผนความสัมพันธ์ระหว่างตัวแปรตัวเลขสองตัวได้อย่างมีประสิทธิภาพหรืออาจเป็นตัวอย่าง

  • มีหน้าเว็บหรือเว็บไซต์บนอินเทอร์เน็ตที่ใช้งานได้ดีหรือไม่?

2
หากคุณสามารถหาได้คู่มือ "กราฟิก" ที่พิมพ์มาพร้อมกับสำเนาเก่าของ Systat (pre-Windows เชื่อหรือไม่) จะเป็นทรัพยากรที่ยอดเยี่ยม มันไม่เพียงแสดงให้เห็นถึงกฎเหล่านี้ทั้งหมด (ตามที่ฉันจำได้) มันเต็มไปด้วยสาระสำคัญและคำแนะนำที่ยอดเยี่ยม
whuber

2
@whuber ความคิดเห็นที่ดี Leland Wilkinson ผู้เขียนหลักของ Systat และผู้เขียนThe Grammar of Graphics (ซึ่งเป็นหนังสือวิทยาศาสตร์คอมพิวเตอร์มากกว่าหนังสือสถิติ) มีรสชาติที่ดีมากสำหรับการแสดงผลกราฟิกของข้อมูล การนำเสนอของเขามีประสิทธิภาพมากในการส่งข้อความ
StasK

@ Jeromy คุณอาจรู้จักแพ็คเกจggplot2สำหรับ R แล้ว แต่ตอนนี้มีการกล่าวถึง Grammar of Graphics ฉันก็คิดว่าจะพูดถึงเช่นกัน ฉันพบแพ็คเกจหนังสือและคู่มืออ้างอิงออนไลน์โดย Hadley Wickham มีประโยชน์มากสำหรับการเปลี่ยนตัวแปรตัวเลขให้เป็นแปลงและกราฟิกที่มีประโยชน์
NRH

1
@Jeromy เหตุใดจึงไม่ใช้ถ้อยคำใหม่สำหรับคำถาม (แยกกัน) เป็นวิกิชุมชนขอหนึ่งโพสต์ต่อกฎ? ด้วยวิธีนี้แทนที่จะเป็นชุดลิงก์เราอาจมีกฎที่กำหนดค่าได้และสร้างทรัพยากรที่นี่
David LeBauer

@ David เอาล่ะฉันได้เพิ่มคำถามทั่วไปวิกิพีเดียของชุมชนในทรัพยากรที่ดีที่สุดสำหรับการออกแบบแปลงstats.stackexchange.com/questions/16631/...
Jeromy Anglim

คำตอบ:


13

ฉันไม่สามารถนึกถึงแหล่งข้อมูลออนไลน์ที่ยอดเยี่ยมนอกหัวของฉันได้ แต่บทหนังสือที่ดี (และดาวน์โหลดได้ง่าย) ที่บรรยายวิธีการสำรวจข้อมูลขนาดใหญ่หลายมิติแบบมองเห็นด้วยสายตาอย่างรอบคอบคือBrendan O'Connor และ Lukas Biewald บท (คำเตือน: การเชื่อมโยงโดยตรงไปยังไฟล์ PDF) จากที่สวยงามข้อมูล บทนี้มีประโยชน์โดยเฉพาะอย่างยิ่งเป็นทรัพยากรการเรียนการสอนเพราะมันรวมรหัส R ลงในการบรรยาย

นอกจากนี้เมื่อพิจารณาเพิ่มเติมฉันคิดว่าคลาสสิกของจอห์นทูกีย์คลาสสิก"การแสดงผลกราฟิกและการจัดแสดงนิทรรศการบางอย่าง" (โพสต์อย่างสะดวกสบายบนเว็บไซต์ของเอ็ดเวิร์ด Tufte) เป็นสิ่งที่ยอดเยี่ยมจริงๆ

ด้วยเหตุผลบางอย่างฉันคิดจะอ่านบทหนังสือ ...


+1 อย่างน้อยบทเหล่านี้มีอยู่บนเว็บ: ฉันคิดว่ามีคุณสมบัติเหมาะสม ขอบคุณแอรอน
whuber

@ whuber ขอบคุณที่โพสต์ค่าหัว และ @ashaw ลิงก์ทั้งสองทำให้การอ่านน่าสนใจ
Jeromy Anglim

ฉันสังเกตเห็นว่าบทความ Tukey เป็นบรรพบุรุษของการรักษาแบบขยายที่พบในหนังสือของเขาEDA (1977) (ยกเว้นส่วนสุดท้ายของการแขวนรูตอแกรมและฮิสโทแกรม)
whuber

11

ข้อมูลอ้างอิงล่าสุด:

เก่ากว่า แต่แหล่งข้อมูลที่เกี่ยวข้อง


3
+1 กฎและแบบฝึกหัดดูมีประโยชน์ครอบคลุม - และห้ามใช้! มันเป็นวิธีการที่เป็นไปได้ที่จะเขียนเกี่ยวกับกราฟิกโดยไม่ต้องให้เป็นภาพเดียว ? :-)
whuber

1
ตัวเลือกนั้นยาก แต่ฉันได้รับรางวัลสำหรับคำตอบนี้เพราะโดยรวมแล้วมันตอบคำถามได้ดีที่สุด เอกสารสหประชาชาติดูเหมือนจะเป็นประโยชน์อย่างยิ่งและสามารถเข้าถึงได้โดยนักเรียนด้วยภาษาธรรมดาและตัวอย่างที่ชัดเจนมากมาย
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.