คำอธิบายที่ง่ายสำหรับพล็อตพิกัดขนาน


13

ฉันได้อ่านและเห็นพล็อตพิกัดขนานมากมาย ใครสามารถตอบคำถามชุดต่อไปนี้:

  1. อะไรคือสมการพิกัดขนาน (PCP) ในคำง่ายๆเพื่อให้คนธรรมดาเข้าใจ
  2. คำอธิบายทางคณิตศาสตร์พร้อมปรีชาถ้าเป็นไปได้
  3. PCP มีประโยชน์เมื่อใดและควรใช้เมื่อใด
  4. PCP ไม่มีประโยชน์เมื่อใดและควรหลีกเลี่ยงเมื่อใด?
  5. ข้อดีและข้อเสียที่เป็นไปได้ของ PCP

หัวข้อที่ดี - คุณจะได้รับจำนวนมาก +1 สำหรับคำถามนี้ ...
Tal Galili

1
@Tal .. ขอบคุณ :-) แต่ฉันต้องการทราบเพิ่มเติมและอาจขยายบทความ Wiki ซึ่งไม่ให้ข้อมูลมากเกินไป
suncoolsu

แรงจูงใจที่ยอดเยี่ยม :)
Tal Galili

คำตอบ:


6

สำหรับฉันแล้วดูเหมือนว่าหน้าที่หลักของ PCP คือการเน้นกลุ่มบุคคลที่เป็นเนื้อเดียวกันหรือตรงกันข้าม (ในพื้นที่สองโดยการเปรียบเทียบกับ PCA) รูปแบบเฉพาะของการเชื่อมโยงกับตัวแปรที่แตกต่างกัน มันสร้างสรุปกราฟิกที่มีประสิทธิภาพของชุดข้อมูลหลายตัวแปรเมื่อไม่มีตัวแปรมากเกินไป ตัวแปรจะถูกปรับสัดส่วนโดยอัตโนมัติเป็นช่วงคงที่ (โดยทั่วไปคือ 0–1) ซึ่งเทียบเท่ากับการทำงานกับตัวแปรมาตรฐาน (เพื่อป้องกันอิทธิพลของตัวแปรหนึ่งไปยังตัวแปรอื่นเนื่องจากปัญหาการขยาย) แต่สำหรับชุดข้อมูลมิติสูงมาก (# ของตัวแปร> 10) แน่นอนคุณต้องมองไปที่การแสดงอื่น ๆ เช่นพล็อตผันผวนหรือแผนที่ความร้อนที่ใช้ในการศึกษา microarray

ช่วยตอบคำถามเช่น:

  • มีรูปแบบที่สอดคล้องกันของคะแนนส่วนบุคคลที่อาจอธิบายได้ด้วยการเป็นสมาชิกของกลุ่มเฉพาะ
  • จะมีการแปรปรวนร่วมอย่างเป็นระบบระหว่างคะแนนที่ตรวจพบกับตัวแปรสองตัวหรือมากกว่านั้น (เช่นคะแนนต่ำที่สังเกตได้จากตัวแปรนั้นสัมพันธ์กับคะแนนสูงใน )?X1X2

ในพล็อตข้อมูล Irisดังต่อไปนี้จะเห็นได้อย่างชัดเจนว่าสปีชีส์ (ที่แสดงในสีที่ต่างกัน) แสดงโปรไฟล์ที่แตกต่างกันมากเมื่อพิจารณาความยาวและความกว้างของกลีบดอกไม้หรือIris setosa (สีน้ำเงิน) มีลักษณะเหมือนกันมาก เช่นความแปรปรวนของพวกเขาต่ำกว่า) ตัวอย่างเช่น

ข้อความแสดงแทน

คุณสามารถใช้เป็นแบ็กเอนด์เพื่อจัดหมวดหมู่หรือเทคนิคการลดขนาดเช่น PCA บ่อยครั้งที่เมื่อดำเนินการ PCA นอกเหนือจากการลดพื้นที่คุณลักษณะแล้วคุณยังต้องการเน้นกลุ่มบุคคล (เช่นมีบุคคลที่มีคะแนนสูงขึ้นอย่างเป็นระบบในการรวมตัวแปร) สิ่งนี้มักจะเกิดจากการใช้การจัดกลุ่มแบบลำดับชั้นบางอย่างกับคะแนนปัจจัยและเน้นความเป็นสมาชิกคลัสเตอร์ที่เกิดขึ้นในพื้นที่แฟคทอเรียล (ดูแพ็คเกจ FactoClass R)

นอกจากนี้ยังใช้ใน clustergrams ( แสดงผลที่ไม่ใช่แบบลำดับชั้นและการวิเคราะห์คลัสเตอร์ลำดับชั้น ) ซึ่งมีวัตถุประสงค์เพื่อตรวจสอบว่าคลัสเตอร์วิวัฒนาการจัดสรรเมื่อเพิ่มจำนวนของกลุ่ม (ดูยังอะไรหยุดเกณฑ์สำหรับการจัดกลุ่มตามลำดับชั้น agglomerative ถูกนำมาใช้ในการปฏิบัติ? )

การแสดงดังกล่าวยังมีประโยชน์เมื่อเชื่อมโยงกับ scatterplots ปกติ (ซึ่งการก่อสร้าง จำกัด เฉพาะความสัมพันธ์แบบ 2 มิติ) สิ่งนี้เรียกว่าการแปรงและมีอยู่ในระบบสร้างภาพข้อมูลGGobiหรือซอฟต์แวร์Mondrian


4

เกี่ยวกับคำถาม 3, 4 และ 5 ฉันขอแนะนำให้คุณตรวจสอบงานนี้

รูปแบบการรับรู้ในพิกัดขนาน: การกำหนดเกณฑ์สำหรับการระบุความสัมพันธ์โดย: Jimmy Johansson, Camilla Forsell, Mats Lind, Matthew Cooper ใน การแสดงข้อมูล 7, ลำดับที่ 2 (2008), หน้า 152-162

เพื่อสรุปผลการค้นพบของพวกเขาผู้คนก็สามารถระบุทิศทางของความลาดชันของความสัมพันธ์ระหว่างแต่ละโหนดได้ แต่ก็ไม่ดีพอที่จะระบุความแข็งแกร่งของความสัมพันธ์หรือระดับความชัน พวกเขาให้ระดับเสียงที่แนะนำซึ่งผู้คนยังสามารถถอดรหัสความสัมพันธ์ในบทความ น่าเสียดายที่บทความไม่ได้กล่าวถึงการระบุกลุ่มย่อยผ่านสีเช่น chl แสดงให้เห็นถึง


4

กรุณาเยี่ยมชมhttp://www.cs.tau.ac.il/~aiisreal/และดูที่หนังสือเล่มใหม่

Parallel Coordinates - หนังสือเล่มนี้เกี่ยวกับการสร้างภาพข้อมูลอย่างเป็นระบบผสมผสานการจดจำรูปแบบของมนุษย์ที่ยอดเยี่ยมเข้ากับกระบวนการแก้ปัญหา ... www.springer.com/math/cse/book/978-0-387-21507-5

ในช. 10 มีตัวอย่างจริงจำนวนมากพร้อมข้อมูลหลายตัวแปรที่แสดงว่าสามารถใช้พิกัดขนาน (abbr. || -cs) ได้อย่างไร นอกจากนี้ยังควรเรียนรู้คณิตศาสตร์เพื่อให้เห็นภาพและทำงานกับความสัมพันธ์หลายตัวแปร / หลายมิติ (พื้นผิว) และไม่ใช่เพียงแค่ชุดจุด มันสนุกที่ได้เห็นและทำงานกับ analogues ของวัตถุที่คุ้นเคยในหลายมิติเช่นแถบ Moebius, ชุดนูนและอื่น ๆ

ในระยะสั้น | | -cs เป็นระบบพิกัดหลายมิติที่แกนขนานกับกันและกันทำให้มีจำนวนแกนมาก วิธีการได้ถูกนำไปใช้กับอัลกอริธึมการแก้ไขข้อขัดแย้งในการควบคุมการจราจรทางอากาศการมองเห็นคอมพิวเตอร์การควบคุมกระบวนการและการสนับสนุนการตัดสินใจ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.