ทางเลือกในการแปลงตะแกรง / โมเสคสำหรับตารางฉุกเฉิน


17

ครั้งหนึ่งฉันเคยเจอพล็อตประเภทหนึ่งสำหรับข้อมูลเชิงหมวดหมู่ (เช่นตารางฉุกเฉิน) บนอินเทอร์เน็ตซึ่งฉันชอบจริง ๆ แต่ฉันไม่เคยพบมันอีกเลยและไม่รู้ด้วยซ้ำว่าเป็นชื่ออะไร มันเป็นเหมือนพล็อตตะแกรงโดยที่ความสูงของแถวและความกว้างของคอลัมน์นั้นถูกปรับสัดส่วนเมื่อเทียบกับความน่าจะเป็นที่ขอบ ดังนั้นแต่ละกล่องจะถูกปรับสัดส่วนให้สอดคล้องกับความถี่สัมพัทธ์ที่คาดหวังภายใต้ความเป็นอิสระ อย่างไรก็ตามมันแตกต่างจากพล็อตตะแกรงในที่นั้นแทนที่จะพล็อตการฟักข้ามในแต่ละกล่องมันพล็อตจุด (เช่นใน scatterplot) ที่ตำแหน่งสุ่มเลือกจากชุด bivariate สำหรับการสังเกตแต่ละครั้ง ด้วยวิธีนี้ความหนาแน่นของคะแนนจะแสดงให้เห็นว่าการนับที่สังเกตได้นั้นตรงกับจำนวนที่คาดหวังมากเพียงใด นั่นคือถ้าความหนาแน่นมีความคล้ายคลึงกันในทุกช่องโมเดลแบบ null นั้นสมเหตุสมผล ) อาจไม่น่าเป็นไปได้มากนักภายใต้โมเดลว่าง เนื่องจากมีการพล็อตจุดแทนการฟักไข่จึงมีความสอดคล้องและเข้าใจง่ายระหว่างองค์ประกอบการวางแผนและการนับที่สังเกตซึ่งไม่จำเป็นต้องเป็นจริงสำหรับแปลงตะแกรง (ดูด้านล่าง) ยิ่งไปกว่านั้นการวางตำแหน่งของคะแนนแบบสุ่มให้ความรู้สึก 'อินทรีย์' นอกจากนี้สีสามารถใช้เพื่อเน้นกล่อง / เซลล์ที่แตกต่างอย่างมากจากตัวแบบ null และพล็อตเมทริกซ์สามารถใช้เพื่อตรวจสอบความสัมพันธ์แบบคู่ระหว่างตัวแปรต่าง ๆ มากมายดังนั้นจึงสามารถรวมข้อดีของพล็อตที่คล้ายกัน ผม,J

  • ไม่มีใครรู้ว่าพล็อตนี้เรียกว่าอะไร?
  • มีแพ็คเกจ / ฟังก์ชั่นที่จะทำสิ่งนี้ได้อย่างง่ายดายใน R หรือซอฟต์แวร์อื่น ๆ (เช่น Mondrian)? ฉันไม่สามารถหาอะไรเช่นนั้นในซีดี แน่นอนว่ามันยากที่จะเขียนโค้ดตั้งแต่เริ่มต้น แต่นั่นอาจเป็นความเจ็บปวด

นี่เป็นตัวอย่างง่ายๆของพล็อตตะแกรงสังเกตว่ามันง่ายที่จะเห็นว่าจำนวนนับที่คาดไว้สำหรับหมวดหมู่ที่แตกต่างกันควรเล่นในรูปแบบ null แต่ยากที่จะกระทบยอดฟักข้ามกับตัวเลขจริงทำให้พล็อตที่ไม่ใช่ค่อนข้างง่ายต่อการอ่านและน่ารังเกียจ:

    B ~B
 A 38  4
~A  3 19

ป้อนคำอธิบายรูปภาพที่นี่
สำหรับสิ่งที่คุ้มค่าพล็อตแบบโมเสคมีปัญหาตรงข้ามแม้ว่ามันจะง่ายกว่าที่จะดูว่าเซลล์ใดมีจำนวนมากเกินไปหรือน้อยเกินไป คาดว่าจะมีการนับ โดยเฉพาะอย่างยิ่งความกว้างของคอลัมน์จะถูกปรับสัดส่วนเมื่อเทียบกับความน่าจะเป็นที่ขอบ แต่ความสูงของแถวไม่ได้ทำให้ข้อมูลนั้นเป็นไปไม่ได้ที่จะแยกออกมา
ป้อนคำอธิบายรูปภาพที่นี่
และตอนนี้สำหรับบางสิ่งที่แตกต่างอย่างสิ้นเชิง ...

  • ไม่มีใครรู้ว่าการประชุมที่จะใช้สีฟ้าสำหรับ 'มากเกินไป' และสีแดงสำหรับ 'น้อยเกินไป' มาจากไหน? นี่เป็นสิ่งที่ขัดกับฉันมาตลอด มันดูเหมือนว่าฉันที่มีความหนาแน่นสูงล้ำ (หรือข้อสังเกตมากเกินไป) ไปกับความร้อนและความหนาแน่นต่ำไปกับความหนาวเย็นและที่ (อย่างน้อยในเวทีแสง) สีแดงมีความอุ่นและบลูส์มีCools

อัปเดต: หากฉันจำได้อย่างถูกต้องพล็อตที่ฉันเห็นอยู่ในรูปแบบไฟล์ PDF ของบท (บทนำหรือ ch1) จากหนังสือที่เผยแพร่ออนไลน์ได้อย่างอิสระในฐานะทีเซอร์การตลาด นี่คือแนวคิดคร่าวๆที่ฉันเขียนจากศูนย์:
ป้อนคำอธิบายรูปภาพที่นี่
ถึงแม้จะเป็นรุ่นหยาบฉันคิดว่ามันอ่านง่ายกว่าตะแกรงตะแกรงและในบางวิธีง่ายกว่ากระเบื้องโมเสคแปลง (เช่นง่ายต่อการรับรู้ความสัมพันธ์ของความสัมพันธ์ ระหว่างความถี่ของเซลล์จะอยู่ภายใต้ความเป็นอิสระ) มันจะดีที่จะมีฟังก์ชั่นที่: จะทำสิ่งนี้โดยอัตโนมัติด้วยตารางฉุกเฉินb. สามารถใช้เป็นหน่วยการสร้างของเมทริกซ์พล็อตและc จะมีคุณสมบัติที่ดีที่มาพร้อมกับแปลงข้างต้น (เช่นตำนานที่เหลือมาตรฐานบนพล็อตโมเสค)


ดังนั้นคุณต้องการพล็อตโมเสคที่มีการเติมที่แตกต่างออกไปใช่ไหม? ที่ไม่Rฟังก์ชั่นassocplotมาใกล้เคียงกับสิ่งที่คุณหมายถึงอะไร? ถ้าไม่ฉันพนันได้เลยว่าRโปรแกรมเมอร์สามารถแก้ไขสิ่งนั้นหรือmosaicplotทำสิ่งที่คุณต้องการ
Peter Flom - Reinstate Monica

1
การอ้างอิงที่เกี่ยวข้องที่น่าสนใจ, การแยกส่วนที่เหลือเพื่อการแสดงผล (เงื่อนไข) อิสรภาพ ( Zeileis และคณะ, 2007 ), PDF ที่นี่ , และเธรดอื่นที่นี่ในการแสดงตารางแสดงเหตุฉุกเฉินที่มีการอ้างอิงเล็กน้อย ฉันเชื่อว่าบทความ Zeileis มีการอภิปรายที่ดีเกี่ยวกับสีที่อาจตอบคำถามสุดท้ายของคุณ (อาจเป็นการดีที่จะอ่านการอ้างอิงเพื่อดูว่าพวกเขาอ้างถึงแผนภูมิที่คุณกำลังพูดถึงด้วยหรือไม่)
Andy W

มันตรงข้าม @PeterFlom ฉันต้องการพล็อตแบบตะแกรงด้วยการเติมที่แตกต่างกัน อีกทางหนึ่งคุณอาจบอกว่าฉันต้องการพล็อตโมเสคที่มีการแสดงขนาดกล่องเทียบกับความถี่ที่คาดหวังภายใต้ความเป็นอิสระ
gung - Reinstate Monica

"ไม่มีใครรู้ว่าการประชุมที่จะใช้สีฟ้าสำหรับ 'มากเกินไป' และสีแดงสำหรับ 'น้อยเกินไป' มาจากไหนนี่เป็นสิ่งที่ขัดกับฉันเสมอ" จุดดี. มันตอบโต้ได้ง่าย คลื่นแสงไปลวก ๆ จากสีฟ้าด้านซ้าย (ที่เกี่ยวข้องกับความยาวคลื่นขนาดเล็ก) สีแดงด้านขวา (ที่เกี่ยวข้องกับความยาวคลื่นขนาดใหญ่) การแสดงโมเสกดูเหมือนว่าจะย้อนกลับไปที่หัว ...
landroni

แนวคิดของไดอะแกรมตะแกรงคือจำนวนกล่องในแต่ละเซลล์เป็นสัดส่วนกับความถี่ที่สังเกตดังนั้นความหนาแน่นสัมพัทธ์จะแสดงความถี่ที่มากกว่าหรือน้อยกว่าที่คาดไว้ หากคุณไม่ชอบสีคุณสามารถเปลี่ยนได้อย่างง่ายดายจากค่าเริ่มต้น หากคุณไม่ชอบฟังก์ชั่นการแรเงาตะแกรงเริ่มต้นคุณสามารถเขียนของคุณเองได้อย่างง่ายดายเช่นshading.points()ทำสิ่งที่คุณต้องการภายใต้กรอบโครงสร้าง Strucplot ที่อ้างถึงข้างต้นและสามารถใช้เป็นบทความสั้น ๆ ในvcdแพ็คเกจ
user101089

คำตอบ:


15

หนังสือที่คุณอธิบายดูเหมือนจะเป็น 'การแสดงภาพข้อมูลหมวดหมู่' เป็นมิตรกับ Michael พล็อตที่อธิบายไว้ในบทที่ 1 ที่ดูเหมือนจะตรงกับคำขอของคุณถูกอธิบายว่าเป็นรูปแบบแนวคิดรวบยอดสำหรับการแสดงข้อมูลตารางฉุกเฉิน (ผู้แต่งอธิบายอย่างหลวม ๆ ว่าเป็นแบบจำลองแรงกดดันแบบไดนามิกที่มีความหนาแน่นเชิงสังเกตการณ์) และสามารถเห็นได้ในตัวอย่าง Google สำหรับ Ch 1. หนังสือเล่มนี้เหมาะสำหรับผู้ใช้ SAS

มีการอ้างอิงบทความในหัวข้อที่นี่: www.datavis.ca/papers/koln/kolnpapr.pdf

'แบบจำลองแนวคิดสำหรับแสดงผลข้อมูลตารางฉุกเฉิน,' Michael Friendly

http://i47.tinypic.com/148n5n7.jpg

ป้อนคำอธิบายรูปภาพที่นี่

* โดยบังเอิญผู้เขียนยังได้รับการระบุว่าเป็นหนึ่งในผู้เขียนของแพ็คเกจ vcd (เนื่องจากได้รับแรงบันดาลใจมาจากหนังสือของเขาที่กล่าวถึงข้างต้น) - บางทีคุณอาจถามเขาโดยตรงว่ามีการดัดแปลงอย่างใดอย่างหนึ่งของฟังก์ชั่น ไม่ชัดเจน

** โทนสีดูเหมือนว่าเกี่ยวข้องกับสีฟ้าที่มีการเบี่ยงเบนเชิงบวกจากความเป็นอิสระและสีแดงสำหรับการเบี่ยงเบนเชิงลบ แม้ว่ารูปแบบสีแดงจะเข้าท่าในบริบทนั้นบางทีอาจจะเป็นการฉลาดกว่าที่จะใช้สีเขียวเพื่อแสดงความเบี่ยงเบนเชิงบวก

http://www.datavis.ca/papers/asa92.html


2
การทำงานที่ดีความลึกลับได้รับการแก้ไข! ฉันจำเป็นต้องซื้อหนังสือจริงแทนที่จะดูตัวอย่างเป็น tid-bits ต่างๆและให้ห้องสมุดของฉันส่งบทมาให้ฉันเป็นระยะ ๆ IMO รูปแบบของการสร้างภาพข้อมูลทำให้ฉันนึกถึงสิ่งที่นักทำแผนที่เรียกว่า "dot maps" และเราสามารถใช้วรรณกรรมจากที่นั่นเพื่อพิสูจน์ว่าจุดนั้นเป็นเครื่องมือสร้างภาพข้อมูลที่ดีกว่าเส้นและการฟักข้ามเส้น นอกจากนี้ยังเป็นวรรณกรรมที่ดีในแง่ของตำแหน่งพิเศษของจุด
Andy W

นี่เป็นการเริ่มต้นที่ดีสำหรับฉัน ขอบคุณสำหรับความช่วยเหลือของคุณ.
gung - Reinstate Monica

1

อาจไม่ใช่สิ่งที่คุณเห็น แต่สำหรับการแสดงภาพออกที่คาดหวังภายใต้ความเป็นอิสระ แปลงจดหมายมีแรงจูงใจที่ดี

http://www.jstatsoft.org/v20/i03/

(นอกเหนือจากนั้นหนังสือของ SAS และ M Friendly ถูกเข้าใจผิดเกี่ยวกับการปรับที่แนะนำและแผนการจำนวนมากมีสิ่งประดิษฐ์ในพวกเขาและสิ่งนี้อาจเบี่ยงเบนความสนใจไปจากค่าที่รับรู้)


ขอบคุณสำหรับความช่วยเหลือของคุณฉันชอบแปลงติดต่อ คุณช่วยพูดเพิ่มเกี่ยวกับการปรับที่แนะนำนี้ที่เข้าใจผิดได้ไหม? มันคือการปรับอะไร? มันไม่ถูกต้องอย่างไร และมีอะไรผิดปกติกับแผนการ?
gung - Reinstate Monica

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.