วิธีการปรับขนาดไวโอลินสำหรับการเปรียบเทียบ?


14

ฉันกำลังพยายามวาดไวโอลินและสงสัยว่ามีวิธีปฏิบัติที่ดีที่สุดที่ยอมรับได้สำหรับการปรับขนาดพวกมันข้ามกลุ่มหรือไม่ นี่คือสามตัวเลือกที่ฉันได้ลองใช้mtcarsชุดข้อมูลR (Motor Trend Cars จากปี 1973 พบได้ที่นี่ )

ความกว้างเท่ากัน

ดูเหมือนจะเป็นสิ่งที่กระดาษต้นฉบับ * ทำและสิ่งที่ R vioplotทำ ( ตัวอย่าง ) ดีสำหรับการเปรียบเทียบรูปร่าง

แผนการไวโอลินพื้นที่ที่เท่าเทียมกัน

พื้นที่ที่เท่าเทียมกัน

ให้ความรู้สึกถูกต้องเนื่องจากแต่ละพล็อตเป็นพล็อตความน่าจะเป็นดังนั้นพื้นที่ของแต่ละอันควรเท่ากับ 1.0 ในพื้นที่ประสานงานบางแห่ง ดีสำหรับการเปรียบเทียบความหนาแน่นภายในแต่ละกลุ่ม แต่ดูเหมือนจะเหมาะสมกว่าหากมีการวางทับ

พล็อตไวโอลินความกว้างเท่ากับ

พื้นที่ถ่วงน้ำหนัก

ชอบพื้นที่เท่ากัน แต่ถ่วงน้ำหนักตามจำนวนการสังเกต 6 สูบค่อนข้างบางลงเนื่องจากมีรถยนต์น้อยกว่า ดีสำหรับการเปรียบเทียบความหนาแน่นข้ามกลุ่ม

แปลงพื้นที่ไวโอลินแบบถ่วงน้ำหนัก

* พล็อตไวโอลิน: Synergis พล็อตกล่องความหนาแน่นของการติดตาม (DOI: 10.2307 / 2685478)


1
วัตถุประสงค์ของแผนการจะกำหนดขอบเขตการแก้ไขปัญหาที่เหมาะสม คุณพยายามแสดงอะไรกับพวกเขา
whuber

@whuber เป็นคำถามที่ดี แต่ฉันไม่มีคำตอบโดยตรง ฉันพยายามที่จะให้กราฟิกสำหรับ EDA และกำลังมองหาค่าเริ่มต้นทั่วไปที่ดี (และตัวเลือกอื่น ๆ นั้นมีประโยชน์มากพอที่จะแสดงหรือไม่)
xan

ฉันอยากจะแนะนำให้คุณควบคุมแปลงให้เหมาะกับวัตถุประสงค์ของคุณมากกว่าที่จะยอมรับค่าเริ่มต้น
whuber

ฉันขอแนะนำให้รุ่น "พื้นที่ที่มีน้ำหนัก" ของคุณคือ "ดีสำหรับการเปรียบเทียบกลุ่มย่อยของประชากร" เนื่องจากอาจเหมาะสมที่จะเพิ่มความกว้างเพื่อให้ได้รูปร่างของประชากรทั้งหมด
เฮนรี่

ฉันชอบพื้นที่ที่เท่ากันเพื่อรักษาผลกระทบทางสายตาของรูปร่างของการแจกแจง จากนั้นเสริมกราฟด้วยเทอร์โมมิเตอร์ที่แสดงขนาดตัวอย่างหรือเพียงแค่ใช้การแสดงข้อความของขนาดตัวอย่างถัดจากไวโอลิน
Frank Harrell

คำตอบ:


4

พล็อตกล่องถูกใช้สำหรับสรุปวงจรของการแจกแจง พล็อตไวโอลินเป็นเพียงโครงเรื่องที่กล่อง Q1, Q2 และ Q3 จะถูกแทนที่ด้วยควอนไทล์ที่หลากหลาย ด้วยเหตุนี้ฉันจึงคิดว่าวิธีปฏิบัติที่ได้รับการยอมรับคือการใช้ความกว้างสม่ำเสมอในกลุ่ม

อย่างไรก็ตามคุณได้ข้อสรุปที่ดีว่าจะเปรียบเทียบความหนาแน่นข้ามกลุ่มได้อย่างไร คำตอบขึ้นอยู่กับว่าคุณกำลังดูแต่ละกลุ่มว่าเป็นประชากรของตัวเองหรือเป็นกลุ่มย่อย

ΣผมPผม=1


ตอนแรกมีการแนะนำพล็อตไวโอลินและกำหนดเป็นพล็อตกล่องไฮบริดและการติดตามความหนาแน่น Google แสดงให้เห็นอย่างรวดเร็วว่าในทางปฏิบัติหลาย ๆ แปลงได้เปิดเผยต่อสาธารณะเป็นพล็อตไวโอลินละเว้นกล่องและหลายคนไม่แสดงปริมาณเช่นนี้ ดังนั้นคำจำกัดความจะเปิดกว้างที่นี่
Nick Cox

5

สุจริตฉันคิดว่าคุณกำลังเข้าใกล้จากทิศทางที่ผิด ทั้งสามแปลงบอกข้อมูลที่มีค่าอย่างชัดเจน - มิฉะนั้นคุณจะไม่พิจารณาว่าจะใช้พล็อตใด การวิเคราะห์ข้อมูลเชิงสำรวจเป็นเรื่องเกี่ยวกับการทำความเข้าใจข้อมูลของคุณ ตรงกับความคาดหวัง ไม่อยู่ที่ไหน มันมีรูปร่างอย่างไรกับตัวแปรหลายตัว

จุดทั้งหมดของการทำ EDA คือการประเมินว่าค่าเริ่มต้นของเราไม่ว่าจะเป็นการกระจายหรือการสันนิษฐาน colinearity แบบจำลองทางสถิติที่จะใช้เป็นต้นมีความชอบธรรม ดังนั้นแนวคิดของ EDA "ค่าเริ่มต้น" จึงค่อนข้างสมบูรณ์

ดูทั้งหมดของพวกเขา - หรืออย่างน้อยแปลงทั้งหมดที่เกี่ยวข้องกับคำถามที่คุณตั้งใจจะถาม ไม่มีเหตุผลที่จะทำให้เอ็นร้อยหวายตัวเองใน "สิ่งที่น่าสนใจ" และ "สิ่งที่ฉันจะไม่สนใจ" ในเวที EDA และถ้าเราแค่ป้อนข้อมูลผ่านค่าเริ่มต้นมันไม่ใช่ EDA จริงๆตั้งแต่แรก


+1 สำหรับ enlightening หมายเหตุเกี่ยวกับ EDA แม้ว่ามันจะยังไม่ชัดเจน (ผม) ไม่ว่าจะเป็น OP คือหลังจาก EDA หรือไม่ ...
CHL

@chl ความเห็นของ OP แสดงให้เห็นว่าเขาเป็นอะไร หากเป็นเพียง "สิ่งใดที่มีประโยชน์มากกว่านี้" คำตอบที่ฉันกลัวจะกลายเป็นสิ่งที่คลุมเครือยิ่งขึ้น "ดีคุณต้องการแสดงอะไร
Fomite

อาฉันพลาดความคิดเห็นนั้น ... ดังนั้นคำตอบของคุณจึงคุ้มค่า +1 อีกครั้ง แต่ฉันไม่สามารถ :(
chl

4

แล้วแบนด์วิดธ์ล่ะ? คุณคิดอย่างนั้นเหรอ?

หากคุณใช้การตั้งค่าเริ่มต้นของซอฟต์แวร์เพื่อรับไฟล์ PDF คุณมักจะใช้กฏง่ายๆในการหาแบนด์วิดท์ที่เหมาะสมของเคอร์เนลเกาส์เซียน 'แบนด์วิดท์ที่ดีที่สุด' นี้อาจแตกต่างกันสำหรับแต่ละชุดย่อย ตอนนี้ถามตัวเองว่ารูปร่างยังคงเปรียบได้หรือไม่ อาจเป็นไปได้ว่ามีการวัดตัวแปรเดียวกัน (ประมาณความหนาแน่นของเคอร์เนล) ด้วยสองมาตรฐาน

สำหรับการประเมินความหนาแน่นของเคอร์เนลกฎที่ชัดเจนได้รับการพัฒนาขึ้นเพื่อให้ได้แบนด์วิดธ์ที่ถูกต้อง (การเรียงลำดับบางส่วนของการตรวจสอบความถูกต้อง) แต่สำหรับพล็อตไวโอลินพวกเขาส่วนใหญ่จะถูกละเว้น อาจมีความสำคัญเมื่อขนาดตัวอย่างแตกต่างกันมาก

ฉันมีปัญหานี้ในตอนนี้ คุณคิดยังไงกับเรื่องนี้? คุณจะแก้มันอย่างไร ความคิดเห็นใด ๆ ที่ชื่นชมอย่างมาก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.