ฉันจะบอกว่าด้วยข้อมูลเช่นนี้คุณต้องแสดงผลลัพธ์ในระดับที่แปลง นั่นเป็นสิ่งจำเป็นครั้งแรกและเป็นปัญหาที่สำคัญกว่าวิธีการวาดพล็อตกล่องอย่างแม่นยำ
แต่ฉันก้องสะท้อน Frank Harrell ในการกระตุ้นบางสิ่งที่ให้ข้อมูลมากกว่าพล็อตเรื่องกล่องเล็ก ๆ น้อย ๆ ถึงแม้จะมีบางจุดที่ระบุได้ คุณมีพื้นที่เพียงพอที่จะแสดงข้อมูลเพิ่มเติม นี่คือหนึ่งในหลายตัวอย่างกล่องไฮบริดและพล็อตเชิงควอนตัม ในข้อมูลของคุณมีการเปรียบเทียบสองกลุ่ม
ฉันจะรับสองจุดนี้ทีละคนแล้วพูดมากขึ้น
สเกลที่ถูกเปลี่ยนรูป
ในกรณีที่ง่ายที่สุดค่าทั้งหมดของคุณอาจเป็นค่าบวกและคุณควรลองใช้สเกลลอการิทึมก่อน
หากคุณมีศูนย์ที่แน่นอนมาตราส่วนรากที่สองหรือลูกบาศก์รูทจะยังคงปรับปรุงความเบ้มาก บางคนมีความสุขกับบันทึก (ค่า + ค่าคงที่) โดยที่ค่าคงที่มักจะเป็น 1 ซึ่งเป็นวิธีการจัดการกับศูนย์
ผลกระทบของแผนการแปลงกล่องที่ใช้มาตราส่วนแปลงร่างนั้นมีความละเอียดอ่อน
หากคุณใช้หลักการทั่วไปของ Tukey ในการแสดงคะแนนทุกจุดนอกเหนือจากควอไทล์ชั้นบน + 1.5 IQR หรือควอไทล์ต่ำ - 1.5 IQR ดังนั้นเนื้อหาที่คำนวณได้จะถูกคำนวณในสเกลที่แปลง นั่นไม่เหมือนกับการคำนวณขีด จำกัด เหล่านั้นบนสเกลดั้งเดิมจากนั้นทำการแปลง
ฉันอยากจะสนับสนุนสิ่งที่ดูเหมือนว่าจะยังคงเป็นแบบแผนของชนกลุ่มน้อยในการเลือกปริมาณสำหรับปลายหนวด ข้อดีอย่างหนึ่งของหลาย ๆ อย่างก็คือการแปลง quantile = quantile of transform อย่างน้อยที่สุดก็เพียงพอสำหรับวัตถุประสงค์ด้านกราฟิกในกรณีส่วนใหญ่ (การพิมพ์ขนาดเล็กคือเมื่อใดก็ตามที่คำนวณปริมาณโดยการประมาณเชิงเส้นระหว่างสถิติคำสั่งที่อยู่ติดกัน)
การประชุมเชิงปริมาณนี้ได้รับการแนะนำอย่างชัดเจนโดยคลีฟแลนด์ (1985) สำหรับเร็กคอร์ดแปลงกล่องที่ปรับปรุงพร้อมกล่องสำหรับควอไทล์กล่องทินเนอร์ไปจนถึงอ็อกเทเลนอก (12.5 และ 87.5% คะแนน) และตัดทอนข้อมูลที่ใช้ในทางภูมิศาสตร์และภูมิอากาศโดย (เช่น) Matthews (1936) และ Grove (1956) ชื่อ "แผนภาพการกระจาย"
มากกว่าแปลงกล่อง
แผนการแปลงกล่องถูกคิดค้นขึ้นใหม่โดย Tukey ราวปี 1970 และได้รับการส่งเสริมอย่างเห็นได้ชัดที่สุดในหนังสือปี 1977 ของเขา จุดประสงค์ของเขาส่วนใหญ่คือการโปรโมตกราฟที่สามารถวาดได้อย่างรวดเร็วโดยใช้ปากกา (cil) และกระดาษในการสำรวจอย่างไม่เป็นทางการ เขายังแนะนำวิธีในการระบุค่าผิดปกติที่อาจเกิดขึ้นได้ นั่นเป็นเรื่องปกติ แต่ตอนนี้เราทุกคนสามารถเข้าถึงคอมพิวเตอร์ได้ไม่ยากเลยที่จะวาดกราฟที่แสดงถ้าไม่ใช่ข้อมูลทั้งหมดอย่างน้อยก็มีรายละเอียดมากกว่านี้ บทบาทสรุปของพล็อตกล่องมีประโยชน์ แต่กราฟสามารถแสดงโครงสร้างที่ละเอียดได้เช่นกันในกรณีที่น่าสนใจหรือสำคัญ (และสิ่งที่นักวิจัยคิดว่าไม่น่าสนใจหรือไม่สำคัญอาจทำให้ผู้อ่านประทับใจมากกว่า)
มีที่ว่างมากมายสำหรับความไม่เห็นด้วยอย่างสุภาพเกี่ยวกับสิ่งที่ดีที่สุด แต่กล่องเปล่าได้ถูกขายออกไปค่อนข้างมากในมุมมองของฉัน
ผู้ใช้ Stata สามารถค้นหาเพิ่มเติมเกี่ยวกับโปรแกรมที่ดึงตัวเลขในโพสต์ Statalistนี้ ผู้ใช้ซอฟต์แวร์อื่นไม่ควรพบปัญหาในการวาดสิ่งที่ดีหรือดีกว่า (เหตุใดจึงใช้ซอฟต์แวร์นั้น)
คลีฟแลนด์, WS 1985 องค์ประกอบของข้อมูลกราฟ มอนเทอเรย์แคลิฟอร์เนีย: วัดส์เวิร์ ธ
Grove, AT 1956 การพังทลายของดินในไนจีเรีย ใน Steel, RW and Fisher, CA (Eds)
บทความเกี่ยวกับภูมิศาสตร์ในดินแดนเขตร้อนของอังกฤษ ลอนดอน: George Philip, 79-111
Matthews, HA 1936 มุมมองใหม่ของฝนที่อินเดียคุ้นเคย นิตยสารทางภูมิศาสตร์แห่งสกอตแลนด์ 52: 84-97
Tukey, JW 1977 การวิเคราะห์ข้อมูลเชิงสำรวจ Reading, MA: Addison-Wesley