คำถามติดแท็ก boxplot

จอแสดงผลกราฟิกเพื่อสรุปการแจกแจงตัวอย่าง จะแสดงตัวเลขห้าตัวบวก (อาจ) ค่าผิดปกติบางอย่าง - ห้าจุดนั้นเป็นค่ามัธยฐานบานพับ (ควอไทล์โดยประมาณ) และค่าที่ใหญ่ที่สุดและน้อยที่สุดที่ไม่นับคะแนนใด ๆ ที่ทำเครื่องหมายว่าเป็นค่าผิดปกติ

3
ลดความแปรปรวนจาก boxplot
ฉันสงสัยว่าจะอนุมานความแปรปรวนของตัวแปรได้อย่างไรโดยใช้ boxplot อย่างน้อยเป็นไปได้หรือไม่ที่จะอนุมานว่าตัวแปรสองตัวมีความแปรปรวนแบบเดียวกันกับการสังเกต boxplot หรือไม่?
12 variance  boxplot 

2
การอ่านพล็อตแบบกล่องและมัสสุ: สามารถรวบรวมความแตกต่างที่สำคัญระหว่างกลุ่มได้หรือไม่
สมมติว่าเรากำลังดูพล็อตบ็อกซ์และมัสสุนี้: ระหว่างวันพฤหัสบดีและวันศุกร์ฉันคิดว่าส่วนใหญ่จะเห็นว่าดูเหมือนจะมีความแตกต่างอย่างมีนัยสำคัญในเวลานอน นั่นเป็นการคาดเดาทางสถิติที่ถูกต้องใช่มั้ย เราสามารถแยกแยะความแตกต่างอย่างมีนัยสำคัญได้หรือไม่เนื่องจากช่วงควอไทล์ชั้นในนั้นไม่ทับซ้อนกันระหว่างวันพฤหัสบดีและวันศุกร์? สิ่งที่เกี่ยวกับความจริงที่ว่าเคราบนและล่างของวันพฤหัสบดีและวันศุกร์ตามลำดับทับซ้อนกัน? สิ่งนี้มีผลต่อการวิเคราะห์ของเราหรือไม่ มักจะมาพร้อมกับแผนภูมิเช่นนี้จะเป็นแบบ ANOVA แต่ฉันแค่อยากรู้ว่าเราสามารถพูดเกี่ยวกับความแตกต่างระหว่างกลุ่มได้ง่ายๆเพียงแค่ดูที่บ็อกซ์ล็อต

1
'bagplot' หรือ 'bivariate boxplot' คืออะไร?
ฉันพบกระดาษที่แนะนำ boxplot รุ่นหลายมิติ (ที่นี่) กระเป๋าใบนั้นคืออะไรกันแน่? ฉันสามารถเห็นชุดของรูปหลายเหลี่ยมซ้อนกันขึ้นอยู่กับจุดยอดหนึ่งในรูปหลายเหลี่ยมเหล่านั้นถูกประกาศให้เป็นกระเป๋า แนวคิดของการสร้างรูปหลายเหลี่ยมซ้อนกันคืออะไร รูปหลายเหลี่ยมใดที่เป็นรูปแบบถุง (กลางหรือถือจำนวนคะแนนเฉลี่ย) ขอบของกระเป๋ามีคุณสมบัติที่มีประโยชน์ (เช่นการแบ่งชุดจุดเฉพาะ) หรือไม่?

2
สงสัยว่าแผนภูมิการวิเคราะห์พล็อตถั่วหมายความว่าอย่างไร
หนึ่งตีความและสร้างแผนภูมิถั่วอย่างไร นี่คือตัวอย่างหนึ่งที่นำมาจากWalkes และคณะ 2010 ข้อมูลประเภทใดที่มีประโยชน์มากที่สุด? (ที่มา: biomedcentral.com )

4
การติดฉลาก boxplots ใน R
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันต้องการสร้าง boxplot โดยไม่มีแกนและเพิ่มลงในพล็อตปัจจุบัน (ROC curve) แต่ฉันต้องการเพิ่มข้อมูลข้อความเพิ่มเติมลงใน boxplot: เลเบลสำหรับ min และ max บรรทัดปัจจุบันของรหัสอยู่ด้านล่าง (กราฟปัจจุบันด้วย) ขอบคุณมากสำหรับความช่วยเหลือ boxplot(data, horizontal = TRUE, range = 0, axes=FALSE, col = "grey", add = TRUE) อีกวิธีคือเพิ่มบรรทัดจาก 0 ถึง 1 (แทนแกน x) แต่ฉันต้องการให้ผ่านเส้นกลาง ... ตัวอย่างเช่นกราฟิกนี้
11 r  boxplot 

1
ทำไม 95% CI สำหรับค่ามัธยฐานควรจะเป็น ?
ในแหล่งต่าง ๆ (ดูเช่นที่นี่ ) สูตรต่อไปนี้จะได้รับสำหรับช่วงความเชื่อมั่นสำหรับค่ามัธยฐาน (โดยเฉพาะอย่างยิ่งสำหรับจุดประสงค์ของการวาดรอยหยักบนแปลงกล่องและมัสสุ): 95 % C. ผมm e d i a n= M e d i a n ± 1.57 × Iคิวอาร์ยังไม่มีข้อความ--√95% CImedian=Median±1.57×IQRN 95\%\ CI_{\rm median} = {\rm Median} \pm \frac{1.57\times IQR}{\sqrt{N}} ค่าคงที่เวทย์มนตร์ทำให้ฉันเป็นบ้าฉันไม่สามารถหาวิธีได้ การประมาณค่าต่าง ๆ (เช่นสมมติว่าการกระจายตัวของเราคือเกาส์เซียนและมีขนาดใหญ่) ไม่ได้ให้เบาะแส - ฉันได้รับค่าต่างกันสำหรับค่าคงที่1.571.571.57ยังไม่มีข้อความNN

1
พล็อตกล่องมีรอยหยักเมื่อเทียบกับช่วง Tukey-Kramer
"การบาก" เอกสารความช่วยเหลือ ( หรือข้อความเดิม ) จาก Boxplot ใน 'R' ให้ต่อไปนี้: หากรอยหยักของสองแปลงไม่ทับซ้อนกันนี่คือ 'หลักฐานที่ชัดเจน' ซึ่งสื่อกลางทั้งสองนั้นต่างกัน (Chambers et al, 1983, p. 62) ดู boxplot.stats สำหรับการคำนวณที่ใช้ และ ' boxplot.stats ' ให้สิ่งต่อไปนี้: รอยหยัก (ถ้ามีการร้องขอ) ขยายไปถึง +/- 1.58 IQR / sqrt (n) สิ่งนี้น่าจะเป็นไปตามการคำนวณแบบเดียวกับสูตรที่มี 1.57 ใน Chambers et al (1983, p. 62) ที่กำหนดใน McGill et al (1978, …

1
การแสดงภาพการแจกแจงแบบเบ้ซ้ายจำนวนมาก
ฉันมีชุดของการแจกแจงแบบเบ้ซ้าย / หนักที่ฉันต้องการแสดง 42 มีการกระจายทั่วทั้งสามปัจจัยคือ (ระบุว่าเป็นA, BและCด้านล่าง) Bนอกจากนี้การเปลี่ยนแปลงจะหดตัวทั่วปัจจัย ปัญหาที่ฉันมีคือการกระจายยากที่จะแยกความแตกต่างในระดับของผลลัพธ์ (อัตราส่วนหรือพับเปลี่ยน): ดูเหมือนว่าการบันทึกข้อมูลจะเน้นไปที่ความเบ้ด้านซ้ายและย้ายตัวอย่างไปที่ก้อยมากขึ้น (สร้างจุดที่ผิดพลาด) ใครบ้างมีคำแนะนำเกี่ยวกับเทคนิคอื่น ๆ สำหรับการแสดงข้อมูลเหล่านี้?

2
พล็อตสถิติสรุปด้วย Mean, sd, min และ max?
ฉันมาจากพื้นหลังทางเศรษฐศาสตร์และมักจะอยู่ในวินัยสถิติสรุปของตัวแปรที่มีการรายงานในตาราง อย่างไรก็ตามฉันต้องการพล็อตพวกเขา ฉันสามารถแก้ไขพล็อตกล่องเพื่อให้สามารถแสดงค่าเฉลี่ยส่วนเบี่ยงเบนมาตรฐานต่ำสุดและสูงสุด แต่ฉันไม่ต้องการทำเช่นนั้นเนื่องจากพล็อตกล่องถูกใช้เพื่อแสดงค่ามัธยฐานและ Q1 และ Q3 ตัวแปรทั้งหมดของฉันมีสเกลต่างกัน มันจะดีถ้ามีคนแนะนำวิธีที่มีความหมายโดยที่ฉันสามารถวางแผนสถิติสรุปเหล่านี้ได้ ฉันสามารถทำงานกับ R หรือ Stata ได้

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

4
ทำไมความจริงที่ว่า 1 มัธยฐานต่ำกว่าค่ามัธยฐานอื่นหมายความว่าส่วนใหญ่ในกลุ่ม 1 ต่ำกว่าในกลุ่มที่ 2 มากที่สุด?
ฉันเชื่อว่ากล่องสี่เหลี่ยมด้านล่างอาจตีความได้ว่า "ผู้ชายส่วนใหญ่เร็วกว่าผู้หญิงส่วนใหญ่" (ในชุดข้อมูลนี้) ส่วนใหญ่เป็นเพราะเวลาเฉลี่ยของผู้ชายต่ำกว่าเวลาเฉลี่ยของผู้หญิง แต่หลักสูตร EdX สำหรับแบบทดสอบ R และสถิติบอกฉันว่าไม่ถูกต้อง โปรดช่วยฉันเข้าใจว่าทำไมปรีชาของฉันไม่ถูกต้อง นี่คือคำถาม: ลองพิจารณาตัวอย่างของนักสำเร็จจากนิวยอร์กซิตี้มาราธอนในปี 2002 ชุดข้อมูลนี้สามารถพบได้ในแพคเกจ UsingR โหลดไลบรารีจากนั้นโหลดชุดข้อมูล nym.2002 library(dplyr) data(nym.2002, package="UsingR") ใช้บ็อกซ์พล็อตและฮิสโทแกรมเพื่อเปรียบเทียบเวลาสิ้นสุดของชายและหญิง ข้อใดต่อไปนี้อธิบายความแตกต่างได้ดีที่สุด เพศชายและเพศหญิงมีการกระจายตัวเหมือนกัน ผู้ชายส่วนใหญ่เร็วกว่าผู้หญิงส่วนใหญ่ ตัวผู้และตัวเมียมีการแจกแจงเบ้คล้ายกันกับแบบก่อนหน้านี้, 20 นาทีเปลี่ยนไปทางซ้าย การแจกแจงทั้งสองแบบจะกระจายตามปกติโดยมีความแตกต่างในค่าเฉลี่ยประมาณ 30 นาที ที่นี่เวลา NYC มาราธอนสำหรับชายและหญิงเป็น quantiles, histograms และ boxplots: # Men's time quantile 0% 25% 50% 75% 100% 147.3333 226.1333 256.0167 290.6375 …

2
ทำความเข้าใจกับหนวดของ boxplot
ฉันมีคำถามเกี่ยวกับการแปลความหมายของเคราของกล่องสี่เหลี่ยม ฉันได้อ่านข้อความต่อไปนี้: "ที่ด้านบนและด้านล่างของสี่เหลี่ยม" หนวด "แสดงช่วง 1.5 เท่าของระยะห่างระหว่าง 0.25- และ 0.75- ควอนไทล์" แต่ไม่เข้าใจความหมายของ "ระยะทาง" ทั้งหมด . เป็นไปไม่ได้ที่มวลความน่าจะเป็นมีความหมายเนื่องจากระหว่าง 0.25 และ 0.75 quantile เราเห็นได้ชัดว่ามีเปอร์เซ็นต์ของข้อมูลเท่ากันเสมอ แล้วความคิดคืออะไร?

3
Boxplot สำหรับการกระจายหลาย ๆ
ฉันต้องวาดการแจกแจง 20 ครั้งในกราฟเดียวใน R และมันก็ดูไม่ดี (รก) กับฉันด้วย boxplot ปกติ (20 กล่อง) แม้กับ boxwex = 0.3 คุณช่วยแนะนำฉันได้ไหมว่าฉันจะพล็อตบ็อกซ์พล็อตใน R สำหรับการแจกแจง 20 แบบด้วยจุดสำหรับค่ามัธยฐานและแค่บรรทัดแทนที่จะเป็นกล่องได้อย่างไรเช่นด้านล่าง โปรดแนะนำฉันด้วยหากมีวิธีการ R ที่สร้าง boxplots ที่ดีโดยเฉพาะถ้าคุณต้องการแสดงการแจกแจงหลาย ๆ อย่างในกราฟเดียว -----0----
9 r  boxplot 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.