คำถามติดแท็ก median

ค่ามัธยฐานคือค่าด้านล่างซึ่งครึ่งหนึ่งของข้อมูลหรือการแจกแจงความน่าจะเป็น - เมื่อขนาดตัวอย่างเป็นเลขคี่ค่ามัธยฐานคือค่า 'กลาง' ของตัวอย่างที่ได้รับคำสั่ง

1
การคำนวณค่ามัธยฐานของค่ามัธยฐาน
ฉันทำการรายงานอสังหาริมทรัพย์หลายครั้งและราคามักจะถูกรายงานโดยเฉพาะอย่างยิ่งโดย NAR (National Association Of Realtors) อย่างที่ฉันบอกได้พวกเขาจะได้รับราคาเฉลี่ยของอสังหาริมทรัพย์จากแต่ละพื้นที่เท่านั้น คำถามของฉันคือควรคำนวณค่ามัธยฐานแห่งชาติอย่างไรเนื่องจากข้อ จำกัด ของข้อมูล ในฐานะที่เป็นค่ามัธยฐานของค่ามัธยฐานเป็นค่าเฉลี่ยแบบง่าย ๆ ของค่ามัธยฐานหรือค่าเฉลี่ยถ่วงน้ำหนักของค่ามัธยฐานหรือสิ่งที่แตกต่างอย่างสิ้นเชิง? ประการที่สองการประมาณเหล่านี้จะถูกต้องแม่นยำเพียงใด ฉันรู้ว่า NAR ไม่ได้รับตารางการทำธุรกรรมทั้งหมดดังนั้นการประมาณค่ามัธยฐานที่แม่นยำของการเป็นตัวแทนยังคงอยู่ในระดับประเทศหรือไม่ โดยเฉพาะอย่างยิ่งฉันถามเพราะความหนาแน่นในระดับภูมิภาคและราคาและผลต่างของตลาดมีขนาดใหญ่มาก
13 median 

2
การประมาณควอไทล์แบบออนไลน์โดยไม่ต้องเก็บการสังเกต
ฉันจำเป็นต้องคำนวณควอไทล์ (Q1, มัธยฐานและ Q3) แบบเรียลไทม์กับชุดข้อมูลขนาดใหญ่โดยไม่ต้องจัดเก็บข้อสังเกต ฉันลองใช้อัลกอริธึม P square (Jain / Chlamtac) ครั้งแรก แต่ฉันไม่พอใจกับมัน (ใช้ซีพียูมากเกินไปและไม่เชื่อในความแม่นยำของชุดข้อมูลของฉันอย่างน้อย) ตอนนี้ฉันใช้อัลกอริธึม FAME ( Feldman / Shavitt ) สำหรับการประมาณค่ามัธยฐานในขณะเดินทางและพยายามหาขั้นตอนวิธีในการคำนวณ Q1 และ Q3 ด้วย: M = Q1 = Q3 = first data value step =step_Q1 = step_Q3 = a small value for each new data : # update …

5
ฉันจะตีความแผนการกระจายนี้ได้อย่างไร
ฉันมีพล็อตกระจายที่มีขนาดตัวอย่างซึ่งเท่ากับจำนวนคนบนแกน x และเงินเดือนมัธยฐานบนแกน y ฉันพยายามหาว่าขนาดกลุ่มตัวอย่างมีผลต่อเงินเดือนเฉลี่ยหรือไม่ นี่คือพล็อต: ฉันจะตีความพล็อตนี้ได้อย่างไร


4
การทดสอบสมมติฐานสำหรับความแตกต่างของค่ามัธยฐานในกลุ่มตัวอย่างมากกว่าสองตัวอย่าง
คำถาม คะแนนการทดสอบของคนสามกลุ่มจะถูกบันทึกเป็นเวกเตอร์แยกในอาร์ set.seed(1) group1 <- rnorm(100, mean = 75, sd = 10) group2 <- rnorm(100, mean = 85, sd = 10) group3 <- rnorm(100, mean = 95, sd = 10) ฉันต้องการทราบว่ามีความแตกต่างที่สำคัญในค่ามัธยฐานระหว่างกลุ่มเหล่านี้หรือไม่ ฉันรู้ว่าฉันสามารถทดสอบกลุ่ม 1 กับกลุ่ม 2 ได้โดยใช้การทดสอบ Wilcoxon เช่นนั้น wilcox.test(group1, group2) อย่างไรก็ตามการเปรียบเทียบครั้งนี้มีเพียงสองกลุ่มเท่านั้นและฉันต้องการเปรียบเทียบทั้งสามกลุ่มพร้อมกัน ฉันต้องการทดสอบสถิติที่ให้ค่า ap ที่ระดับนัยสำคัญ 0.05 มีคนช่วยได้ไหม แก้ไข # 1 - …

3
ตัวอย่างที่มีค่ามัธยฐานอยู่นอก [โหมดหมายถึง]
นี้บทความอยู่เหนือลีกของฉัน แต่มันพูดเกี่ยวกับหัวข้อที่ฉันสนใจในความสัมพันธ์ระหว่างค่าเฉลี่ยโหมดและค่ามัธยฐาน มันบอกว่า : เป็นที่เชื่อกันอย่างกว้างขวางว่าค่ามัธยฐานของการแจกแจงแบบ unimodal คือ "ปกติ" ระหว่างค่าเฉลี่ยและโหมด อย่างไรก็ตามสิ่งนี้ไม่เป็นความจริงเสมอไป ... คำถามของฉัน : ใครสามารถให้ตัวอย่างของการกระจาย unimodal (ง่ายอย่างง่าย ๆ ) อย่างต่อเนื่องที่ค่ามัธยฐานอยู่นอกช่วง [โหมดหมายถึง]? mode < mean < medianยกตัวอย่างเช่นการกระจายเช่น === แก้ไข ======= มีคำตอบที่ดีจาก Glen_b และ Francis แต่ฉันรู้ว่าสิ่งที่ฉันสนใจจริงๆคือตัวอย่างที่โหมด <หมายถึง <มัธยฐานหรือมัธยฐาน <เฉลี่ย <โหมด (นั่นคือค่ามัธยฐานทั้งสองอยู่นอก [โหมดหมายถึง] และมัธยฐานคือ "ในด้านเดียวกัน" เป็นค่าเฉลี่ยของโหมด (เช่นทั้งเหนือและใต้โหมด) ฉันยอมรับคำตอบที่นี่เปิดคำถามใหม่หรืออาจมีคนแนะนำวิธีแก้ปัญหาที่นี่โดยตรง
11 mean  median  mode 

2
เหตุใดจึงเป็นเรื่องผิดปกติในการรายงานช่วงเวลาความเชื่อมั่นสำหรับค่ามัธยฐาน?
เหตุใดจึงเป็นเรื่องผิดปกติในการค้นหาช่วงความมั่นใจที่รายงานไว้ในเอกสารจากวิทยาศาสตร์ประยุกต์ ฉันทำงานเกี่ยวกับวิทยาศาสตร์คอมพิวเตอร์เป็นส่วนใหญ่ แต่มักจะอ่านบทความจาก (สังคม) จิตวิทยาสังคมวิทยาและการวางผังเมือง ฉันจำไม่ได้ว่าเคยเห็น CI สำหรับคนกลางรายงาน ในขณะเดียวกันเมื่อศึกษาช่วงความมั่นใจและเป็นเช่นนั้นฉันเห็นได้ชัดว่าในทุกสถานการณ์ที่ค่ามัธยฐานเป็นตัวบ่งชี้ที่ดีกว่าสำหรับข้อมูลของตัวเองนี่เป็นค่าประมาณที่ควรนำเสนอ มีเหตุผลทางทฤษฎีว่าทำไมการนำเสนอ CIs สำหรับค่ามัธยฐานจึงไม่ธรรมดา

1
ซึ่งมาบรรจบกันเร็วกว่าค่าเฉลี่ยหรือค่ามัธยฐาน?
ถ้าฉันวาดตัวแปร iid จาก N (0,1) ค่าเฉลี่ยหรือค่ามัธยฐานจะมาบรรจบกันเร็วขึ้นหรือไม่ เร็วเท่าไหร่ หากต้องการเจาะจงมากขึ้นปล่อยให้เป็นลำดับของตัวแปร iid ที่ดึงมาจาก N (0,1) กำหนดและเป็นค่ามัธยฐานของ . ซึ่งมารวมกันเป็น 0 เร็วกว่าหรือ ?x1,x2,…x1,x2,…x_1, x_2, \ldots x¯n=1n∑ni=1xix¯n=1n∑i=1nxi\bar{x}_n = \frac{1}{n}\sum_{i=1}^n x_ix~nx~n\tilde{x}_n{x1,x2,…xn}{x1,x2,…xn}\{x_1, x_2, \ldots x_n\}{x¯n}{x¯n}\{\bar{x}_n\}{x~n}{x~n}\{\tilde{x}_n\} สำหรับการเห็นพ้องกันว่าการรวมกันเร็วขึ้นหมายถึงอะไร:อยู่หรือไม่ ถ้าเป็นเช่นนั้นมันคืออะไร?limn→∞Var(X¯n)/Var(X~n)limn→∞Var(X¯n)/Var(X~n)\lim_{n \to \infty} Var(\bar{X}_n)/Var(\tilde{X}_n)

3
หมายถึง SD หรือ Median MAD เพื่อสรุปตัวแปรที่เอียงสูงหรือไม่
ฉันกำลังทำงานกับข้อมูลที่เบ้อย่างสูงดังนั้นฉันจึงใช้ค่ามัธยฐานแทนค่าเฉลี่ยเพื่อสรุปแนวโน้มกลาง ฉันต้องการที่จะมีตัวชี้วัดของการกระจายตัวในขณะที่ฉันมักจะเห็นคนรายงานค่าเฉลี่ยเบี่ยงเบนมาตรฐาน±±\pmหรือแบ่งควอไทล์±±\pmเพื่อสรุปแนวโน้มเข้าสู่ส่วนกลางมันก็โอเคที่จะรายงานค่ามัธยฐานแบ่งกระจายสัมบูรณ์ (MAD)±±\pm ? มีปัญหาที่อาจเกิดขึ้นกับวิธีนี้หรือไม่? ฉันจะพบว่าวิธีนี้มีขนาดกะทัดรัดและใช้งานง่ายกว่าการรายงานควอไทล์ที่ต่ำและสูงโดยเฉพาะในตารางขนาดใหญ่ที่เต็มไปด้วยตัวเลข

1
เกิดข้อผิดพลาดในการรายงานด้วยค่ามัธยฐานและการแทนด้วยกราฟิก
ฉันใช้การทดสอบที่หลากหลายสำหรับข้อมูลวิทยานิพนธ์ของฉันตั้งแต่พารามิเตอร์ ANOVAs และการทดสอบ t ไปจนถึงการทดสอบที่ไม่ใช่พารามิเตอร์ Kruskal-Wallis และ Mann-Whitneys รวมถึง ANOVAs 2-way อันดับและ GzLMs ที่มีไบนารี ข้อมูลปัวซองและข้อมูลตามสัดส่วน ตอนนี้ฉันต้องรายงานทุกอย่างในขณะที่เขียนทั้งหมดนี้ในผลลัพธ์ของฉัน ผมเคยถามแล้วที่นี่วิธีการรายงานช่วงความเชื่อมั่นไม่สมดุลข้อมูลสัดส่วน ฉันรู้ว่าค่าเบี่ยงเบนมาตรฐานความคลาดเคลื่อนมาตรฐานหรือช่วงความมั่นใจนั้นเหมาะสมสำหรับวิธีการซึ่งเป็นสิ่งที่ฉันรายงานหากการทดสอบทั้งหมดของฉันเป็นพารามิเตอร์ที่ดี อย่างไรก็ตามสำหรับการทดสอบที่ไม่ใช่พารามิเตอร์ของฉันฉันควรจะรายงานค่ามัธยฐานและไม่ได้หมายความว่าอย่างไร ถ้าเป็นเช่นนั้นฉันจะรายงานข้อผิดพลาดอะไร การเชื่อมโยงกับสิ่งนี้เป็นวิธีที่ดีที่สุดในการนำเสนอผลการทดสอบแบบไม่มีพารามิเตอร์ เนื่องจากส่วนใหญ่ฉันมีข้อมูลต่อเนื่องหรือช่วงเวลาภายในหมวดหมู่ฉันมักจะใช้กราฟแท่งกับด้านบนของแถบที่เป็นแถบค่าเฉลี่ยและแถบข้อผิดพลาดแสดง 95% CI สำหรับการทดสอบ NP ฉันสามารถใช้กราฟแท่งได้หรือไม่ แต่มีแถบด้านบนแทนค่ามัธยฐานหรือไม่? ขอบคุณสำหรับคำแนะนำของคุณ!

1
ทำไม 95% CI สำหรับค่ามัธยฐานควรจะเป็น ?
ในแหล่งต่าง ๆ (ดูเช่นที่นี่ ) สูตรต่อไปนี้จะได้รับสำหรับช่วงความเชื่อมั่นสำหรับค่ามัธยฐาน (โดยเฉพาะอย่างยิ่งสำหรับจุดประสงค์ของการวาดรอยหยักบนแปลงกล่องและมัสสุ): 95 % C. ผมm e d i a n= M e d i a n ± 1.57 × Iคิวอาร์ยังไม่มีข้อความ--√95% CImedian=Median±1.57×IQRN 95\%\ CI_{\rm median} = {\rm Median} \pm \frac{1.57\times IQR}{\sqrt{N}} ค่าคงที่เวทย์มนตร์ทำให้ฉันเป็นบ้าฉันไม่สามารถหาวิธีได้ การประมาณค่าต่าง ๆ (เช่นสมมติว่าการกระจายตัวของเราคือเกาส์เซียนและมีขนาดใหญ่) ไม่ได้ให้เบาะแส - ฉันได้รับค่าต่างกันสำหรับค่าคงที่1.571.571.57ยังไม่มีข้อความNN

1
พล็อตกล่องมีรอยหยักเมื่อเทียบกับช่วง Tukey-Kramer
"การบาก" เอกสารความช่วยเหลือ ( หรือข้อความเดิม ) จาก Boxplot ใน 'R' ให้ต่อไปนี้: หากรอยหยักของสองแปลงไม่ทับซ้อนกันนี่คือ 'หลักฐานที่ชัดเจน' ซึ่งสื่อกลางทั้งสองนั้นต่างกัน (Chambers et al, 1983, p. 62) ดู boxplot.stats สำหรับการคำนวณที่ใช้ และ ' boxplot.stats ' ให้สิ่งต่อไปนี้: รอยหยัก (ถ้ามีการร้องขอ) ขยายไปถึง +/- 1.58 IQR / sqrt (n) สิ่งนี้น่าจะเป็นไปตามการคำนวณแบบเดียวกับสูตรที่มี 1.57 ใน Chambers et al (1983, p. 62) ที่กำหนดใน McGill et al (1978, …


5
การอธิบายค่าเฉลี่ยมัธยฐานโหมดตามข้อกำหนดของคนธรรมดา
คุณจะอธิบายแนวคิดเกี่ยวกับค่าเฉลี่ยค่ามัธยฐานและโหมดของรายการตัวเลขอย่างไรและทำไมพวกเขาถึงมีความสำคัญต่อใครบางคนที่มีทักษะการคิดคำนวณขั้นพื้นฐานเท่านั้น อย่าพูดถึงความเบ้, CLT, แนวโน้มกลาง, คุณสมบัติทางสถิติ, ฯลฯ ฉันอธิบายให้คนที่หมายถึงเป็นเพียงวิธีที่รวดเร็วและสกปรกในการ "สรุป" รายการตัวเลข แต่เมื่อมองย้อนกลับไป ความคิดหรือตัวอย่างโลกแห่งความจริง?

1
ค่ามัธยฐานเป็นคุณสมบัติ "ตัวชี้วัด" หรือ "โทโพโลยี" หรือไม่?
ฉันขอโทษสำหรับการละเมิดคำศัพท์เล็กน้อย ฉันหวังว่ามันจะชัดเจนว่าฉันหมายถึงด้านล่าง พิจารณาตัวแปรสุ่มXทั้งค่าเฉลี่ยและค่ามัธยฐานสามารถลักษณะเกณฑ์ optimality: ค่าเฉลี่ยเป็นตัวเลขที่μที่ช่วยลดE ( ( X - μ ) 2 )และค่ามัธยฐานว่าจำนวนซึ่งช่วยลดE ( | X - μ | ) ในมุมมองนี้ความแตกต่างระหว่างค่าเฉลี่ยและค่ามัธยฐานคือทางเลือกของ "ตัวชี้วัด" สำหรับการประเมินการเบี่ยงเบนสี่เหลี่ยมหรือค่าสัมบูรณ์XXXμμ\muE ((X- μ )2)E((X−μ)2)\mathrm E((X - \mu)^2)E ( | X- μ | )E(|X−μ|)\mathrm E(|X - \mu|) บนมืออื่น ๆ , ค่าเฉลี่ยเป็นตัวเลขที่ที่ (สมมติต่อเนื่องแน่นอน) คือคำนิยามนี้ขึ้นอยู่กับความสามารถในการสั่งซื้อค่าของXและเป็นอิสระจากเท่าใดพวกเขาแตกต่าง เป็นผลมาจากสิ่งนี้คือว่าสำหรับทุกฟังก์ชั่นที่เพิ่มขึ้นอย่างเข้มงวดf(x),medฉันan(f(X))=f(medฉันan(X)), หมายถึงมันเป็น "ทอพอโลยี" ใน ความรู้สึกของความไม่แปรเปลี่ยนภายใต้การเปลี่ยนแปลงหน้าr (X)≤ …
10 mean  median 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.