คำถามติดแท็ก median

ค่ามัธยฐานคือค่าด้านล่างซึ่งครึ่งหนึ่งของข้อมูลหรือการแจกแจงความน่าจะเป็น - เมื่อขนาดตัวอย่างเป็นเลขคี่ค่ามัธยฐานคือค่า 'กลาง' ของตัวอย่างที่ได้รับคำสั่ง

6
ค่ามัธยฐานเป็นประเภทของค่าเฉลี่ยหรือไม่สำหรับการวางนัยทั่วไปของ "หมายถึง"?
แนวคิดของ "หมายถึง" roams กว้างกว่าค่าเฉลี่ยเลขคณิตแบบดั้งเดิม; มันยืดจนรวมค่ามัธยฐานหรือไม่? โดยการเปรียบเทียบ ข้อมูลดิบ⟶รหัสข้อมูลดิบ⟶ค่าเฉลี่ยค่าเฉลี่ยดิบ⟶รหัส- 1เลขคณิตหมายถึงข้อมูลดิบ⟶recipการแลกเปลี่ยน⟶ค่าเฉลี่ยค่าเฉลี่ยซึ่งกันและกัน⟶recip- 1ค่าเฉลี่ยฮาร์มอนิกข้อมูลดิบ⟶เข้าสู่ระบบบันทึก⟶ค่าเฉลี่ยหมายถึงบันทึก⟶เข้าสู่ระบบ- 1เฉลี่ยเรขาคณิตข้อมูลดิบ⟶สี่เหลี่ยมสี่เหลี่ยม⟶ค่าเฉลี่ยตาราง ⟶สี่เหลี่ยม-1รูตหมายความว่ากำลังสองข้อมูลดิบ⟶ยศการจัดอันดับ ⟶ค่าเฉลี่ยหมายถึงอันดับ⟶ยศ- 1มัธยฐานข้อมูลดิบ⟶รหัสข้อมูลดิบ⟶ค่าเฉลี่ยดิบหมายถึง⟶รหัส-1เลขคณิตหมายถึงข้อมูลดิบ⟶recipส่วนกลับ⟶ค่าเฉลี่ยค่าเฉลี่ยซึ่งกันและกัน⟶recip-1ค่าเฉลี่ยฮาร์มอนิกข้อมูลดิบ⟶เข้าสู่ระบบบันทึก⟶ค่าเฉลี่ยหมายถึงบันทึก⟶เข้าสู่ระบบ-1เฉลี่ยเรขาคณิตข้อมูลดิบ⟶สี่เหลี่ยมสี่เหลี่ยม⟶ค่าเฉลี่ยตาราง⟶สี่เหลี่ยม-1รูตหมายความว่ากำลังสองข้อมูลดิบ⟶ยศการจัดอันดับ⟶ค่าเฉลี่ยหมายถึงอันดับ⟶ยศ-1มัธยฐาน \text{raw data} \overset{\text{id}}{\longrightarrow} \text{raw data} \overset{\text{mean}}{\longrightarrow} \text{raw mean} \overset{\text{id}^{-1}}{\longrightarrow} \text{arithmetic mean} \\ \text{raw data} \overset{\text{recip}}{\longrightarrow} \text{reciprocals} \overset{\text{mean}}{\longrightarrow} \text{mean reciprocal} \overset{\text{recip}^{-1}}{\longrightarrow} \text{harmonic mean} \\ \text{raw data} \overset{\text{log}}{\longrightarrow} \text{logs} \overset{\text{mean}}{\longrightarrow} \text{mean log} \overset{\text{log}^{-1}}{\longrightarrow} \text{geometric mean} \\ \text{raw data} \overset{\text{square}}{\longrightarrow} …
20 mean  average  median 

2
ทำไมการย่อขนาดแม่ให้เล็กที่สุดนำไปสู่การคาดการณ์ค่ามัธยฐานไม่ใช่ค่าเฉลี่ย?
จากการพยากรณ์: หลักการและแบบฝึกหัดโดย Rob J Hyndman และ George Athanasopoulosโดยเฉพาะในส่วนของการวัดความแม่นยำ : วิธีการพยากรณ์ที่ย่อขนาดเล็กที่สุดจะนำไปสู่การคาดการณ์ของค่ามัธยฐานในขณะที่การลด RMSE จะนำไปสู่การคาดการณ์ค่าเฉลี่ย บางคนสามารถให้คำอธิบายที่เข้าใจง่ายว่าทำไมการย่อขนาดแม่ให้เล็กที่สุดนำไปสู่การคาดคะเนค่ามัธยฐานไม่ใช่ค่าเฉลี่ย? และนี่หมายถึงอะไรในทางปฏิบัติ ฉันได้ถามลูกค้า: "สิ่งที่สำคัญกว่าสำหรับคุณคือการคาดการณ์หมายถึงแม่นยำยิ่งขึ้นหรือเพื่อหลีกเลี่ยงการคาดการณ์ที่ไม่ถูกต้องมาก" เขาบอกว่าการคาดหมายที่แม่นยำยิ่งกว่านั้นจะมีลำดับความสำคัญสูงกว่า ดังนั้นในกรณีนี้ฉันควรใช้ Mae หรือ RMSE หรือไม่ ก่อนที่ฉันจะอ่านหนังเรื่องนี้ฉันเชื่อว่าแม่จะดีขึ้นสำหรับเงื่อนไขดังกล่าว และตอนนี้ฉันสงสัย
19 forecasting  mean  median  rms  mae 

4
หมายความว่าค่ามัธยฐานหมายถึงการกระจายตัวแบบ unimodal นั้นสมมาตรหรือไม่?
สำหรับการแจกแจงแบบ unimodal ถ้าค่าเฉลี่ย = ค่ามัธยฐานมันก็เพียงพอแล้วหรือไม่ที่จะบอกว่าการกระจายนั้นสมมาตร Wikipedia กล่าวในความสัมพันธ์ระหว่างค่าเฉลี่ยและค่ามัธยฐาน: "ถ้าการกระจายแบบสมมาตรค่าเฉลี่ยเท่ากับค่ามัธยฐานและการแจกแจงจะไม่มีความเบ้ถ้านอกจากนี้การกระจายนั้นเป็นแบบ unimodal ดังนั้นโหมดเฉลี่ย = มัธยฐานนี่คือกรณีของการโยนเหรียญหรือ ซีรีส์ 1,2,3,4, ... โปรดทราบว่าการสนทนาไม่เป็นความจริงโดยทั่วไปนั่นคือความเบ้ศูนย์ไม่ได้หมายความว่าค่าเฉลี่ยเท่ากับค่ามัธยฐาน " อย่างไรก็ตามมันไม่ได้ตรงไปตรงมา (กับฉัน) เพื่อรวบรวมข้อมูลที่ฉันต้องการ ความช่วยเหลือใด ๆ โปรด

4
คุณสมบัติค่าเฉลี่ยและค่ามัธยฐาน
ใครช่วยอธิบายให้ฉันชัดเจนถึงตรรกะทางคณิตศาสตร์ที่จะเชื่อมโยงสองประโยค (a) และ (b) เข้าด้วยกันได้ไหม? ให้เรามีชุดของค่า (การกระจายบางอย่าง) ตอนนี้ a) ค่ามัธยฐานไม่ได้ขึ้นอยู่กับค่าทุกค่า [ขึ้นอยู่กับค่ากลางหนึ่งหรือสองค่า]; b) ค่ามัธยฐานเป็นสถานที่ของผลรวมเบี่ยงเบนน้อยที่สุดจากนั้น และในทำนองเดียวกันและในทางตรงกันข้าม a) (เลขคณิต) ค่าเฉลี่ยขึ้นอยู่กับค่าทุกค่า b) Mean คือทีของการรวมผลบวกกำลังสองส่วนเบี่ยงเบนน้อยที่สุดจากนั้น เข้าใจของฉันมันใช้งานง่ายจนถึงขณะนี้


2
สำหรับการแจกแจงแบบสมมาตรคือตัวอย่างใดหมายถึงตัวประมาณที่มีประสิทธิภาพมากกว่ามัธยฐานตัวอย่าง
ฉันทำงานหนักภายใต้ความเชื่อที่ว่าค่ามัธยฐานตัวอย่างเป็นตัวชี้วัดแนวโน้มกลางที่แข็งแกร่งกว่าค่าเฉลี่ยตัวอย่างเนื่องจากมันไม่สนใจค่าผิดปกติ ฉันจึงประหลาดใจที่ได้เรียนรู้ (ในคำตอบของคำถามอื่น ) ว่าสำหรับตัวอย่างที่ดึงมาจากการแจกแจงแบบปกติความแปรปรวนของค่าเฉลี่ยตัวอย่างจะน้อยกว่าความแปรปรวนของค่ามัธยฐานตัวอย่าง (อย่างน้อยสำหรับขนาดใหญ่nnn ) ฉันเข้าใจทางคณิตศาสตร์ว่าทำไมสิ่งนี้ถึงเป็นจริง มีวิธี "ปรัชญา" ในการมองสิ่งนี้หรือไม่ที่จะช่วยให้มีสัญชาตญาณว่าจะใช้มัธยฐานแทนที่จะใช้ค่าเฉลี่ยสำหรับการแจกแจงแบบอื่นหรือไม่? มีเครื่องมือทางคณิตศาสตร์ที่ช่วยตอบคำถามสำหรับการแจกแจงแบบเจาะจงหรือไม่?

7
ค่ามัธยฐานนั้นดีกว่าค่าเฉลี่ยหรือไม่
ฉันเพิ่งอ่านคำแนะนำที่คุณควรใช้ค่ามัธยฐานไม่ได้หมายถึงการกำจัดค่าผิดปกติ ตัวอย่าง: บทความต่อไปนี้ http://www.amazon.com/Forensic-Science-Introduction-Scientific-Investigative/product-reviews/1420064932/ มี 16 ความคิดเห็นในขณะนี้: review= c(5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4, 4, 3, 2, 1, 1) summary(review) ## "ordinary" summary Min. 1st Qu. Median Mean 3rd Qu. Max. 1.000 3.750 5.000 4.062 5.000 5.000 เพราะพวกเขาใช้Meanบทความได้ 4 ดาว แต่ถ้าพวกเขาใช้Medianมันก็จะได้ 5 ดาว ค่ามัธยฐานไม่ใช่การตัดสินที่ 'ยุติธรรม' …
17 mean  median  average 

3
มีสูตร“ มัธยฐาน” มากกว่าหนึ่งสูตรหรือไม่?
ในงานของฉันเมื่อบุคคลอ้างถึงค่า "หมายถึง" ของชุดข้อมูลพวกเขามักจะอ้างถึงค่าเฉลี่ยเลขคณิต (เช่น "เฉลี่ย" หรือ "คาดหวังค่า") ถ้าฉันให้ค่าเฉลี่ยทางเรขาคณิตคนอาจจะคิดว่าฉันกำลังหยามหรือไม่เป็นประโยชน์เนื่องจากคำจำกัดความของ "หมายถึง" เป็นที่รู้จักกันล่วงหน้า ฉันพยายามที่จะตรวจสอบว่ามีคำจำกัดความของ "ค่ามัธยฐาน" หลายชุดของข้อมูลหรือไม่ ตัวอย่างเช่นหนึ่งในคำจำกัดความที่จัดทำโดยเพื่อนร่วมงานสำหรับการค้นหาค่ามัธยฐานของชุดข้อมูลที่มีองค์ประกอบจำนวนคู่จะเป็น: อัลกอริทึม 'A' หารจำนวนขององค์ประกอบสองปัดเศษลง ค่านั้นคือดัชนีของค่ามัธยฐาน 5คือสำหรับชุดต่อไปนี้เฉลี่ยจะเป็น [4, 5, 6, 7] สิ่งนี้ดูเหมือนจะสมเหตุสมผลแม้ว่าลักษณะการปัดเศษลงจะดูเป็นเรื่องเล็กน้อย อัลกอริทึม 'B' ไม่ว่าในกรณีใดเพื่อนร่วมงานคนอื่นได้เสนออัลกอริทึมแยกต่างหากซึ่งอยู่ในหนังสือเรียนสถิติของเขา (ต้องได้รับชื่อและผู้แต่ง): หารจำนวนองค์ประกอบด้วย 2 และเก็บสำเนาของเลขจำนวนเต็มที่ปัดเศษขึ้นและปัดเศษลง ชื่อพวกเขาและn_lon_hi ใช้ค่าเฉลี่ยขององค์ประกอบที่และn_lon_hi (5+6)/2 = 5.5คือสำหรับชุดต่อไปนี้เฉลี่ยจะเป็น [4, 5, 6, 7] ดูเหมือนว่าผิด5.5ในกรณีนี้ค่ามัธยฐานในกรณีนี้จริง ๆ แล้วไม่ได้อยู่ในชุดข้อมูลดั้งเดิม เมื่อเราสลับอัลกอริทึม 'A' สำหรับ 'B' ในโค้ดทดสอบบางอันมันก็แย่มาก คำถาม มี …

2
ทำไมการทดสอบ Mann-Whitney U ถึงมีความสำคัญเมื่อค่ามัธยฐานเท่ากัน?
ฉันได้รับผลลัพธ์จากการทดสอบระดับ Mann-Whitney ที่ฉันไม่เข้าใจ ค่ามัธยฐานของ 2 ประชากรนั้นเหมือนกัน (6.9) ตัวพิมพ์ใหญ่และควอนไทล์ที่ต่ำกว่าของแต่ละประชากรคือ: 6.64 และ 7.2 6.60 และ 7.1 ค่า p ที่เป็นผลมาจากการทดสอบเปรียบเทียบประชากรเหล่านี้คือ 0.007 ประชากรเหล่านี้จะแตกต่างกันอย่างมีนัยสำคัญได้อย่างไร? เป็นเพราะการแพร่กระจายเกี่ยวกับค่าเฉลี่ยหรือไม่ boxplot เปรียบเทียบ 2 แสดงว่าอันที่สองมีค่าผิดปกติมากกว่าครั้งแรก ขอบคุณสำหรับคำแนะนำใด ๆ

1
เมื่อไหร่ที่เราจะใช้ tantiles และอยู่ตรงกลางแทนที่จะเป็น quantiles และมัธยฐาน?
ฉันไม่สามารถหาคำจำกัดความของคำว่า tantile หรือ medial บน Wikipedia หรือ Wolfram Mathworld แต่คำอธิบายต่อไปนี้มีให้ในBílková, D. และ Mala, I. (2012), "การประยุกต์ใช้วิธี L-moment เมื่อสร้างแบบจำลองการกระจายรายได้ ในสาธารณรัฐเช็ก ", วารสารสถิติออสเตรีย , 41 (2), 125–132 ตรงกลางคือค่าของที่ (ตัวอย่าง) tantile เช่นเดียวกับค่าเฉลี่ยของกลุ่มตัวอย่างเท่ากับมูลค่าของที่50 % quantile ตัวอย่าง ตัวอย่าง tantiles เช่นเดียวกับ quantiles ตัวอย่างจะขึ้นอยู่กับตัวอย่างที่สั่งซื้อ ก่อนอื่นผลรวมสะสมของการสังเกตในตัวอย่างที่สั่งซื้อจะถูกประเมิน แล้วสำหรับที่กำหนดร้อยละP , 0 &lt; P &lt; 100เป็นพี50%50%50\%50%50%50\%ppp0&lt;p&lt;1000&lt;p&lt;1000<p<100 tantile ถูกกำหนดให้เป็นค่าของตัวแปรที่วิเคราะห์ซึ่งแบ่งการสังเกตทั้งหมดในตัวอย่างที่ได้รับคำสั่งออกเป็นสองส่วน: ผลรวมของการสังเกตที่น้อยกว่าหรือเท่ากับคือ p %p%p%p\%p%p%p\%ของผลรวมการสังเกตและผลรวมของการสังเกตที่มากขึ้นแสดงถึงส่วนที่เหลือของผลรวมนี้( …

1
ตัวประมาณค่ามัธยฐานเป็นกลางลดค่าเบี่ยงเบนสัมบูรณ์หรือไม่
นี่คือการติดตาม แต่ยังเป็นคำถามที่แตกต่างกันของหนึ่งก่อนหน้านี้ของฉัน ฉันอ่านวิกิพีเดียว่า " เครื่องมือประมาณค่ากลางจะช่วยลดความเสี่ยงในส่วนที่เกี่ยวกับฟังก์ชั่นการสูญเสียค่าเบี่ยงเบนสัมบูรณ์ดังที่ Laplace ได้สังเกตไว้" อย่างไรก็ตามผลลัพธ์การจำลอง Monte Carlo ของฉันไม่สนับสนุนอาร์กิวเมนต์นี้ ผมถือว่าตัวอย่างจากระบบปกติประชากรโดยที่μและσเป็นค่าเฉลี่ยของบันทึกและ log-sd, β = exp ( μ ) = 50X1,X2,...,XN∼LN(μ,σ2)X1,X2,...,XN∼LN(μ,σ2)X_1,X_2,...,X_N \sim \mbox{LN}(\mu,\sigma^2)μμ\muσσ\sigmaβ= ประสบการณ์( μ ) = 50β=ประสบการณ์⁡(μ)=50\beta = \exp(\mu)=50 ประมาณการทางเรขาคณิต-เฉลี่ยเป็นประมาณการค่ามัธยฐาน-เป็นกลางสำหรับประชากรเฉลี่ย ,ประสบการณ์( μ )ประสบการณ์⁡(μ)\exp(\mu) ที่μและσมีการเข้าสู่ระบบหมายและเข้าสู่ระบบ SD, μและ σมี MLEs สำหรับμและσβ^จีเอ็ม= ประสบการณ์( μ^) = ประสบการณ์( บันทึก ∑( Xผม)ยังไม่มีข้อความ) ∼ LN (μ, …

3
ข้อผิดพลาดมาตรฐานของค่ามัธยฐาน
สูตรต่อไปนี้ถูกต้องหรือไม่หากฉันต้องการวัดความคลาดเคลื่อนมาตรฐานของค่ามัธยฐานในกรณีตัวอย่างขนาดเล็กที่มีการแจกแจงแบบไม่ปกติ (ฉันใช้ไพ ธ อน) sigma=np.std(data) n=len(data) sigma_median=1.253*sigma/np.sqrt(n)

4
ควรใช้ค่าเฉลี่ยเมื่อข้อมูลเบี่ยงเบนหรือไม่
บ่อยครั้งที่ตำราสถิติประยุกต์ที่นำมาใช้แยกแยะความแตกต่างของค่าเฉลี่ยจากค่ามัธยฐาน (มักจะอยู่ในบริบทของสถิติเชิงพรรณนาและกระตุ้นการสรุปแนวโน้มกลางโดยใช้ค่าเฉลี่ยมัธยฐานและโหมด) โดยอธิบายว่าค่าเฉลี่ยนั้นอ่อนไหวต่อค่าผิดปกติในข้อมูลตัวอย่างและ / หรือ เพื่อการแจกแจงแบบเบ้ของประชากรและนี่ใช้เป็นข้ออ้างสำหรับการยืนยันว่าค่ามัธยฐานจะเป็นที่ต้องการเมื่อข้อมูลไม่สมมาตร ตัวอย่างเช่น: การวัดแนวโน้มศูนย์กลางที่ดีที่สุดสำหรับชุดข้อมูลที่กำหนดมักขึ้นอยู่กับวิธีการกระจายค่า ... เมื่อข้อมูลไม่สมมาตรค่ามัธยฐานมักเป็นตัวชี้วัดที่ดีที่สุดของแนวโน้มกลาง เพราะหมายถึงการมีความไวต่อการสังเกตมากก็จะถูกดึงไปในทิศทางของค่าข้อมูลที่ห่างไกลและเป็นผลจะจบลงที่สูงเกินจริงมากเกินไปหรือมากเกินไปกิ่ว." -Pagano และ Gauvreau, (2000) หลักการชีวสถิติ 2 เอ็ด (พีแอนด์จีอยู่ในมือ BTW ไม่แยกพวกเขาออกต่อกัน) ผู้เขียนกำหนด "แนวโน้มกลาง" ดังนี้: "ลักษณะการตรวจสอบที่พบบ่อยที่สุดของชุดข้อมูลคือศูนย์กลางของมันหรือจุดที่การสังเกตมักจะรวมกลุ่มกัน" สิ่งนี้ทำให้ฉันเป็นวิธีที่ตรงไปตรงมาน้อยกว่าการพูดเพียงใช้ค่ามัธยฐานระยะเวลาเพราะใช้ค่าเฉลี่ยเมื่อข้อมูล / การแจกแจงสมมาตรเป็นสิ่งเดียวกับที่บอกว่าใช้ค่าเฉลี่ยเมื่อเท่ากับค่ามัธยฐาน แก้ไข: whuber ชี้ให้เห็นอย่างถูกต้องว่าฉันกำลังพูดถึงมาตรการที่แข็งแกร่งของแนวโน้มกลางกับค่ามัธยฐาน ดังนั้นจึงเป็นสิ่งสำคัญที่จะต้องจำไว้ว่าฉันกำลังพูดถึงกรอบเฉพาะของค่าเฉลี่ยเลขคณิตเทียบกับค่ามัธยฐานในสถิติประยุกต์เบื้องต้น (ที่, โหมดกัน, มาตรการอื่น ๆ ของแนวโน้มกลางไม่ได้รับแรงจูงใจ) แทนที่จะตัดสินว่าค่าเฉลี่ยของยูทิลิตี้ลดลงเท่าใดจากพฤติกรรมของค่ามัธยฐานเราไม่ควรเข้าใจสิ่งเหล่านี้ว่าเป็นมาตรการสองอย่างที่แตกต่างกันของการเป็นศูนย์กลาง? ในคำอื่น ๆ ที่มีความไวต่อความเบ้เป็นคุณสมบัติของค่าเฉลี่ย เราสามารถโต้แย้งได้อย่างถูกต้องว่า "ค่ามัธยฐานนั้นไม่ดีเพราะส่วนใหญ่ไม่ไวต่อความเบ้ดังนั้นควรใช้เมื่อมันเท่ากับค่าเฉลี่ยเท่านั้น" (โหมดค่อนข้างสมเหตุสมผลไม่ได้เกี่ยวข้องกับคำถามนี้)

1
หมายความว่าอย่างไรถ้าค่ามัธยฐานหรือค่าเฉลี่ยของผลรวมมากกว่าผลรวมของผลรวม
ฉันกำลังวิเคราะห์การกระจายตัวของเวลาแฝงเครือข่าย เวลาอัปโหลดเฉลี่ย (U) คือ 0.5 วินาที เวลาเฉลี่ยในการดาวน์โหลด (D) คือ 2 วินาที อย่างไรก็ตามเวลาทั้งหมดเฉลี่ย (สำหรับแต่ละจุดข้อมูล T = U + D) คือ 4s ข้อสรุปอะไรที่สามารถดึงดูดได้โดยรู้ว่าค่ามัธยฐานของผลรวมนั้นยิ่งใหญ่กว่าผลรวมของค่ามัธยฐานของผลรวม จากความอยากรู้อยากเห็นเกี่ยวกับสถิติมันจะเกิดอะไรขึ้นถ้าคำถามนี้แทนที่ค่ามัธยฐานด้วยค่าเฉลี่ย

1
การบูตสแตรปเป็นวิธีที่ถูกต้องในการประเมินความไม่แน่นอนของค่ามัธยฐานหรือไม่?
Bootstrapping ทำงานได้ดีในการเข้าถึงความไม่แน่นอนในการประมาณค่าเฉลี่ยอย่างไรก็ตามฉันจำได้ว่าการอ่าน bootstrap นั้นไม่ได้ผลดีในการประเมินความไม่แน่นอนในการประมาณแบบควอนไทล์ (โดยเฉพาะค่ามัธยฐาน) ฉันจำไม่ได้ว่าฉันอ่านตรงไหนและไม่สามารถหาอะไรได้มากมายจากการค้นหาโดย Google อย่างรวดเร็ว ความคิดเกี่ยวกับเรื่องนี้และการอ้างอิงใด ๆ จะได้รับการชื่นชมอย่างมาก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.