ค่ามัธยฐานเป็นประเภทของค่าเฉลี่ยหรือไม่สำหรับการวางนัยทั่วไปของ "หมายถึง"?


20

แนวคิดของ "หมายถึง" roams กว้างกว่าค่าเฉลี่ยเลขคณิตแบบดั้งเดิม; มันยืดจนรวมค่ามัธยฐานหรือไม่? โดยการเปรียบเทียบ

ข้อมูลดิบรหัสข้อมูลดิบค่าเฉลี่ยดิบหมายถึงรหัส-1เลขคณิตหมายถึงข้อมูลดิบrecipส่วนกลับค่าเฉลี่ยค่าเฉลี่ยซึ่งกันและกันrecip-1ค่าเฉลี่ยฮาร์มอนิกข้อมูลดิบเข้าสู่ระบบบันทึกค่าเฉลี่ยหมายถึงบันทึกเข้าสู่ระบบ-1เฉลี่ยเรขาคณิตข้อมูลดิบสี่เหลี่ยมสี่เหลี่ยมค่าเฉลี่ยตารางสี่เหลี่ยม-1รูตหมายความว่ากำลังสองข้อมูลดิบยศการจัดอันดับค่าเฉลี่ยหมายถึงอันดับยศ-1มัธยฐาน

อุปมาที่ฉันวาดคือค่าเฉลี่ยกึ่งเลขคณิตให้โดย:

M(x1,...,xn)=-1(1nΣผม=1n(xผม))

สำหรับการเปรียบเทียบเมื่อเราบอกว่าค่ามัธยฐานของชุดข้อมูลห้ารายการมีค่าเท่ากับรายการที่สามเราจะเห็นได้ว่าเท่ากับการจัดอันดับข้อมูลจากหนึ่งถึงห้า (ซึ่งเราอาจแสดงโดยฟังก์ชัน ) ใช้ค่าเฉลี่ยของข้อมูลที่แปลงแล้ว (ซึ่งก็คือสาม) และอ่านค่าของรายการข้อมูลที่มีอันดับสามกลับคืน (เรียงลำดับเป็น-1 )

ในตัวอย่างของค่าเฉลี่ยเรขาคณิต, ค่าเฉลี่ยฮาร์มอนิกและ RMS, เป็นฟังก์ชันคงที่ที่สามารถใช้กับจำนวนใดก็ได้ในการแยก ในทางตรงกันข้ามไม่ว่าจะกำหนดอันดับหรือกลับจากอันดับไปยังข้อมูลดั้งเดิม (การแก้ไขเมื่อจำเป็น) ต้องใช้ความรู้ของชุดข้อมูลทั้งหมด ยิ่งกว่านั้นในคำจำกัดความที่ฉันได้อ่านค่าเฉลี่ยกึ่งเลขคณิต, จะต้องต่อเนื่อง ค่ามัธยฐานเคยถูกพิจารณาว่าเป็นกรณีพิเศษของค่าเฉลี่ยกึ่งคณิตศาสตร์หรือไม่และถ้าเป็นเช่นนั้นค่าถูกกำหนดอย่างไร? หรือค่ามัธยฐานที่เคยอธิบายไว้เป็นตัวอย่างของความคิดที่กว้างขึ้นของ "หมายถึง" อื่น ๆ ? ค่าเฉลี่ยกึ่งเลขคณิตนั้นไม่ได้มีเพียงการวางนัยทั่วไปเท่านั้น

ส่วนหนึ่งของปัญหาคือคำศัพท์ (หมายถึงอะไร "หมายความว่าโดยเฉพาะอย่างยิ่งในทางตรงกันข้ามกับ" แนวโน้มกลาง "หรือ" เฉลี่ย "?) ยกตัวอย่างเช่นในวรรณกรรมสำหรับระบบควบคุมฟัซซีฟังก์ชั่นการรวมเป็นฟังก์ชั่นที่เพิ่มขึ้นกับและ ; ฟังก์ชันการรวมที่\ min (x, y) \ leq F (x, y) \ leq \ max (x, y)สำหรับxทั้งหมด, y \ in [a, b]เรียกว่า "หมายถึง" (ใน ความหมายทั่วไป) คำจำกัดความดังกล่าวไม่จำเป็นต้องพูดกว้างอย่างไม่น่าเชื่อ! และในบริบทนี้ค่ามัธยฐานจะเรียกว่าเป็นค่าเฉลี่ยชนิดหนึ่ง ^ {[1]}F:[a,]×[a,][a,]F(a,a)=aF(,)=นาที(x,Y)F(x,Y)สูงสุด(x,Y)[ 1 ]x,Y[a,][1]แต่ฉันอยากรู้ว่าลักษณะที่กว้างกว่าของค่าเฉลี่ยนั้นยังสามารถขยายได้ไกลพอที่จะครอบคลุมค่ามัธยฐาน - ค่าเฉลี่ยทั่วไปที่เรียกว่า (ซึ่งอาจอธิบายได้ดีกว่าว่า "อำนาจเฉลี่ย") และค่าเฉลี่ยของ Lehmerไม่ได้ แต่คนอื่น ๆ อาจ . สำหรับสิ่งที่คุ้มค่าWikipedia จะรวม "ค่ามัธยฐาน" ไว้ในรายการ "วิธีการอื่น"แต่ไม่มีความคิดเห็นหรือการอ้างอิงเพิ่มเติม

[1] : คำจำกัดความกว้าง ๆ ดังกล่าวขยายออกไปอย่างเหมาะสมมากกว่าสองอินพุตดูเหมือนว่าเป็นมาตรฐานในการควบคุมฟัซซีและถูกครอบตัดหลายครั้งในระหว่างการค้นหาทางอินเทอร์เน็ตสำหรับกรณีของค่ามัธยฐานที่ถูกอธิบายว่าเป็นค่ามัธยฐาน ฉันจะอ้างอิงเช่น Fodor, JC, & Rudas, IJ (2009), " ในบางคลาสของฟังก์ชั่นการรวมที่เป็นผู้อพยพ ", IFSA / EUSFLAT Conf (pp. 653-656) บทความนี้ตั้งข้อสังเกตว่าหนึ่งในผู้ใช้ที่เก่าแก่ที่สุดของคำว่า "หมายถึง" ( moyenne ) คือCauchyในCours d'analyse de l'École royale polytechnique, 1èreภาคี; วิเคราะห์algébrique (1821) การมีส่วนร่วมในภายหลังของAczél , Chisini ,และเดอ Finettiในการพัฒนาแนวความคิดที่กว้างขึ้นของ "ค่าเฉลี่ย" กว่า Cauchy เป็นที่ยอมรับในโดเจและ Roubens, M. (1995), " ในความหมายหมายถึง " วารสารการคำนวณและคณิตศาสตร์ประยุกต์ , 64 (1) 103-115


ฉันคิดว่าค่าเฉลี่ยเลขคณิตค่ามัธยฐานและโหมดแร่มักจะถูกเรียกโดยทั่วไปว่า "หมายถึง" และบางครั้งคำนั้นถูกใช้ในทางที่ไม่ชัดเจน หนังสือ How To Lie With Statisticsใช้เป็นตัวอย่างของ "การโกหก" ที่มีสถิติ (ฉันเข้าใจว่าคำถามของคุณเป็นเรื่องทั่วไปดังนั้นโปรดโพสต์เป็นความคิดเห็น)
ทิม

@Tim ฉันมีความรู้สึกที่ไม่เป็นวิทยาศาสตร์จนยากที่จะเห็น "โหมด" ซึ่งเรียกว่า "หมายถึง" แต่มีความสับสนอย่างมากเกี่ยวกับการใช้ "ค่าเฉลี่ย" (ซึ่งบางครั้งใช้เป็นคำพ้องสำหรับ "ค่าเฉลี่ยเลขคณิต" และเวลาอื่น ๆ รวมถึงมาตรการของแนวโน้มกลางที่ไม่ได้หมายความว่าทั้งหมด) และ "หมายถึง" (ซึ่งใน การใช้งานทั่วไปมากกว่าในแง่เทคนิคเป็นส่วนใหญ่ แต่ไม่ได้ใช้เฉพาะสำหรับ "ค่าเฉลี่ยเลขคณิต") บังเอิญมันเป็นหัวข้อที่ยากสำหรับการค้นหาทางอินเทอร์เน็ตเนื่องจากความหมายอื่น ๆของ "หมายถึง"!
Silverfish

3
หมายถึง (คณิตศาสตร์, เรขาคณิต, ฮาร์โมนิ, ขับเคลื่อน, ชี้แจง, combinatorial ฯลฯ ) เป็น "ค่าเฉลี่ยการวิเคราะห์" ค่ามัธยฐาน, ควอไทล์, tantiles คือ "ค่าเฉลี่ยตำแหน่ง" การจัดอันดับนั้นค่อนข้างแตกต่างจาก log, square ฯลฯ เนื่องจากเป็นการเปลี่ยนแปลงแบบ monotonic ของตัวแปรใด ๆ ไปเป็นชุดรูปแบบที่ต่างกันและไม่มีเส้นทางย้อนกลับไปยังแบบไม่เปลี่ยนแปลง
ttnphns

Btw คำว่า "ค่าเฉลี่ยทั่วไป" นั้นถูกทำให้ยุ่งเหยิงen.wikipedia.org/wiki/Generalized_mean
ttnphns

3
หากคุณอนุญาตให้มีน้ำหนักในการคำนวณก็จะถือว่าค่ามัธยฐานเป็นค่าเฉลี่ยได้ง่าย ในทำนองเดียวกัน แต่ไม่เหมือนกันแนวคิดของการตัดแต่งหมายถึงการรวมมีเดียไว้เป็นกรณีพิเศษที่ จำกัด หรือได้รับความอนุเคราะห์ stata-journal.com/article.html?article=st0313เป็นรีวิวล่าสุด ΣผมWผมxผม,ΣผมWผม=1
Nick Cox

คำตอบ:


9

นี่คือวิธีหนึ่งที่คุณอาจคิดว่าค่ามัธยฐานเป็น "ค่าเฉลี่ยทั่วไป" - อันดับแรกให้กำหนดค่าเฉลี่ยเลขคณิตสามัญของคุณอย่างรอบคอบในแง่ของสถิติการสั่งซื้อ:

x¯=ΣผมWผมx(ผม),Wผม=1n.

จากนั้นด้วยการแทนที่สถิติคำสั่งซื้อเฉลี่ยโดยทั่วไปด้วยฟังก์ชันน้ำหนักอื่น ๆ เราจะได้รับแนวคิด "ค่าเฉลี่ยทั่วไป" ที่บัญชีสำหรับการสั่งซื้อ

ในกรณีดังกล่าวโฮสต์ของการวัดที่เป็นไปได้ของศูนย์กลางกลายเป็น "วิธีการทั่วไป" ในกรณีของค่ามัธยฐานสำหรับคี่ ,และอื่น ๆ ทั้งหมดคือ 0 และสำหรับคู่ ,{2}w ( n + 1 ) / 2 = 1 n w nnW(n+1)/2=1nWn2=Wn2+1=12

ในทำนองเดียวกันถ้าเราดูที่M-estimation การประมาณตำแหน่งอาจจะคิดว่าเป็นลักษณะทั่วไปของค่าเฉลี่ยเลขคณิต (โดยที่ค่าเฉลี่ย,เป็นกำลังสอง,เป็นเส้นตรงหรือฟังก์ชันน้ำหนักแบน) และ ค่ามัธยฐานตกอยู่ในระดับของภาพรวมนี้ นี่เป็นลักษณะทั่วไปที่ค่อนข้างแตกต่างจากก่อนหน้านี้ψρψ

มีวิธีอื่น ๆ อีกมากมายที่เราอาจขยายความคิดของ 'หมายถึง' ที่อาจรวมถึงค่ามัธยฐาน


นี่เป็นสิ่งที่ดีมาก เกี่ยวข้องอย่างใกล้ชิดกับคำตอบนี้และมีการกล่าวถึงในเอกสารที่อ้างถึงในคำถาม: ค่าเฉลี่ยถ่วงน้ำหนักที่สั่งซื้อหรือ OWA
Silverfish

11

ถ้าคุณคิดว่าค่าเฉลี่ยเป็นจุดที่ลดฟังก์ชั่นการสูญเสียกำลังสอง SSE แล้วค่ามัธยฐานคือจุดที่ลดฟังก์ชั่นการสูญเสียเชิงเส้น MAD และโหมดเป็นจุดที่ลดฟังก์ชันการสูญเสีย 0-1 บางส่วน ไม่ต้องแปลง

ดังนั้นค่ามัธยฐานเป็นตัวอย่างของหนึ่งเฉลี่ยFréchet


3
@ ไมค์แอนเดอร์สัน: นี่แสดงให้เห็นว่าสื่อนั้นเป็นค่าเฉลี่ยของ Frechet (ดูบทความ wikipedia): en.wikipedia.org/wiki/Fr%C3%A9chet_mean
kjetil b halvorsen

@ Kjetil ยอดเยี่ยม! ความจริงที่ว่าค่ามัธยฐานเป็นตัวอย่างของค่าเฉลี่ยFréchetเป็นคำตอบที่ตรงกับคำถามของฉัน "เป็นค่ามัธยฐานที่เคยอธิบายว่าเป็นตัวอย่างของความคิดที่กว้างขึ้นของ" หมายถึง "? และ +1 ถึง Mike Anderson ฉันหวังว่าข้อมูลนี้จะได้รับการแก้ไขในคำตอบ
Silverfish

2
ฉันได้เพิ่มความคิดเห็นของ @ Kjetil ให้กับคำตอบเพื่อที่จะปรากฏในการค้นหาไซต์สำหรับ "Frechet Mean" ขอบคุณทั้งคู่
Silverfish

4

หนึ่งทั่วไปง่าย แต่มีผลคือการวิธีการถ่วงน้ำหนัก ,ที่1 เห็นได้ชัดว่าทั่วไปหรือสวนหมายถึงเป็นกรณีพิเศษที่ง่ายที่สุดที่มีน้ำหนักเท่ากับ nn i = 1 w i = 1 w i = 1 / nΣผม=1nWผมxผม/Σผม=1nWผม,Σผม=1nWผม=1Wผม=1/n

การให้น้ำหนักขึ้นอยู่กับลำดับของค่าในขนาดจากน้อยไปหามากที่สุดชี้ไปที่กรณีพิเศษอื่น ๆ อีกมากมายโดยเฉพาะอย่างยิ่งแนวคิดของค่าเฉลี่ยที่ถูกตัดซึ่งเป็นที่รู้จักกันในชื่ออื่นด้วย

เพื่อหลีกเลี่ยงการใช้สัญกรณ์มากเกินไปโดยไม่จำเป็นหรือมีประโยชน์เป็นพิเศษลองจินตนาการถึงตัวอย่างที่ไม่สนใจค่าที่เล็กที่สุดและใหญ่ที่สุดและการใช้ค่าเฉลี่ย (น้ำหนักเท่ากัน) ของผู้อื่น หรือลองจินตนาการถึงการไม่สนใจทั้งสองที่เล็กที่สุดและใหญ่ที่สุดสองคน และอื่น ๆ ตัดแข็งแรงส่วนใหญ่จะไม่สนใจทั้งหมด แต่หนึ่งหรือสองค่ากลางในการสั่งซื้อขึ้นอยู่กับว่าจำนวนของค่าเป็นคี่หรือคู่ซึ่งเป็นธรรมชาติเพียงคุ้นเคยเฉลี่ย ไม่มีอะไรในความคิดของการตัดแต่งที่ทำให้คุณไม่สนใจตัวเลขที่เท่ากันในแต่ละหางของตัวอย่าง แต่การพูดเพิ่มเติมเกี่ยวกับการตัดแต่งแบบอสมมาตรจะทำให้เราห่างไกลจากแนวคิดหลักในหัวข้อนี้

ในระยะสั้นหมายถึง (ไม่มีเงื่อนไข) และค่ามัธยฐานเป็นกรณีที่ จำกัด มากของครอบครัวของ (หมายถึง) ตัดวิธีการ แนวคิดโดยรวมคือการยอมให้มีการประนีประนอมระหว่างอุดมคติหนึ่งของการใช้ข้อมูลทั้งหมดในข้อมูลและอุดมคติในการปกป้องตนเองจากจุดข้อมูลที่รุนแรงซึ่งอาจเป็นค่าผิดปกติที่ไม่น่าเชื่อถือ

ดูข้อมูลอ้างอิงที่นี่สำหรับการตรวจสอบล่าสุดอย่างเป็นธรรม


4

คำถามเชิญชวนให้เราอธิบายลักษณะของ "หมายถึง" ในความหมายกว้างพอที่จะครอบคลุมทุกวิธีปกติ - หมายถึงพลังงานหมายถึง , ค่าเฉลี่ย, ค่ามัธยฐาน, ค่าตัดแต่ง - แต่ไม่กว้างมากจนเกือบไร้ประโยชน์สำหรับข้อมูล การวิเคราะห์ การตอบกลับนี้กล่าวถึงคุณสมบัติเชิงสัจพจน์บางอย่างที่คำจำกัดความที่มีประโยชน์ตามสมควรของคำว่า "หมายถึง" ควรมีLพี


สัจพจน์พื้นฐาน

ความหมายกว้าง ๆ ที่เป็นประโยชน์ของ "หมายถึง" เพื่อจุดประสงค์ในการวิเคราะห์ข้อมูลจะเป็นลำดับของฟังก์ชันที่กำหนดไว้อย่างดีสำหรับและเช่นนั้นA R n = 1 , 2 , fn:AnAARn=1,2,...

(1)สำหรับ (ค่าเฉลี่ยอยู่ระหว่างสุดขั้ว)x = ( x 1 , x 2 , , x n ) A nนาที(x)n(x)สูงสุด(x)x=(x1,x2,,xn)An

(2)เป็นค่าคงที่ภายใต้พีชคณิตของข้อโต้แย้ง (หมายถึงไม่สนใจเกี่ยวกับลำดับของข้อมูล) และfn

(3) แต่ละไม่ลดลงในแต่ละอาร์กิวเมนต์ของมัน (เมื่อจำนวนเพิ่มขึ้นค่าเฉลี่ยจะไม่ลดลง)fn

เราต้องอนุญาตให้เป็นเซตย่อยที่เหมาะสมของจำนวนจริง (เช่นจำนวนบวกทั้งหมด) เพราะมีวิธีการมากมายเช่นวิธีทางเรขาคณิตถูกกำหนดไว้ในชุดย่อยดังกล่าวเท่านั้นA

เราอาจต้องการที่จะเพิ่ม

(1 ') มีอย่างน้อยที่ (หมายถึงไม่สุดขั้ว) (เราไม่สามารถกำหนดได้ว่าจะต้องมีสิ่งนี้เสมอตัวอย่างเช่นค่ามัธยฐานของเท่ากับซึ่งเป็นค่าต่ำสุด)นาที( x ) n ( x ) สูงสุด( x ) ( 0 , 0 , ... , 0 , 1 ) 0xAmin(x)fn(x)max(x)(0,0,,0,1)0

คุณสมบัติเหล่านี้ดูเหมือนจะจับความคิดที่อยู่เบื้องหลัง "หมายถึง" เป็น "ค่ากลาง" บางอย่างของชุดข้อมูล (ไม่เรียงลำดับ)

สัจพจน์ที่สอดคล้องกัน

ฉันถูกล่อลวงให้กำหนดเกณฑ์ความมั่นคงที่ค่อนข้างชัดเจนน้อยกว่าอย่างเห็นได้ชัด

(4.a) ช่วงของเมื่อแตกต่างกันไปตามช่วงเวลารวมถึงx) กล่าวอีกนัยหนึ่งมันเป็นไปได้เสมอที่จะปล่อยให้ค่าเฉลี่ยไม่เปลี่ยนแปลงโดยติดกับค่าที่เหมาะสมไปยังชุดข้อมูล ร่วมกับ (3) ก็หมายความว่าติดกับค่าสุดขีดไปยังชุดข้อมูลจะดึงค่าเฉลี่ยไปยังสุดขั้วเหล่านั้นt [ min ( x ) , max ( x ) ] f n ( x ) tn+1(เสื้อ,x1,x2,...,xn)เสื้อ[นาที(x),สูงสุด(x)]n(x)เสื้อ

หากเราต้องการใช้แนวคิดของค่าเฉลี่ยกับการแจกแจงหรือ "ประชากรที่ไม่มีที่สิ้นสุด" ดังนั้นวิธีหนึ่งก็คือการได้มาซึ่งมันอยู่ในขอบเขตของตัวอย่างสุ่มขนาดใหญ่โดยพลการ แน่นอนว่าขีด จำกัด อาจไม่ได้มีอยู่เสมอ (ไม่มีอยู่สำหรับค่าเฉลี่ยเลขคณิตเมื่อการแจกแจงไม่มีความคาดหมายเป็นต้น) ดังนั้นฉันไม่ต้องการกำหนดความจริงเพิ่มเติมใด ๆ เพื่อรับประกันการมีอยู่ของข้อ จำกัด ดังกล่าว แต่สิ่งต่อไปนี้ดูเป็นธรรมชาติและมีประโยชน์:

(4.b) เมื่อใดก็ตามที่ขอบเขตและเป็นลำดับของตัวอย่างจากการแจกแจงสนับสนุนบนดังนั้นขีด จำกัด ของเกือบจะแน่นอน สิ่งนี้จะป้องกันไม่ให้ค่าเฉลี่ย "ตลอดไป" ในแม้ขนาดตัวอย่างจะใหญ่ขึ้นและใหญ่ขึ้นx n F A f n ( x n ) AAxnFAn(xn)A

ในบรรทัดเดียวกันเราสามารถจำกัดความหมายที่จะยืนยันว่ามันกลายเป็นตัวประมาณที่ดีขึ้นของ "ตำแหน่ง" เมื่อขนาดตัวอย่างเพิ่มขึ้น:

(4.c) เมื่อใดก็ตามที่ถูก จำกัด จากนั้นความแปรปรวนของการแจกแจงตัวอย่างของสำหรับตัวอย่างแบบสุ่มของเป็น nondecreasing ในnf n ( X ( n ) ) X ( n ) = ( X 1 , X 2 , , X n ) F nAn(X(n))X(n)=(X1,X2,...,Xn)Fn

สัจพจน์ต่อเนื่อง

เราอาจพิจารณาการถามหมายถึงการเปลี่ยนแปลง "อย่าง" กับข้อมูล:

(5)แยกกันอย่างต่อเนื่องในแต่ละอาร์กิวเมนต์ (การเปลี่ยนแปลงเล็กน้อยในค่าข้อมูลไม่ควรทำให้เกิดการกระโดดอย่างฉับพลันในค่าเฉลี่ย)n

ข้อกำหนดนี้อาจกำจัดภาพรวมที่แปลกประหลาดบางอย่าง แต่ไม่ได้ตัดทอนค่าเฉลี่ยที่รู้จักกันดี มันจะออกกฎฟังก์ชั่นการรวมบางส่วน

สัจพจน์คงที่

เราสามารถเข้าใจวิธีการที่นำไปใช้กับข้อมูลช่วงเวลาหรืออัตราส่วน (ในแง่ที่เป็นที่รู้จักกันดีของ Stevens) เราไม่สามารถเรียกร้องที่พวกเขาจะคงอยู่ภายใต้การเปลี่ยนแปลงของสถานที่ตั้ง (ค่าเฉลี่ยเรขาคณิตไม่ได้) แต่เราสามารถต้อง

(6)สำหรับทุกและทุกที่ n นี่บอกเพียงว่าเรามีอิสระในการคำนวณโดยใช้หน่วยการวัดใด ๆ ที่เราชอบxA n λ > 0 λ xA n f nn(λx)=λn(x)xAnλ>0λxAnn

วิธีการทั้งหมดที่กล่าวถึงในคำถามตอบสนองความจริงนี้ยกเว้นฟังก์ชั่นการรวมบางอย่าง


การสนทนา

ฟังก์ชันการรวมทั่วไปดังที่อธิบายไว้ในคำถามไม่จำเป็นต้องตอบสนองความจริง (1 '), (2), (3), (5) หรือ (6) ไม่ว่าพวกเขาตอบสนองหลักการสอดคล้องใด ๆ อาจขึ้นอยู่กับว่าพวกเขาจะขยายไปยัง2 n > 22n>2

ค่ามัธยฐานตัวอย่างปกติมีความสุขกับคุณสมบัติสัจพจน์ทั้งหมดเหล่านี้

เราสามารถเพิ่มสัจพจน์ที่สอดคล้องกันเพื่อรวม

(4.d) สำหรับทั้งหมดxn2n(x;x)=n(x)xAn.

นี่ก็หมายความว่าเมื่อองค์ประกอบทั้งหมดของชุดข้อมูลซ้ำกันอย่างสม่ำเสมอบ่อยครั้งค่าเฉลี่ยจะไม่เปลี่ยนแปลง สิ่งนี้อาจแข็งแกร่งเกินไปแม้ว่า: ค่าเฉลี่ยของ Winsorizedจะไม่มีคุณสมบัตินี้ (ยกเว้นแบบไม่แสดงอาการ) วัตถุประสงค์ของ Winsorizing ที่ระดับคือให้ความต้านทานต่อการเปลี่ยนแปลงอย่างน้อยของข้อมูลที่รุนแรงมาก ตัวอย่างเช่นค่าเฉลี่ยของการรวม 10% ของคือค่าเฉลี่ยเลขคณิตของเท่ากับแต่ค่าเฉลี่ยของการ% 10 ที่ได้รับจากเป็น3.5100 α % ( 1 , 2 , 3 , 6 ) ( 2 , 2 , 3 , 3 ) 2.5 ( 1 , 1 , 2 , 2 , 3 , 3 , 6 , 6 ) 3.5100α% 100α%(1,2,3,6)(2,2,3,3)2.5(1,1,2,2,3,3,6,6)3.5

ฉันไม่ทราบว่าสัจพจน์ที่สอดคล้องกัน (4.a), (4.b) หรือ (4.c) จะเป็นที่ต้องการหรือมีประโยชน์มากที่สุด ดูเหมือนว่าพวกเขาจะเป็นอิสระ: ฉันไม่คิดว่าพวกเขาสองคนหมายความถึงบุคคลที่สาม


(+1) ฉันคิดว่า (1 ') "หมายถึงไม่สุดขั้ว" เป็นจุดที่น่าสนใจ Many นิยามธรรมชาติมิฉะนั้นค่าเฉลี่ยที่เกิดขึ้นรวมถึงต่ำสุดและสูงสุดเป็นกรณีพิเศษหรือ จำกัด : นี่คือความจริงของวิธีการพลังงาน , วิธี Lehmer , Fréchetเฉลี่ย , Chisini เฉลี่ยและStolarsky เฉลี่ย แม้ว่ามันจะดูค่อนข้างแปลกที่จะอ้างถึงพวกเขาว่า "ธรรมดา"!
Silverfish

ใช่กรณีจำกัดไม่สามารถหลีกเลี่ยงได้ แต่สำหรับชุดข้อมูลที่ จำกัด เราอาจต้องการยืนยันว่าค่าสูงสุดหรือค่าต่ำสุดไม่มีคุณสมบัติเป็น "หมายถึง"
whuber

ในอีกทางหนึ่งไม่เพียง แต่เป็นความจริงที่ว่า "ค่ามัธยฐานตัวอย่างทั่วไปสนุกกับคุณสมบัติเชิงสัจพจน์เหล่านี้ทั้งหมด" แต่ทำตัวอย่างควอนไทด์ตามปกติ นอกจากนี้ยังรู้สึกแปลก ๆ ที่จะอ้างถึงตัวอย่างเช่นควอไทล์ชั้นบนในฐานะ "หมายถึง" (แม้ว่าฉันเคยเห็นมันใช้เป็นเครื่องวัดแนวโน้มกลางในข้อมูลที่เบ้มาก) หากเรายอมรับควอนไทล์อื่น ๆ ทั้งหมดมันก็ไม่ได้รู้สึกผิดที่จะยอมรับ minima และ maxima อีกต่อไป แต่ฉันสามารถเห็นได้อย่างแน่นอนว่าอาจเป็นที่ต้องการอย่างน้อยรักษาสิทธิ์ในการยกเว้นพวกเขา
Silverfish

1
ฉันไม่ได้ยุ่งกับการรับของ quantiles เข้าไปในแพนธีออนของวิธีการ ท้ายที่สุดสำหรับครอบครัวที่มีการแจกแจงควอนไทล์ที่ไม่ใช่ค่ามัธยฐานบางอย่างจะตรงกับวิธีการทางคณิตศาสตร์ดังนั้นคุณอาจมีปัญหาหากคุณพยายามที่จะกำจัดความเป็นไปได้นี้ตามธรรมชาติ (ลองพิจารณาตระกูลของการแจกแจงแบบ lognormal ของ SD เรขาคณิตคงที่เป็นต้น) ถ้าค่าเฉลี่ยเลขคณิตไม่สามารถจัดว่าเป็นค่าเฉลี่ยได้ทั้งหมดจะหายไป!
whuber

1
ฉันได้พิจารณาวิธีการนั้นแล้วและปฏิเสธดังที่อธิบายไว้ในคำตอบของฉัน: หากคุณใช้เกณฑ์ดังกล่าวสำหรับคุณจะกำจัดค่ามัธยฐานเป็นค่าเฉลี่ย! n>2
whuber

2

ฉันคิดว่าค่ามัธยฐานนั้นถือได้ว่าเป็นลักษณะทั่วไปของค่าเฉลี่ยเลขคณิต โดยเฉพาะค่าเฉลี่ยเลขคณิตและค่ามัธยฐาน (กลุ่มอื่น ๆ ) สามารถรวมเป็นกรณีพิเศษของค่าเฉลี่ยของChisini. หากคุณกำลังจะดำเนินการบางอย่างกับชุดของค่า Chisini หมายถึงจำนวนที่คุณสามารถทดแทนค่าเดิมทั้งหมดในชุดและยังได้ผลลัพธ์เดียวกัน ตัวอย่างเช่นหากคุณต้องการหาผลรวมของค่าของคุณการแทนที่ค่าทั้งหมดด้วยค่าเฉลี่ยเลขคณิตจะให้ผลรวมเดียวกัน แนวคิดคือค่าที่แน่นอนเป็นตัวแทนของตัวเลขในชุดในบริบทของการดำเนินการบางอย่างกับตัวเลขเหล่านั้น (ความหมายที่น่าสนใจของวิธีคิดนี้คือค่าที่กำหนด - ค่าเฉลี่ยเลขคณิต - สามารถพิจารณาได้เพียงตัวแทนภายใต้สมมติฐานที่ว่าคุณกำลังทำบางสิ่งกับตัวเลขเหล่านั้น)

นี่ไม่ค่อยชัดเจนสำหรับค่ามัธยฐาน (และฉันทราบว่าค่ามัธยฐานไม่ได้ระบุว่าเป็นหนึ่งใน Chisini หมายถึง Wolfram หรือWikipedia ) แต่ถ้าคุณอนุญาตให้มีการดำเนินการมากกว่าตำแหน่งค่ามัธยฐานอาจอยู่ในแนวความคิดเดียวกัน


M(M,M,...,M)=(x1,x2,...,xn)

นั่นเป็นคำถามที่ดี @Silverfish ฉันเคยคิดถึงเรื่องนี้ ;-) ความคิดของฉันยิ่งกว่านั้นในการถามและการอภิปรายในความคิดเห็นกรอบความคิดดูเหมือนจะเป็นวิธีการรับค่าเฉลี่ยและวิธีการรับข้อมูลกลับมาจากค่าเฉลี่ย OTOH การกำหนดกรอบของฉันคือสิ่งที่เราใช้ค่าเฉลี่ยสำหรับ: ได้แก่ การบีบอัดข้อมูลที่สูญเสียข้อมูลขั้นต่ำ
gung - Reinstate Monica


@ Silververfish ฉันให้ที่ดูเหมือนจะเป็นหลุมที่ค่อนข้างมีปัญหาในตำแหน่งของฉัน
gung - Reinstate Monica

(x¯,x¯,...,x¯)x¯

-1

คำถามนี้ยังไม่ชัดเจน หากเราเห็นด้วยกับคำนิยาม "ถนน" ทั่วไปของค่าเฉลี่ยเป็นผลรวมของตัวเลข n หารด้วย n ดังนั้นเราจึงมีส่วนร่วมในพื้นดิน ยิ่งไปกว่านั้นถ้าเราจะดูที่การวัดแนวโน้มกลางเราสามารถพูดได้ว่าค่าเฉลี่ยและค่ามัธยฐานเป็นลักษณะที่เกิดขึ้น แต่ไม่ใช่ของกันและกัน ส่วนหนึ่งของภูมิหลังของฉันอยู่ในขอบเขตที่ไม่ได้ จำกัด ดังนั้นฉันจึงชอบค่ามัธยฐานและความทนทานที่มีให้ แต่แต่ละมาตรการมีสถานที่ขึ้นอยู่กับวัตถุประสงค์


2
ยินดีต้อนรับสู่เว็บไซต์ Bob ของเรา ฉันเชื่อว่าถ้าคุณอ่านท้ายคำถาม - โดยเฉพาะในย่อหน้าสุดท้าย - คุณจะพบว่ามันแม่นยำและชัดเจน (หากไม่ใช่มันเป็นความคิดที่ดีที่จะอธิบายสิ่งที่คุณหมายถึงโดย "ไม่ได้นิยามไว้อย่างชัดเจน") ความคิดเห็นของคุณดูเหมือนจะไม่ได้ตอบคำถามที่ถูกถามจริงๆ
whuber

1
จริง ๆ แล้วฉันเห็นอกเห็นใจกับความรู้สึกของบ็อบว่าคำถามนั้นไม่ได้กำหนดไว้อย่างดีเยี่ยมในแง่ที่ว่าแนวคิดของ "หมายถึง" ไม่มีคำจำกัดความเดียว แต่ฉันพยายามทำให้สิ่งต่าง ๆ ชัดเจนที่สุดเท่าที่จะทำได้ ฉันหวังว่าการแก้ไขครั้งล่าสุดของฉันจะช่วยชี้แจงสิ่งต่าง ๆ
Silverfish

1
เหตุผลที่ฉันรู้สึกว่าคำถามมีคุณค่าบางอย่างนอกเหนือจากศัพท์เพียงอย่างเดียว (หมายความว่ายังไงต่อไปและมีคำจำกัดความที่เราสามารถยืดเท่าที่จะรวมค่ามัธยฐานได้หรือไม่) คืออาจเป็นคำแนะนำที่จะเห็นค่ามัธยฐาน สมาชิกของครอบครัวภาพรวมของค่าเฉลี่ย ตัวอย่างของนิคค็อกซ์เกี่ยวกับค่ามัธยฐานเป็นกรณี จำกัด ของค่าเฉลี่ยที่ถูกตัดเป็นสิ่งที่ดีโดยเฉพาะ - มันเชื่อมโยงอย่างแนบเนียนด้วยคุณสมบัติ "ความทนทาน" ที่คุณชอบ ในครอบครัวที่ได้รับการตัดหมายถึงค่าเฉลี่ยเลขคณิต "ถนน" และค่ามัธยฐานอยู่ตรงข้ามลงท้ายด้วยสเปกตรัมระหว่างพวกเขา
Silverfish
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.