ถ้าเป็นเช่นนั้นอะไร ถ้าไม่ทำไมไม่
สำหรับตัวอย่างในบรรทัดค่ามัธยฐานจะลดความเบี่ยงเบนสัมบูรณ์ทั้งหมด มันดูเหมือนเป็นธรรมชาติที่จะขยายคำจำกัดความให้เป็น R2 เป็นต้น แต่ฉันไม่เคยเห็นมาก่อน แต่ฉันออกไปจากสนามไปนานแล้ว
ถ้าเป็นเช่นนั้นอะไร ถ้าไม่ทำไมไม่
สำหรับตัวอย่างในบรรทัดค่ามัธยฐานจะลดความเบี่ยงเบนสัมบูรณ์ทั้งหมด มันดูเหมือนเป็นธรรมชาติที่จะขยายคำจำกัดความให้เป็น R2 เป็นต้น แต่ฉันไม่เคยเห็นมาก่อน แต่ฉันออกไปจากสนามไปนานแล้ว
คำตอบ:
ฉันไม่แน่ใจว่ามีคำจำกัดความที่ยอมรับได้สำหรับมัธยฐานหลายตัวแปร สิ่งที่ฉันคุ้นเคยคือค่ามัธยฐานของ Ojaซึ่งจะลดผลรวมของปริมาตรของความเรียบง่ายที่เกิดขึ้นบนส่วนย่อยของคะแนน (ดูลิงก์สำหรับคำจำกัดความด้านเทคนิค)
อัปเดต: ไซต์ที่อ้างถึงคำจำกัดความของ Oja ด้านบนมีกระดาษที่ดีซึ่งครอบคลุมจำนวนคำจำกัดความของค่ามัธยฐานหลายตัวแปร:
ตามที่@Arsบอกว่าไม่มีคำจำกัดความที่ยอมรับได้ (และนี่เป็นจุดที่ดี) มีทางเลือกทั่วไปสำหรับครอบครัวในการหาวิธีสรุปปริมาณบนฉันคิดว่าสิ่งที่สำคัญที่สุดคือ:
พูดคุยเรื่องกระบวนการควอนไทล์ให้เป็นตัวชี้วัดเชิงประจักษ์ (= สัดส่วนของการสังเกตใน) จากนั้นด้วยเซตย่อยที่ได้รับการเลือกอย่างดีของชุด Borel ในและเป็นการวัดมูลค่าที่แท้จริงคุณสามารถกำหนดฟังก์ชันควอนไทล์เชิงประจักษ์ได้:A A R d λ
สมมติว่าคุณสามารถหาหนึ่งที่ให้ขั้นต่ำแก่คุณ จากนั้นชุด (หรือองค์ประกอบของชุด)ให้ค่ามัธยฐานเมื่อถูกทำให้เล็กพอ ความหมายของค่ามัธยฐานมีการกู้คืนเมื่อใช้ และ x คำตอบArsตกอยู่ในกรอบที่ฉันคิดว่า ... ที่ตั้งครึ่งช่องว่างของ tukeyอาจได้รับโดยใช้และ (กับ , )1 / 2 - ε ∩ 1 / 2 + ε ε = ( ] - ∞ , x ] x ∈ R ) λ ( ] - ∞ , x ]( ) = ( H x = ( t ∈ R d :λ (x ∈ R ∈ R d
นิยามการแปรปรวนและการประมาณค่า M ความคิดในที่นี้คือ -quantileของตัวแปรสุ่มในสามารถกำหนดผ่านความเท่าเทียมกันเชิงแปรปรวนQ α Y R
คำจำกัดความที่ใช้กันมากที่สุดคือการใช้ฟังก์ชันการถดถอยแบบควอไทล์ (เรียกอีกอย่างว่าการสูญเสียพินบอลเดาว่าทำไม?) (Yx)] เคสให้และคุณสามารถพูดคุยว่ามิติที่สูงขึ้นโดยใช้ระยะทางที่เป็นทำในคำตอบ @Srikant นี่คือค่ามัธยฐานทางทฤษฎี แต่ให้ค่ามัธยฐานเชิงประจักษ์ถ้าคุณแทนที่ความคาดหวังด้วยความคาดหวังเชิงประจักษ์ (หมายถึง) Q α = R กรัมINF x ∈ R E [ ρ α ( Y - x ) ] α = 1 / 2 ρ 1 / 2 ( Y ) = | y | l 1
แต่Kolshinskiiเสนอให้ใช้การแปลง Legendre-Fenchel: เนื่องจาก โดยที่สำหรับ{R} เขาให้เหตุผลลึก ๆ มากมายกับสิ่งนั้น (ดูกระดาษ;) Generalizing นี้เพื่อมิติที่สูงขึ้นต้องทำงานร่วมกับ vectorialและแทนที่โดยแต่คุณสามารถใช้2/1)f ( s ) = 1s∈Rαsα⟨s,α⟩α=(1/2,...,1/2)
เห็นได้ชัดว่ามีสะพานเชื่อมระหว่างสูตรต่าง ๆ พวกเขาไม่ชัดเจนทั้งหมด ...
มีวิธีที่แตกต่างในการวางแนวความคิดของค่ามัธยฐานให้อยู่ในระดับที่สูงขึ้น ยังไม่มีใครพูดถึง แต่ที่เสนอมานานคือการสร้างเรือนูนลอกมันออกไปและย้ำตราบเท่าที่คุณสามารถ: สิ่งที่เหลืออยู่ในเรือลำสุดท้ายคือชุดของคะแนนที่ผู้สมัครทุกคนจะเป็น " มีเดีย."
"การต่อสู้หัว"เป็นอีกความพยายามครั้งล่าสุด (ค. ศ. 1980) เพื่อสร้างศูนย์กลางที่แข็งแกร่งให้กับระบบคลาวด์แบบจุด 2D (ลิงค์นี้เป็นเอกสารและซอฟต์แวร์ที่สถาบันมะเร็งแห่งชาติของสหรัฐอเมริกา)
สาเหตุหลักที่ทำให้มีการวางนัยทั่วไปหลายแบบและไม่มีใครแก้ปัญหาได้ชัดเจนว่า R1 สามารถสั่งซื้อได้ แต่ R2, R3, ...
ค่ามัธยฐานทางเรขาคณิตเป็นจุดที่มีระยะยูคลิดเฉลี่ยที่เล็กที่สุดจากตัวอย่าง
ค่ากลางของ Tukey สามารถขยายได้ถึง> 2 มิติโดยใช้ DEEPLOC ซึ่งเป็นอัลกอริทึมเนื่องจาก Struyf และ Rousseeuw; ดูที่นี่สำหรับรายละเอียด
อัลกอริทึมที่ใช้ในการประมาณจุดที่ลึกที่สุดได้อย่างมีประสิทธิภาพ; วิธีการที่ไร้เดียงสาซึ่งพยายามที่จะตรวจสอบสิ่งนี้มักจะเรียกใช้ afoul ของ (เวอร์ชั่นการคำนวณของ) "คำสาปของมิติ" ที่รันไทม์ที่จำเป็นในการคำนวณสถิติเติบโตขึ้นชี้แจงกับจำนวนของมิติของพื้นที่
คำจำกัดความที่มาใกล้กับมันสำหรับการแจกแจงแบบ unimodal คือค่ากลางของ tukey halfspace
ผมไม่ทราบว่าถ้ามีความหมายดังกล่าวอยู่ แต่ฉันจะพยายามขยายความคมชัดมาตรฐานของค่ามัธยฐานเพื่อ 2 ฉันจะใช้สัญลักษณ์ต่อไปนี้:
, Y : ตัวแปรสุ่มที่เกี่ยวข้องกับสองมิติ
, m y : ค่าเฉลี่ยที่สอดคล้องกัน
: PDF ร่วมสำหรับตัวแปรสุ่มของเรา
ในการเพิ่มความหมายของค่ามัธยฐานเป็นเราเลือกm xและm yเพื่อลดสิ่งต่อไปนี้:
ปัญหาตอนนี้คือเราต้องการคำนิยามสำหรับสิ่งที่เราหมายถึงโดย:
ด้านบนมีความหมายว่าการวัดระยะทางและคำจำกัดความที่เป็นไปได้หลายประการอาจเป็นไปได้