เมื่อไหร่ที่เราจะใช้ tantiles และอยู่ตรงกลางแทนที่จะเป็น quantiles และมัธยฐาน?


14

ฉันไม่สามารถหาคำจำกัดความของคำว่า tantile หรือ medial บน Wikipedia หรือ Wolfram Mathworld แต่คำอธิบายต่อไปนี้มีให้ในBílková, D. และ Mala, I. (2012), "การประยุกต์ใช้วิธี L-moment เมื่อสร้างแบบจำลองการกระจายรายได้ ในสาธารณรัฐเช็ก ", วารสารสถิติออสเตรีย , 41 (2), 125–132

ตรงกลางคือค่าของที่ (ตัวอย่าง) tantile เช่นเดียวกับค่าเฉลี่ยของกลุ่มตัวอย่างเท่ากับมูลค่าของที่50 % quantile ตัวอย่าง ตัวอย่าง tantiles เช่นเดียวกับ quantiles ตัวอย่างจะขึ้นอยู่กับตัวอย่างที่สั่งซื้อ ก่อนอื่นผลรวมสะสมของการสังเกตในตัวอย่างที่สั่งซื้อจะถูกประเมิน แล้วสำหรับที่กำหนดร้อยละP , 0 < P < 100เป็นพี50%50%p0<p<100 tantile ถูกกำหนดให้เป็นค่าของตัวแปรที่วิเคราะห์ซึ่งแบ่งการสังเกตทั้งหมดในตัวอย่างที่ได้รับคำสั่งออกเป็นสองส่วน: ผลรวมของการสังเกตที่น้อยกว่าหรือเท่ากับคือ p %p%p%ของผลรวมการสังเกตและผลรวมของการสังเกตที่มากขึ้นแสดงถึงส่วนที่เหลือของผลรวมนี้(100p)%

เมื่อไหร่ที่จะใช้สิ่งเหล่านี้เป็นมาตรการในการระบุตำแหน่งที่ตั้งแทนที่จะเป็นค่ามัธยฐานทั่วไปหรือควอนไทล์อื่น ๆ สถานการณ์ที่เป็นไปได้อย่างหนึ่งคือรายได้ของครัวเรือนจะได้รับในกระดาษนั้น:

มันสามารถได้มาจากคำนิยามนี้ว่าอยู่ตรงกลางสามารถใช้เป็นลักษณะที่เหมาะสมของระดับรายได้เนื่องจากครัวเรือนที่มีรายได้ต่ำหรือเท่ากับตรงกลางได้รับครึ่งหนึ่งของรายได้ทั้งหมดในกลุ่มตัวอย่างที่มีรายได้สูงกว่า กว่าคนกลางที่ได้รับอีกครึ่งหนึ่ง

ในกรณีนี้รายได้เฉลี่ยของครัวเรือนพบว่าเป็น CZK 117,497 (นั่นคือครึ่งหนึ่งของครัวเรือนที่ได้รับมากกว่านี้และครึ่งหนึ่งที่ได้รับด้านบน) เมื่อเทียบกับรายได้เฉลี่ยของครัวเรือนที่ 133,930 เหรียญเช็ก (ครัวเรือนที่มีรายได้สูงกว่าตัวเลขนี้ รายได้ทั้งหมด). โปรดทราบว่าการเปรียบเทียบนี้ไม่ได้สะท้อนถึงความเบ้ของรายได้ของครัวเรือนหรือแม้กระทั่งความไม่เท่าเทียมกัน: แม้ว่ารายได้ของครัวเรือนจะกระจายอย่างสม่ำเสมอ แต่ค่ามัธยฐานจะยังคงอยู่เหนือค่ามัธยฐาน เท่าที่ฉันเข้าใจคำจำกัดความค่ามัธยฐานจะเท่ากับค่ามัธยฐานหากครัวเรือนทั้งหมดได้รับรายได้เท่ากัน

ดังนั้นมีเหตุผลพิเศษที่จะชอบอยู่ตรงกลางในกรณีนี้หรืออย่างน้อยก็ใช้เป็นมาตรการเสริม? การเปรียบเทียบระหว่างค่ามัธยฐานกับค่ามัธยฐานบอกเราอย่างไร ดูเหมือนว่าจะไม่อยู่ตรงกลางสามารถเปรียบเทียบได้โดยตรงกับมาตรการอื่น ๆ ของแนวโน้มกลางสำหรับเหตุผลที่ฉันเพิ่งสังเกต มีสถานการณ์อื่น ๆ ที่ใช้สื่อ / tantile กันอย่างแพร่หลายหรือเห็นว่าเป็นข้อมูลโดยเฉพาะอย่างยิ่ง? ตัวอย่างที่เป็นประโยชน์เกี่ยวกับสถานที่ที่พวกเขาถูกนำมาใช้พร้อมกับตัวอย่างงานวิจัยจะได้รับการต้อนรับอย่างมากและความคิดที่เป็นธรรมชาติเกี่ยวกับบริบทที่กว้างขึ้นซึ่งพวกเขาอาจพิสูจน์ว่ามีประโยชน์จะดียิ่งขึ้น

ต้องมีผลรวมและผลรวมย่อยที่จะมีความหมาย - สิ่งที่ดูเหมือนว่าเกี่ยวข้องกับเงินและวิธีการกระจาย "พาย" - แต่การกระทำของการเพิ่มมีความหมายสำหรับปริมาณบางอย่างเท่านั้น สำหรับคุณสมบัติที่เข้มข้นมากกว่าคุณสมบัติที่ครอบคลุมเช่นความหนาแน่นหรืออุณหภูมิการรวมประเภทใด ๆ จะไม่มีความหมายทางร่างกาย สำหรับฉันแล้วฉันคิดว่าคุณสมบัติที่กว้างขวางเป็นสิ่งจำเป็น แต่ไม่เพียงพอสำหรับ tantiles ที่จะเป็นประโยชน์เนื่องจากฉันสามารถจินตนาการนักวิเคราะห์การจัดส่งสินค้าที่สนใจว่าน้ำหนักของการขนส่งสินค้าถูกตัดเพื่อให้ 50% ของสินค้าทั้งหมด (โดยน้ำหนัก) คือ ดำเนินการในน้ำหนักที่มากกว่าหรือสูงกว่า แต่ฉันไม่สามารถจินตนาการนักนิเวศวิทยาที่สนใจในสิ่งที่ความยาวของ newt เป็นเช่นนั้น 50% ของความยาวทั้งหมดของ newts ทั้งหมดมีส่วนร่วมโดย newts ของความยาวนั้นหรือมากกว่า


3
@NickCox เท่าที่ฉันเข้าใจมันค่ามัธยฐานให้ค่าตัดที่พูดหยาบ (ฉันไม่สนใจปัญหาความสัมพันธ์อย่างสมบูรณ์) ครึ่งหนึ่งของครัวเรือนได้รับมากกว่าการตัดและครึ่งหนึ่งของครัวเรือนได้รับน้อยกว่า อยู่ตรงกลางให้ตัดออกที่แตกต่างกันเช่นที่รายได้รวมของครัวเรือนที่ได้รับมากกว่าการตัดถือว่า 50% ของรายได้ทั้งหมดในขณะที่รายได้รวมของครัวเรือนที่ได้รับน้อยกว่าการตัดถือว่า 50% ของรายได้ทั้งหมด
Silverfish

2
หมวกปลาย: ฉันอยากรู้อยากเห็นจากเรื่องนี้หลังจากความคิดเห็นโดย @ttnphns จากคำถามก่อนหน้านี้ของฉัน ; หมายถึง (คณิตศาสตร์, เรขาคณิต, ฮาร์โมนิ, ขับเคลื่อน, ชี้แจง, combinatorial, ฯลฯ ) เป็น "ค่าเฉลี่ยการวิเคราะห์" ค่ามัธยฐาน, ควอไทล์, tantiles คือ "ค่าเฉลี่ยตำแหน่ง"
Silverfish

4
ขอบคุณ; ฉันอ่านผิดและชื่นชมการแก้ไข ฉันพูดใหม่จาก "ผลรวมของการสังเกต" ถึง "ผลรวมของค่า" เนื่องจาก "ผลรวมของการสังเกต" ใกล้เกินไปกับ "จำนวนการสังเกต" สำหรับฉัน หรือบางทีฉันถึงข้ออ้าง .... ควรมีการเชื่อมต่อกับเส้นโค้ง Lorenz การวัดนั้นมีประโยชน์เฉพาะในกรณีที่ตัวแปรที่เกี่ยวข้องนั้นเป็นสารเติมแต่งหรือแบบกว้าง เซอร์เดวิดคอคส์มักจะเน้นถึงความสำคัญของตัวแปรที่มีอย่างกว้างขวาง ดังนั้นจึงสมเหตุสมผลที่จะต้องพิจารณารายได้รวมปริมาณน้ำฝนทั้งหมด แต่ไม่รวมรายได้จากบันทึกหรืออุณหภูมิทั้งหมด
Nick Cox

2
@ NickCox ฉันคิดว่าการเพิ่มความสามารถเป็นจุดที่ยอดเยี่ยม (และการอ้างอิงที่แนะนำของคุณจะได้รับการปรับปรุงในความคิดของฉันด้วย) แม้ว่าฉันจะเห็นว่าคุณสมบัติที่กว้างขวางเป็นสิ่งจำเป็น แต่ไม่เพียงพอสำหรับ tantiles ที่จะเป็นประโยชน์ ดูเหมือนว่าเป็นไปได้ที่เราอาจสนใจเช่นน้ำหนักของสินค้าที่ขนส่งคือการตัดเพื่อให้ 50% ของสินค้าทั้งหมด (โดยน้ำหนัก) บรรทุกในน้ำหนักที่สูงกว่านั้น แต่ฉันไม่สามารถจินตนาการได้ว่าจะสนใจในสิ่งที่ความยาวของ newt นั้นคือ 50% ของความยาวทั้งหมดของ newts ทั้งหมดได้รับการสนับสนุนจาก newts ของความยาวนั้นหรือมากกว่า
Silverfish

1
ฉันเห็นด้วยในทางปฏิบัติ แต่ฉันไม่คิดว่าหลักการจะได้รับผลกระทบ คำตอบของ "แต่นั่นจะไม่น่าสนใจหรือมีประโยชน์" ไม่จำเป็นต้องแสดงหลักการทางคณิตศาสตร์หรือสถิติเสมอไป นอกจากนี้ยังมีขอบเขตสำหรับ "อย่าทำเช่นนั้น!"
Nick Cox

คำตอบ:


3

p=0.5Xf(x)μ=EXμ=xf(x)dx

G(t)=txf(x)dx
tG(t)=μ/2

การตีความนี้ถูกต้องหรือไม่ นี่คือสิ่งที่ตั้งใจหรือไม่

เพื่อกลับไปยังคำถามเดิมในบริบทของการกระจายรายได้ tantile คือมูลค่าของรายได้ซึ่งครึ่งหนึ่งของรายได้รวมนั้นสำหรับคนที่มีรายได้สูงกว่านั้นและครึ่งหนึ่งของรายได้รวมสำหรับคนที่มีรายได้ต่ำกว่านั้น

EDIT

G(t)ด้านบน) เหล่านี้เกี่ยวข้องกับมาตรการความเสี่ยงต่าง ๆ ที่ใช้ในเอกสารทางการเงินบางอย่างเช่น "การขาดแคลนที่คาดหวัง"

G(t)tและยังเป็นที่รู้จักกันในชื่อ มันจะน่าสนใจที่จะดูการเชื่อมต่อเหล่านี้ ...

อีกคำที่ใช้สำหรับแนวคิดนี้คือ "การคาดหวังบางส่วน" ดูตัวอย่าง/math/1080530/the-partial-expectation-mathbbex-xk-for-an-alpha-stable-distributed-r และใช้ google!

X>0

Fk(x)=1EXk0xtkf(t)dt
kG(t)=μF1(t)F1FF0
{(u,L(u))}={(u,v):u=F(x),v=F1(x);x0}


1
ขอบคุณสำหรับการเพิ่ม - ฉันจะต้องอ่านบางอย่างโดยดูจากมัน!
Silverfish
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.