ตัวอย่างชีวิตจริงของการแจกแจงที่มีความเบ้เชิงลบ


20

โดยได้รับแรงบันดาลใจจาก " ตัวอย่างชีวิตจริงของการแจกแจงร่วมกัน " ฉันสงสัยว่าตัวอย่างแบบสอนที่ผู้คนใช้เพื่อแสดงความเบ้เชิงลบคืออะไร มีตัวอย่างมากมาย "บัญญัติ" ของการแจกแจงแบบสมมาตรหรือปกติที่ใช้ในการสอน - แม้ว่าคนที่ชอบความสูงและน้ำหนักจะไม่รอดจากการตรวจสอบทางชีวภาพอย่างใกล้ชิด! ความดันโลหิตอาจสูงกว่าปกติ ฉันชอบข้อผิดพลาดในการวัดทางดาราศาสตร์ - ที่น่าสนใจในประวัติศาสตร์พวกมันไม่น่าจะโกหกในทิศทางเดียวมากกว่าอีกทิศทางหนึ่งโดยมีข้อผิดพลาดเล็ก ๆ น่าจะมีขนาดใหญ่กว่ามาก

ตัวอย่างการสอนทั่วไปสำหรับความเบ้เชิงบวก ได้แก่ รายได้ของผู้คน ไมล์สะสมสำหรับรถยนต์มือสองเพื่อขาย เวลาปฏิกิริยาในการทดลองทางจิตวิทยา ราคาบ้าน; จำนวนการเคลมอุบัติเหตุจากลูกค้าประกัน จำนวนเด็กในครอบครัว ความมีเหตุผลทางกายภาพของพวกเขามักจะเกิดจากการถูก จำกัด ที่ด้านล่าง (โดยปกติเป็นศูนย์), ด้วยค่าต่ำที่เป็นไปได้, แม้เป็นเรื่องธรรมดา, แต่มีขนาดใหญ่มาก

สำหรับความเบ้เชิงลบฉันพบว่ามันยากที่จะให้ตัวอย่างที่ชัดเจนและชัดเจนที่ผู้ชมอายุน้อย (schoolers สูง) สามารถเข้าใจได้อย่างสังหรณ์ใจบางทีอาจเป็นเพราะการแจกแจงชีวิตจริงน้อยลงมีขอบเขตบนที่ชัดเจน ตัวอย่างที่ไม่ดีที่ฉันสอนที่โรงเรียนคือ "จำนวนนิ้ว" ชาวบ้านส่วนใหญ่มีสิบ แต่บางคนสูญเสียหนึ่งอุบัติเหตุหรือมากกว่านั้น ผลที่สุดคือ "99% ของผู้คนมีจำนวนนิ้วที่สูงกว่าค่าเฉลี่ย"! Polydactylyทำให้ปัญหาซับซ้อนเนื่องจากสิบไม่ใช่ขอบเขตบนที่เข้มงวด เนื่องจากทั้งนิ้วที่หายไปและนิ้วเสริมเป็นเหตุการณ์ที่หายากมันอาจไม่ชัดเจนสำหรับนักเรียนที่มีผลกระทบมากกว่า

ผมมักจะใช้การกระจายทวินามสูงพีแต่นักเรียนมักจะพบว่า "จำนวนองค์ประกอบที่น่าพอใจในแบตช์นั้นเบ้ในทางลบ" น้อยกว่าความจริงที่ว่า "จำนวนองค์ประกอบที่ผิดพลาดในแบตช์นั้นเบ้เชิงบวก" (หนังสือเป็นชุดรูปแบบอุตสาหกรรมฉันชอบไข่ที่ร้าวและไม่บุบสลายในกล่องสิบสอง) บางทีนักเรียนอาจรู้สึกว่า "ความสำเร็จ" น่าจะหายากp

อีกทางเลือกหนึ่งคือการชี้ให้เห็นว่าถ้าเชิงบวกเอียงแล้วนั้นเอียงเชิงลบ แต่วางสิ่งนี้ไว้ในบริบทที่ใช้งานได้จริง ในขณะที่มีประโยชน์ในการสอนผลกระทบของการแปลงข้อมูลดูเหมือนว่าควรให้ตัวอย่างที่ชัดเจนก่อน ฉันต้องการสิ่งที่ดูเหมือนไม่ประดิษฐ์ซึ่งความเบ้เชิงลบค่อนข้างคลุมเครือและประสบการณ์ชีวิตของนักเรียนควรให้พวกเขาตระหนักถึงรูปร่างของการแจกแจง- XXX


4
ไม่เป็นที่ชัดเจนว่าการปฏิเสธตัวแปรจะเป็น "ความล้มเหลวในการสอน" เนื่องจากมีตัวเลือกในการเพิ่มค่าคงที่โดยไม่เปลี่ยนรูปร่างของการกระจาย การแจกแจงแบบเบ้จำนวนมากเกี่ยวข้องกับสัดส่วนเช่นและสัดส่วนเสริมมักจะเป็นธรรมชาติและง่ายต่อการตีความเป็นสัดส่วนเดิม แม้จะมีราคาบ้านค่าที่คือราคาบ้านสูงสุดในพื้นที่อาจเป็นที่สนใจและไม่ยากที่จะเข้าใจ พิจารณาการใช้บันทึกและการแปลงพลังงานเชิงลบเพื่อสร้างความเบ้เชิงลบ 1 - X X C - X CX1XXCX
whuber

2
ฉันยอมรับว่าในกรณีของราคาบ้านจะได้รับการวางแผนเล็กน้อย แต่จะไม่: มันจะเป็น "จำนวนบ้านที่คุณสามารถซื้อได้ต่อดอลลาร์" ฉันสงสัยว่าในพื้นที่ใด ๆ ที่เป็นเนื้อเดียวกันอย่างสมเหตุสมผล ตัวอย่างดังกล่าวสามารถสอนบทเรียนที่ลึกซึ้งยิ่งขึ้นว่าความเบ้เป็นหน้าที่ของวิธีที่เราแสดงข้อมูล 1 / X-X1/X
whuber

3
@whuber มันจะไม่ถูกวางแผนเลย ราคาสูงสุดและต่ำสุดที่อาจเกิดขึ้นในตลาดเกิดขึ้นตามธรรมชาติเช่นเดียวกับที่สะท้อนการประเมินที่แตกต่างกันโดยผู้เข้าร่วมตลาด ในหมู่ผู้ซื้อมีหนึ่งที่น่าจะจ่ายราคาสูงสุดสำหรับบ้านที่กำหนด และในหมู่ผู้ขายมีหนึ่งที่จะยอมรับราคาต่ำสุดเป็นไปได้ แต่ข้อมูลนี้ไม่ใช่ข้อมูลสาธารณะและราคาธุรกรรมที่เกิดขึ้นจริงที่เกิดขึ้นจริงจะได้รับผลกระทบจากการมีข้อมูลที่ไม่สมบูรณ์ (CONT'D)
Alecos Papadopoulos

1
ดำเนินการต่อ ... บทความต่อไปนี้ของ Kumbhakar และ Parmeter (2010) บอกตรง ๆ ว่ารุ่นนี้ (อนุญาตให้มีความสมมาตร) และมีแอปพลิเคชันในตลาดบ้าน: link.springer.com/article/10.1007/s00181-009 -0292-8 # page-1
Alecos Papadopoulos

3
อายุที่เสียชีวิตนั้นเบ้ไปทางลบในประเทศที่พัฒนาแล้ว
Nick Cox

คำตอบ:


3

ในสหราชอาณาจักรราคาหนังสือ มี "ราคาขายปลีกที่แนะนำ" ซึ่งโดยทั่วไปจะเป็นราคาที่เป็นกิริยาช่วยและแทบไม่มีที่ไหนที่คุณจะต้องจ่ายมากขึ้น แต่ร้านค้าบางแห่งจะลดราคาและบางร้านจะลดราคาอย่างมาก

นอกจากนี้อายุที่เกษียณ คนส่วนใหญ่เกษียณอายุที่ 65-68 ซึ่งเป็นเมื่อบำนาญของรัฐเริ่มเข้ามามีคนน้อยมากที่ทำงานได้นานขึ้น แต่บางคนออกจากตำแหน่งในช่วงอายุ 50 ปีและค่อนข้างมากในช่วงต้นยุค 60

จากนั้นก็มีจำนวน GCSEs ที่ผู้คนได้รับ เด็กส่วนใหญ่เข้าได้ 8-10 คนและรับ 8-10 คน จำนวนน้อยทำได้มากขึ้น เด็กบางคนไม่ผ่านการทดสอบทั้งหมดดังนั้นจึงเพิ่มขึ้นอย่างต่อเนื่องจาก 0 ถึง 7


1
นี่อาจต้องการคำอธิบายว่า GCSE เป็นการสอบในโรงเรียนมัธยมของประเทศอังกฤษและระบบที่เกี่ยวข้องบางอย่างซึ่งมักใช้เวลาประมาณ 16 ปีจำนวนวิชาที่เรียนเช่นคณิตศาสตร์มักเป็นวิชาเดียว
Nick Cox

18

Nick Cox ให้ความเห็นอย่างถูกต้องว่า "อายุตอนตายนั้นเบ้ไปทางลบในประเทศที่พัฒนาแล้ว" ซึ่งฉันคิดว่าเป็นตัวอย่างที่ดี

ฉันพบว่าตัวเลขที่สะดวกที่สุดที่ฉันสามารถวางมือมาจากสำนักสถิติแห่งออสเตรเลีย ( โดยเฉพาะฉันใช้แผ่นชีท Excel นี้ ) เนื่องจากถังขยะอายุของพวกเขาสูงถึง 100 ปีและชายชาวออสเตรเลียที่เก่าแก่ที่สุดคือ 111ดังนั้นฉันจึง รู้สึกสะดวกสบายในการตัดถังสุดท้ายที่ 110 ปี หน่วยงานสถิติแห่งชาติอื่น ๆ มักจะหยุดที่ 95 ซึ่งทำให้ช่องเก็บสุดท้ายกว้างไม่สบาย ฮิสโตแกรมที่ได้แสดงให้เห็นถึงความเบ้เชิงลบที่ชัดเจนมากรวมถึงคุณสมบัติที่น่าสนใจอื่น ๆ เช่นอัตราการตายสูงสุดในหมู่เด็กเล็กซึ่งจะเหมาะกับการอภิปรายและตีความในชั้นเรียน

อายุที่เสียชีวิตของชายชาวออสเตรเลียในปี 2555

รหัส R พร้อมด้วยข้อมูลดิบต่อไปนี้HistogramTools แพคเกจพิสูจน์แล้วว่ามีประโยชน์มากสำหรับการวางแผนตามข้อมูลรวม! ขอบคุณคำถาม StackOverflowสำหรับการตั้งค่าสถานะ

library(HistogramTools)

deathCounts <- c(565, 116, 69, 78, 319, 501, 633, 655, 848, 1226, 1633, 2459, 3375, 4669, 6152, 7436, 9526, 12619, 12455, 7113, 2104, 241)
ageBreaks <- c(0, 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110)

myhist <- PreBinnedHistogram(
    breaks = ageBreaks,
    counts = deathCounts,
    xname = "Age at Death of Australian Males, 2012")
plot(myhist)

2
สิ่งที่เกี่ยวข้องกับโพสต์นี้ฉันได้ยินมาว่าวัยเกษียณมีความเบ้เชิงลบ: คนส่วนใหญ่เกษียณอายุในช่วงอายุเล็กน้อย (เช่น 65 หรือ 67 ในหลายประเทศ) แต่บางคน (พูดว่าคนงานในเหมืองถ่านหิน) เกษียณอายุก่อนหน้านี้มาก
Christoph Hanck

อายุเมื่อถึงตายเป็นไปตามการกระจายที่รู้จักกันดีหรือไม่?
StubbornAtom

11

นี่คือผลลัพธ์สำหรับนักกีฬาสี่สิบคนที่ประสบความสำเร็จในการกระโดดอย่างถูกกฎหมายในรอบคัดเลือกของการกระโดดไกลชายโอลิมปิก 2012 ที่นำเสนอในพล็อตความหนาแน่นเคอร์เนลที่มีพล็อตพรมใต้

ผลการแข่งขันรอบคัดเลือกชายโอลิมปิก 2012 ของลอนดอนกระโดดไกล

ดูเหมือนจะง่ายกว่าการอยู่หลังกลุ่มคู่แข่งหลักมากกว่ามาตรวัดหนึ่งเมตรซึ่งจะอธิบายความเบ้เชิงลบได้ง่ายกว่ามาก

ฉันสงสัยว่าการรวมกลุ่มที่ปลายบนสุดนั้นเป็นเพราะนักกีฬากำหนดเป้าหมายที่มีคุณสมบัติ (ซึ่งต้องมีการจบสิบสองอันดับแรกหรือผลที่ 8.10 เมตรหรือสูงกว่า) แทนที่จะบรรลุระยะทางที่ไกลที่สุด ความจริงที่ว่าผลลัพธ์สองอันดับแรกคือ 8.11 เมตรซึ่งอยู่เหนือเครื่องหมายการคัดเลือกอัตโนมัตินั้นเป็นสิ่งที่ชี้นำอย่างยิ่งเช่นเดียวกับวิธีที่การชนะเหรียญในรอบชิงชนะเลิศนั้นมีความยาวและกระจายออกไปมากขึ้นที่ 8.31, 8.16 และ 8.12 ผลลัพธ์ในรอบชิงชนะเลิศมีความเบี่ยงเบนเล็กน้อยไม่สำคัญและไม่เชิงลบ

สำหรับการเปรียบเทียบผลการค้นหาสำหรับการแข่งขันกีฬาโอลิมปิกสัตตกรีฑาที่ 1988 โซลที่มีอยู่ในชุดข้อมูลในแพคเกจการheptathlon R HSAURในการแข่งขันนั้นไม่มีรอบคัดเลือก แต่แต่ละเหตุการณ์นั้นให้คะแนนในการจำแนกขั้นสุดท้าย คู่แข่งหญิงแสดงให้เห็นความเบ้เชิงลบที่เด่นชัดในผลการกระโดดสูงและความเบ้เชิงลบในการกระโดดไกล สิ่งที่น่าสนใจนี้ไม่ได้จำลองแบบในการขว้างปาเหตุการณ์ (shot and javelin) แม้ว่าพวกเขาจะเป็นเหตุการณ์ที่มีจำนวนสูงกว่าสอดคล้องกับผลลัพธ์ที่ดีกว่า คะแนนคะแนนสุดท้ายก็ค่อนข้างเบ้

ข้อมูลและรหัส

require(moments)
require(ggplot2)

sourceAddress <- "http://www.olympic.org/olympic-results/london-2012/athletics/long-jump-m"

longjump.df <- read.csv(header=TRUE, sep=",", text="
rank,name,country,distance
1,Mauro Vinicius DA SILVA,BRA,8.11 
2,Marquise GOODWIN,USA,8.11
3,Aleksandr MENKOV,RUS,8.09
4,Greg RUTHERFORD,GBR,8.08
5,Christopher TOMLINSON,GBR,8.06
6,Michel TORNEUS,SWE,8.03
7,Godfrey Khotso MOKOENA,RSA,8.02
8,Will CLAYE,USA,7.99
9,Mitchell WATT,AUS,7.99,
10,Tyrone SMITH,BER,7.97,
11,Henry FRAYNE,AUS,7.95,
12,Sebastian BAYER,GER,7.92,
13,Christian REIF,GER,7.92,
14,Eusebio CACERES,ESP,7.92,
15,Aleksandr PETROV,RUS,7.89,
16,Sergey MORGUNOV,RUS,7.87,
17,Mohammad ARZANDEH,IRI,7.84,
18,Ignisious GAISAH,GHA,7.79,
19,Damar FORBES,JAM,7.79,
20,Jinzhe LI,CHN,7.77,
21,Raymond HIGGS,BAH,7.76,
22,Alyn CAMARA,GER,7.72,
23,Salim SDIRI,FRA,7.71,
24,Ndiss Kaba BADJI,SEN,7.66,
25,Arsen SARGSYAN,ARM,7.62,
26,Povilas MYKOLAITIS,LTU,7.61,
27,Stanley GBAGBEKE,NGR,7.59,
28,Marcos CHUVA,POR,7.55,
29,Louis TSATOUMAS,GRE,7.53,
30,Stepan WAGNER,CZE,7.50,
31,Viktor KUZNYETSOV,UKR,7.50,
32,Luis RIVERA,MEX,7.42,
33,Ching-Hsuan LIN,TPE,7.38,
33,Supanara SUKHASVASTI N A,THA,7.38,
35,Boleslav SKHIRTLADZE,GEO,7.26,
36,Xiaoyi ZHANG,CHN,7.25,
37,Mohamed Fathalla DIFALLAH,EGY,7.08,
38,Roman NOVOTNY,CZE,6.96,
39,George KITCHENS,USA,6.84,
40,Vardan PAHLEVANYAN,ARM,6.55,
NA,Luis MELIZ,ESP,NA,
NA,Irving SALADINO,PAN,NA")

roundedSkew <- signif(skewness(longjump.df$distance, na.rm=TRUE), 3)

ggplot(longjump.df, aes(x=distance)) + 
    xlab("Distance in metres") +
    ggtitle("London 2012 Men's Long Jump qualifying round results") +
    geom_rug(size=0.8) + 
    geom_density(fill="steelblue") +
    annotate("text", x=7.375, y=0.0625, colour="white", label=paste("Source:", sourceAddress), size=3) +
    annotate("rect", xmin = 6.25, xmax = 7.25, ymin = 0.5, ymax = 1.125, fill="white") +
    annotate("text", x=6.75, y=1, colour="black", label="Best jump in up to 3 attempts") +
    annotate("text", x=6.75, y=.875, colour="black", label="42 athletes competed") +
    annotate("text", x=6.75, y=.75, colour="black", label="2 athletes had no legal jump") +
    annotate("text", x=6.75, y=.625, colour="black", label=paste("Skewness = ", roundedSkew))


# Results of the top twelve who qualified for the Final were closer to symmetric
skewness(longjump.df$distance[1:12])
# -0.1248782

# Results in the Final (some had 3 jumps, others 6) were only slightly negatively skewed
skewness(c(8.31, 8.16, 8.12, 8.11, 8.10, 8.07, 8.01, 7.93, 7.85, 7.80, 7.78, 7.70))
# -0.08578357

# Compare to Seoul 1988 Heptathlon
require(HSAUR)
skewness(heptathlon)

11

คะแนนในการทดสอบง่าย ๆ หรือมิฉะนั้นคะแนนในการทดสอบที่นักเรียนมีแรงจูงใจโดยเฉพาะอย่างยิ่งมีแนวโน้มที่จะเหลือเอียง

เป็นผลให้คะแนน SAT / ACT ของนักเรียนที่เข้าเรียนที่ต้องการหลังจากวิทยาลัย (และยิ่งกว่านั้น GPAs ของพวกเขา) มีแนวโน้มที่จะเอียง มีมากมายของตัวอย่างที่เป็น collegeapps.about.com เช่นพล็อตของมหาวิทยาลัยชิคาโก SAT / ACT และเกรดเฉลี่ยอยู่ที่นี่

ในทำนองเดียวกันเกรดเฉลี่ยของผู้สำเร็จการศึกษามักจะเอียงซ้ายเช่นฮิสโตแกรมด้านล่างของเกรดเฉลี่ยของผู้สำเร็จการศึกษาสีขาวและสีดำที่มหาวิทยาลัยเพื่อผลกำไรที่นำมาจากรูปที่ 5 ของ Gramling, Tim "คุณสมบัติของนักเรียนห้าแบบอย่างไรที่ทำนายอัตราการสำเร็จการศึกษาจากมหาวิทยาลัยที่แสวงหาผลกำไรได้อย่างแม่นยำ " SAGE Open 3.3 (2013): 2158244013497026

ฮิสโตแกรมของเกรดเฉลี่ยแสดงความเอียงเชิงลบ

(ไม่ยากที่จะหาตัวอย่างอื่นที่คล้ายคลึงกัน)


2
สำหรับชั้นเรียนสถิติเบื้องต้นฉันคิดว่าตัวอย่างนี้ใช้งานได้ดีในชั้นเรียน - เป็นสิ่งที่นักเรียนน่าจะมีประสบการณ์ชีวิตจริงสามารถใช้เหตุผลได้อย่างสังหรณ์ใจและสามารถยืนยันกับชุดข้อมูลที่มีอยู่อย่างกว้างขวาง
Silverfish

9

ในการวิเคราะห์ Stochastic Frontier Analysis และโดยเฉพาะอย่างยิ่งในการให้ความสนใจเบื้องต้นในอดีตการผลิตฟังก์ชั่นการผลิตของ บริษัท / หน่วยการผลิตโดยทั่วไปจะถูกระบุไว้ในแบบสุ่ม

Q=(x)+ยู-W

Q(x)xยูWเนื่องจากเหตุผลที่นักเศรษฐศาสตร์อาจไม่ทราบ แต่เขาสามารถวัดผ่านการตั้งค่านี้ ตัวแปรสุ่มนี้มักจะถือว่าเป็นไปตามการกระจายครึ่งปกติหรือเลขชี้กำลัง สมมติว่าครึ่งปกติ (ด้วยเหตุผล) เรามี

ยู~ยังไม่มีข้อความ(0,σยู2),W~Hยังไม่มีข้อความ(2πσ2,(1-2π)σ22)

σ2

ε=ยู-W

ε(ε)=2s2φ(ε/s2)Φ((-σ2σยู)(ε/s2)),s22=σยู2+σ22

0s2(-σ2σยู)φΦσยู=1,σ2=3ป้อนคำอธิบายรูปภาพที่นี่

ดังนั้นความเบ้ที่เป็นลบคือฉันว่าแบบจำลองที่เป็นธรรมชาติที่สุดของความพยายามของเผ่าพันธุ์มนุษย์: เบี่ยงเบนไปจากอุดมคติในจินตนาการของมัน - ในกรณีส่วนใหญ่ที่ล้าหลังอยู่ข้างหลัง (ส่วนลบของความหนาแน่น) ในขณะที่ค่อนข้างน้อย เหนือขีด จำกัด การรับรู้ของมัน (ส่วนบวกของความหนาแน่น) นักเรียนสามารถจำลองตัวเองเป็นฟังก์ชั่นการผลิตได้ เป็นการตรงไปตรงมาเพื่อทำแผนที่การรบกวนสมมาตรและข้อผิดพลาดด้านเดียวกับแง่มุมของชีวิตจริง ฉันไม่สามารถจินตนาการได้ว่ามันจะหยั่งรู้ได้อย่างไร


1
คำตอบนี้ดูเหมือนว่าจะสะท้อนถึงข้อเสนอแนะของ GPA สำหรับเกรดเฉลี่ย พฤติกรรมมนุษย์ที่มีแรงจูงใจสูงมุ่งเป้าไปที่อุดมคติที่เข้าใจยากแน่นอนเหมาะกับสถานการณ์นั้น! ประสิทธิภาพโดยทั่วไปเป็นตัวอย่างที่ดี
Nick Stauner

2
@Nick Stauner จุดสำคัญที่นี่คือเราพิจารณาว่า "การลบเป้าหมายจริง" ลงนามไม่ใช่ "ระยะทาง" ในค่าสัมบูรณ์ เราเก็บเครื่องหมายเพื่อที่จะทราบว่าเราอยู่เหนือหรือต่ำกว่าเป้าหมาย ปรีชาที่นี่คือตรงตามที่คุณเขียนว่าพฤติกรรม "แรงจูงใจสูง" จะผลัก "จริง" ใกล้กับ "เป้าหมาย" การสร้างความไม่สมดุล
Alecos Papadopoulos

1
@NickStauner แท้จริงแล้วโพสต์ของ Silverfish ที่มีคุณสมบัติในการกระโดดไกลมีความสัมพันธ์กับ 'พฤติกรรมที่มีแรงจูงใจสูง' (เมื่อพิจารณาถึงขีด จำกัด ของสิ่งที่มนุษย์สามารถทำได้ในปัจจุบันในรูปแบบของ 'อุดมคติที่เข้าใจยาก')
Glen_b

6

ความเบ้เชิงลบเป็นเรื่องปกติในอุทกวิทยาอุทกภัย ด้านล่างเป็นตัวอย่างของเส้นโค้งความถี่น้ำท่วม (South Creek ที่ Mulgoa Rd, lat -33.8783, lon 150.7683) ซึ่งฉันได้นำมาจาก 'Australian Rainfall and Runoff' (ARR) คำแนะนำเกี่ยวกับการประมาณน้ำท่วมที่พัฒนาโดยวิศวกรประเทศออสเตรเลีย

มีความคิดเห็นใน ARR:

ด้วยความเบ้เชิงลบซึ่งเป็นเรื่องปกติกับค่าลอการิทึมของอุทกภัยในออสเตรเลียการกระจายของบันทึกเพียร์สันที่ III มีขอบเขตสูงสุด สิ่งนี้ให้ขีด จำกัด สูงสุดสำหรับน้ำท่วมที่สามารถดึงออกมาจากการแจกจ่าย ในบางกรณีสิ่งนี้สามารถทำให้เกิดปัญหาในการประเมินน้ำท่วมของ AEP ต่ำ แต่มักจะไม่มีปัญหาในทางปฏิบัติ [สกัดจากปริมาณน้ำฝนและน้ำท่าของออสเตรเลีย - เล่ม 1 เล่ม IV 2]

บ่อยครั้งที่น้ำท่วมในบางพื้นที่ถือว่ามีขอบเขตบนที่เรียกว่า 'Probable Maximum Flood' (PMF) มีวิธีมาตรฐานในการคำนวณ PMF

ป้อนคำอธิบายรูปภาพที่นี่


7
+1 ตัวอย่างนี้แสดงให้เห็นว่าคำถามที่เกิดขึ้นจริงนั้นเป็นอย่างไร: เมื่อคุณวัดน้ำท่วมในแง่ของการปล่อยสูงสุดพวกเขาจะเบ้ในเชิงบวกแต่วัดจากการปล่อยบันทึก ในทำนองเดียวกันตัวแปรเชิงบวกใด ๆสามารถแสดงอีกครั้งในวิธีง่ายๆที่บิดเบือนการกระจายของมันในเชิงลบ (เพียงโดยการใช้พารามิเตอร์ Box-Cox เชิงลบที่เหมาะสม) ทุกอย่างมาถึงสิ่งที่มีความหมายโดย "เข้าใจง่าย" ฉันคิดว่า - แต่นั่นเป็นคำถามเกี่ยวกับนักเรียนไม่ใช่เกี่ยวกับสถิติ
whuber

5

การเปลี่ยนแปลงราคาสินทรัพย์ (ผลตอบแทน) โดยทั่วไปจะมีความเบ้เชิงลบ - ราคาขนาดเล็กจำนวนมากเพิ่มขึ้นพร้อมกับราคาลดลงมาก ดูเหมือนว่าจะมีการเอียงของสินทรัพย์เกือบทุกประเภท: ราคาหุ้นราคาสินค้าโภคภัณฑ์ ฯลฯ ความผันผวนเชิงลบสามารถสังเกตได้จากการเปลี่ยนแปลงราคารายเดือน แต่จะเห็นได้ชัดมากขึ้นเมื่อคุณเริ่มดูการเปลี่ยนแปลงราคารายวันหรือรายชั่วโมง ฉันคิดว่านี่จะเป็นตัวอย่างที่ดีเพราะคุณสามารถแสดงผลกระทบของความถี่ในการเอียง

รายละเอียดเพิ่มเติม: http://www.fusioninvesting.com/2010/09/what-is-skew-and-why-is-it-important/


ฉันชอบตัวอย่างนี้มาก! มีวิธีการอธิบายที่เข้าใจง่ายหรือไม่ - โดยพื้นฐานแล้ว "การกระแทก downside มีแนวโน้มมากขึ้น (หรืออย่างน้อยก็น่าจะรุนแรงกว่า) มากกว่าการกระแทกคว่ำ"
Silverfish

2
@ Silververfish ฉันจะพูดว่ามันเป็นผลการตลาดเชิงลบที่รุนแรงมีแนวโน้มมากกว่าผลการตลาดในเชิงบวกที่รุนแรง ตลาดยังมีความผันผวนไม่สมมาตร ความผันผวนของตลาดโดยทั่วไปจะเพิ่มขึ้นตามผลตอบแทนติดลบมากกว่าผลตอบแทนที่เป็นบวก นี่มักจะเป็นแบบจำลองกับรุ่น Garch เช่น GJR-Garch (ดูรายการ Arch วิกิพีเดีย)
John

3
ฉันยังเห็นคำอธิบายว่าข่าวร้ายถูกปล่อยออกมาเป็นกลุ่ม ฉันไม่ได้ใช้ GJR-GARCH ฉันพยายามใช้ท่าทาง Brownian motion (Mandelbrot) เพื่อจำลองแบบไม่สมมาตร แต่ก็ไม่สามารถทำให้มันทำงานได้
wcampbell

4
นี่เป็นวิธีที่ง่ายที่สุด ตัวอย่างเช่นฉันเพิ่งใช้ชุดข้อมูลของผลตอบแทนรายวันจากดัชนีหุ้น 31 แห่ง มากกว่าครึ่งของพวกเขามีความเบ้เป็นบวก (ใช้ความเบ้ของเพียร์สัน) และมากกว่า 70% เป็นค่าบวกในการวัด 3 * (ค่าเฉลี่ย - มัธยฐาน) / stdev สำหรับสินค้าโภคภัณฑ์คุณมีแนวโน้มที่จะเห็นความไม่แน่นอนเชิงบวกมากขึ้นเนื่องจากอุปสงค์และอุปทานอาจทำให้ราคาพุ่งสูงขึ้นอย่างรวดเร็ว (เช่นน้ำมันก๊าซและข้าวโพดในช่วงไม่กี่ปีที่ผ่านมา)
Chris Taylor

5

อายุครรภ์เมื่อถึงกำหนดคลอด ทารกเกิดมาเร็วมาก (แม้ว่าโอกาสรอดชีวิตต่อเนื่องจะน้อยเมื่อเร็วเกินไป) สูงสุดระหว่าง 36-41 สัปดาห์และลดลงเร็ว เป็นเรื่องปกติที่ผู้หญิงในสหรัฐอเมริกาจะถูกชักนำหาก 41/42 สัปดาห์ดังนั้นเรามักจะไม่เห็นการส่งมอบมากมายหลังจากนั้น


4

ในการประมงมักจะมีตัวอย่างของความเบ้เชิงลบเนื่องจากข้อกำหนดด้านกฎระเบียบ ตัวอย่างเช่นการกระจายความยาวของปลาที่ปล่อยออกมาในการทำประมง เนื่องจากมีบางครั้งความยาวต่ำสุดที่ปลาจะต้องมีเพื่อที่จะรักษาปลาทั้งหมดที่อยู่ภายใต้ขีด จำกัด จะถูกยกเลิก แต่เนื่องจากผู้คนจับปลาซึ่งมีแนวโน้มว่าจะมีความยาวตามกฎหมายปลาจึงมีแนวโน้มที่จะมีความเบ้เชิงลบและอยู่ในขอบเขตที่กฎหมายกำหนด ความยาวตามกฎหมายไม่ได้หมายถึงการถูกตัดออกอย่างหนัก เนื่องจากการ จำกัด ถุง (หรือ จำกัด จำนวนปลาที่สามารถนำกลับไปที่ท่าเรือ) ผู้คนจะยังคงทิ้งปลาขนาดที่ถูกกฎหมายเมื่อพวกเขาจับปลาขนาดใหญ่กว่า

เช่น Sauls, B. 2012 สรุปข้อมูลเกี่ยวกับขนาดการกระจายและเงื่อนไขการปล่อยปลากะพงแดงทิ้งจากการสำรวจการทำประมงในอ่าวเม็กซิโก SEDAR31-DW11 SEDAR, North Charleston, SC. 29 หน้า


"ความเบ้ไปทางขนาดใหญ่" โดยปกติแล้วจะถูกตีความว่าเป็นความเบ้เชิงบวกไม่ใช่ "เชิงลบ" บางทีคุณอาจทำให้คำตอบนี้ชัดเจนขึ้นด้วยภาพประกอบการแจกแจงแบบทั่วไป? กลไกที่คุณอธิบาย - ขีด จำกัด บนของกฎข้อบังคับและแนวโน้มที่จะเกิน - อาจนำไปสู่ความเบ้เป็นลบหรือบวกขึ้นอยู่กับการกระจายที่ถูกตัดของปลาขนาดเล็ก (และขึ้นอยู่กับวิธีการวัดปลา: ความเบ้ การกระจายมวลจะไม่เหมือนกับความเบ้ของการกระจายความยาว)
whuber

3

มีข้อเสนอแนะที่ยอดเยี่ยมเกี่ยวกับหัวข้อนี้ ในรูปแบบของการเสียชีวิตที่เกี่ยวข้องกับอายุอัตราความล้มเหลวของเครื่องจักรมักจะเป็นหน้าที่ของอายุเครื่องจักรและจะตกอยู่ในการแจกแจงระดับนี้ นอกเหนือจากปัจจัยทางการเงินที่ระบุไว้แล้วฟังก์ชั่นการสูญเสียทางการเงินและการกระจายโดยทั่วไปมีลักษณะรูปร่างเหล่านี้โดยเฉพาะอย่างยิ่งในกรณีของการสูญเสียที่มีมูลค่ามากเช่นที่พบใน BIS III (Bank of International Settlement) หรือใน BIS II ค่าความเสี่ยง (VAR) เป็นข้อมูลป้อนเข้าข้อกำหนดด้านกฎระเบียบสำหรับการจัดสรรทุนสำรอง


2

อายุของการเกษียณอายุในสหรัฐอเมริกานั้นเบ้ในทางลบ ผู้เกษียณส่วนใหญ่มีอายุมากกว่าและมีผู้เกษียณอายุค่อนข้างน้อย


2

ในทฤษฎีเมทริกซ์แบบสุ่มการกระจายเทรซี่ Widomนั้นเบ้ขวา นี่คือการกระจายตัวของค่าลักษณะเฉพาะที่ใหญ่ที่สุดของเมทริกซ์แบบสุ่ม โดยความสมมาตรค่าลักษณะเฉพาะที่เล็กที่สุดมีการกระจายเทรซี่ Widom เชิงลบและดังนั้นจึงเอียงซ้าย

นี่คือความจริงเนื่องจากความจริงที่ว่าค่าลักษณะเฉพาะแบบสุ่มนั้นคล้ายกับอนุภาคที่มีประจุซึ่งขับไล่กันและกันและด้วยเหตุนี้ค่าลักษณะเฉพาะที่ใหญ่ที่สุดจึงถูกผลักออกจากส่วนที่เหลือ นี่คือภาพที่พูดเกินจริง (จากที่นี่ ):

ป้อนคำอธิบายรูปภาพที่นี่


การแจกแจงแบบเบ้ขวามีความเบ้เป็นบวกดังนั้นจึงไม่ตอบคำถาม
whuber

@whuber: หมายถึงใช้ค่าลักษณะเฉพาะที่เล็กที่สุด การแก้ไข
Alex R.
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.