ความแตกต่างระหว่างความแปรปรวน จำกัด และความแปรปรวนอนันต์คืออะไร


33

ความแตกต่างระหว่างผลต่างอันตะ จำกัด และความไม่สิ้นสุดคืออะไร? ความรู้สถิติของฉันค่อนข้างพื้นฐาน Wikipedia / Google ไม่ได้ช่วยอะไรมากที่นี่


8
กระจายกับความแปรปรวนอนันต์เป็นหนักเทลด์ ; มีค่าผิดปกติจำนวนมากและสามารถมีคุณสมบัติที่แตกต่างจากที่ใช้ในการดู ตัวอย่างเช่นค่าเฉลี่ยตัวอย่างของตัวอย่างที่ดึงมาจากการแจกแจงของCauchyมีการกระจาย (Cauchy) เหมือนกันกับตัวอย่างแต่ละตัวอย่าง นี่ค่อนข้างแตกต่างจากความเชื่อตามปกติที่ค่าเฉลี่ยตัวอย่างเป็น "ตัวประมาณ" ที่ดีกว่าตัวอย่างใด ๆ
Dilip Sarwate

4
ไม่หนักหางไม่เหมือนกับการแปรปรวนอนันต์หรืออย่างน้อยไม่ในมุมมองของฉัน อย่างไรก็ตามฉันไม่ใช่นักสถิติดังนั้นคุณควรรอคำตอบที่เชื่อถือได้จากผู้ใช้อันดับสูงในฟอรัมนี้
Dilip Sarwate

4
ความแปรปรวนอนันต์เกิดขึ้นเมื่ออินทิกรัล (ผลรวม) กำหนดความแปรปรวนประชากรเพิ่มขึ้นเกินขอบเขต จำกัด ใด ๆ เมื่อมีการ จำกัด บางตัวอย่างของการสนทนาที่นี่
Glen_b -Reinstate Monica

2
ฉันคิดว่าสำคัญที่สุดทฤษฎีขีด จำกัด กลางส่วนใหญ่ไม่สามารถรองรับประชากรเช่นนี้ได้และผลลัพธ์ทั่วไปบางอย่างจะพังทลายลง
Henry.L

1
จุดสำคัญ: หากความแปรปรวนของประชากรไม่มีที่สิ้นสุด แต่ความแปรปรวนของกลุ่มตัวอย่างมีขอบเขต จำกัด ดังนั้นการประมาณค่าความแปรปรวนของประชากรหรือค่าเบี่ยงเบนมาตรฐานโดยใช้สถิติตัวอย่างเช่นหรือจากนั้นจะค่อนข้างลำเอียงไม่ดี เนื่องจากสถิติการทดสอบจำนวนมากมีพื้นฐานมาจากการวัดผลกระทบที่เป็นมาตรฐานเหนือข้อผิดพลาดมาตรฐานที่ประมาณไว้ของผลกระทบและเนื่องจาก CIs จำนวนมากตั้งอยู่บนมาตราส่วนของข้อผิดพลาดมาตรฐานโดยประมาณซึ่งหมายความว่าการอนุมานเชิงสถิติเกี่ยวกับตัวแปรที่มีความแปรปรวนแบบอนันต์ จะค่อนข้างลำเอียงไม่ดี s2ssn
Alexis

คำตอบ:


48

การสุ่มตัวแปรให้มี "ความแปรปรวนแบบไม่สิ้นสุด" หมายความว่าอย่างไร ตัวแปรสุ่มมีความคาดหวังที่ไม่มีที่สิ้นสุดหมายความว่าอย่างไร คำอธิบายในทั้งสองกรณีนั้นค่อนข้างคล้ายกันดังนั้นให้เราเริ่มด้วยกรณีของความคาดหวังจากนั้นความแปรปรวนหลังจากนั้น

ให้เป็นตัวแปรสุ่มแบบต่อเนื่อง (RV) (ข้อสรุปของเราจะใช้ได้โดยทั่วไปสำหรับกรณีที่ไม่ต่อเนื่องกันให้แทนที่อินทิกรัลด้วยผลรวม) การแสดงออกลดความซับซ้อนให้ถือว่าX 0XX0

ความคาดหวังของมันจะถูกกำหนดโดยหนึ่ง เมื่ออินทิกรัลนั้นมีอยู่นั่นคือ จำกัด อย่างอื่นที่เราบอกว่าไม่มีความคาดหวัง นั่นคือหนึ่งที่ไม่เหมาะสมและโดยความหมายคือ 0 x F ( x

EX=0x(x)dx
สำหรับวงเงินที่จะ จำกัด การมีส่วนร่วมจากหางจะต้องหายไปนั่นคือเราจะต้องมี Lim →การ x F ( x )
0x(x)dx=Lima0ax(x)dx
สิ่งที่จำเป็น ( แต่ไม่เพียงพอ) เงื่อนไขในการที่จะเป็นกรณีที่เป็นลิมx →การ x F ( x ) = 0 สิ่งที่สภาพที่ปรากฏข้างต้นกล่าวคือการมีส่วนร่วมในความคาดหวังจากหาง (ขวา) ที่จะต้องหายไป ถ้าเป็นเช่นนั้นเป็นกรณีที่ไม่คาดหวังที่ถูกครอบงำด้วยผลงานจากค่าตระหนักขนาดใหญ่โดยพลการ และโปรดทราบว่าความไม่มีเสถียรภาพของค่าเฉลี่ยตัวอย่างนี้จะไม่หายไปกับตัวอย่างขนาดใหญ่ --- มันเป็นส่วนหนึ่งของรุ่น!
Limaax(x)dx=0
Limxx(x)=0ที่ถูกครอบงำด้วยผลงานจากค่าตระหนักขนาดใหญ่โดยพลการในทางปฏิบัตินั่นจะหมายความว่าวิธีการทดลองจะไม่เสถียรมากนักเพราะพวกเขาจะถูกครอบงำโดยค่าที่รับรู้ได้ไม่บ่อยนัก

ในหลาย ๆ สถานการณ์ดูเหมือนว่าไม่สมจริง ให้บอกว่าเป็นรูปแบบการประกันชีวิตดังนั้นจึงเป็นแบบจำลองอายุการใช้งานของมนุษย์ เรารู้ว่าพูดว่าX > 1000ไม่เกิดขึ้น แต่ในทางปฏิบัติเราใช้โมเดลโดยไม่มีขีด จำกัด เหตุผลชัดเจน: ไม่ทราบขีด จำกัด ที่ยากหากบุคคล (พูด) อายุ 110 ปีไม่มีเหตุผลที่เขาไม่สามารถอยู่ได้อีกหนึ่งปี! ดังนั้นโมเดลที่มีขีด จำกัด สูงสุดอย่างหนักดูเหมือนว่าจะเป็นของเทียม ถึงกระนั้นเราไม่ต้องการให้หางบนสุดมีอิทธิพลมากXX>1000

หากมีความคาดหวัง จำกัด เราสามารถเปลี่ยนแบบจำลองเพื่อให้มีขีด จำกัด สูงสุดโดยไม่ส่งผลกระทบต่อแบบจำลอง ในสถานการณ์ที่มีขีด จำกัด บนคลุมเครือที่ดูเหมือนว่าดี หากโมเดลมีความคาดหวังอย่างไม่มีขีด จำกัด ขีด จำกัด บนที่หนักที่เราแนะนำให้กับโมเดลจะมีผลกระทบอย่างมาก! นั่นคือความสำคัญที่แท้จริงของความคาดหวังที่ไม่มีที่สิ้นสุดX

ด้วยความคาดหวังอัน จำกัด เราสามารถคลุมเครือเกี่ยวกับขีด จำกัด บน ด้วยความคาดหวังที่ไม่มีที่สิ้นสุดเราไม่สามารถ

ตอนนี้สิ่งเดียวกันสามารถพูดเกี่ยวกับความแปรปรวนอนันต์ได้โดยอนุโลม

เพื่อให้ชัดเจนยิ่งขึ้นให้เราดูตัวอย่าง สำหรับตัวอย่างที่เราใช้การแจกแจงแบบ Pareto ซึ่งถูกนำไปใช้ในแพ็คเกจ R (บน CRAN) แบบ actuar เป็นแบบ pareto1 --- การแจกจ่ายแบบ Pareto แบบพารามิเตอร์เดียวหรือที่เรียกว่าการกระจายแบบ Pareto ชนิด 1 มันมีฟังก์ชั่นความหนาแน่นของความน่าจะเป็นที่กำหนดโดย สำหรับพารามิเตอร์บางm>0,α>0 เมื่อα>1มีความคาดหวังอยู่และมอบให้โดยα

(x)={αม.αxα+1,xม.0,x<ม.
ม.>0,α>0α>1เมตร เมื่ออัลฟ่า1ความคาดหวังไม่อยู่หรือที่เราพูดมันเป็นอนันต์เพราะหนึ่งการกำหนดมัน diverges อินฟินิตี้ เราสามารถกำหนดการแจกแจงช่วงเวลาแรก(ดูโพสต์เมื่อไหร่ที่เราจะใช้ tantiles และอยู่ตรงกลางแทนที่จะเป็น quantiles และมัธยฐาน? สำหรับข้อมูลและการอ้างอิงบางส่วน) เป็น E(M)= M m xf(x)αα-1ม.α1 (สิ่งนี้มีอยู่โดยไม่พิจารณาว่ามีความคาดหวังอยู่หรือไม่) (แก้ไขในภายหลัง: ฉันคิดค้นชื่อ "การกระจายช่วงเวลาแรกหลังจากนั้นฉันเรียนรู้ว่าสิ่งนี้เกี่ยวข้องกับชื่อ" เป็นทางการ "ช่วงเวลาบางส่วน)
E(M)=ม.Mx(x)dx=αα-1(ม.-ม.αMα-1)

เมื่อความคาดหวังมีอยู่ ( ) เราสามารถหารมันเพื่อให้ได้การแจกแจงโมเมนต์ที่สัมพันธ์แรกโดย E r ( M ) = E ( m ) / E ( ) = 1 - ( mα>1 เมื่อαมีขนาดใหญ่กว่าหนึ่งเล็กน้อยดังนั้นความคาดหวัง "มีอยู่เพียงแทบจะไม่" การรวมเป็นหนึ่งกำหนดความคาดหวังจะมาบรรจบกันอย่างช้าๆ ให้เราดูที่ตัวอย่างที่มีม.=1,α=1.2 ให้เราวางแผนแล้วEr(M)ด้วยความช่วยเหลือของ R:

ER(M)=E(ม.)/E()=1-(ม.M)α-1
αม.=1,α=1.2ER(M)
### Function for opening new plot file:
open_png  <-  function(filename) png(filename=filename,
                                     type="cairo-png")

library(actuar) # from CRAN
### Code for Pareto type I distribution:
# First plotting density and "graphical moments" using ideas from http://www.quantdec.com/envstats/notes/class_06/properties.htm   and used some times at cross validated

m  <-  1.0
alpha <- 1.2
# Expectation:
E   <-  m * (alpha/(alpha-1))
# upper limit for plots:
upper  <- qpareto1(0.99, alpha, m)   
#
open_png("first_moment_dist1.png")
Er  <- function(M, m, alpha) 1.0 - (m/M)^(alpha-1.0)
### Inverse relative first moment distribution function,  giving
#   what we may call "expectation quantiles":
Er_inv  <-   function(eq, m, alpha) m*exp(log(1.0-eq)/(1-alpha))     

plot(function(M) Er(M, m, alpha), from=1.0,  to=upper)
plot(function(M) ppareto1(M, alpha, m), from=1.0,  to=upper, add=TRUE,  col="red")
dev.off()

ซึ่งสร้างพล็อตนี้:

ป้อนคำอธิบายรูปภาพที่นี่

μα>2

ฟังก์ชั่น Er_inv ที่กำหนดไว้ด้านบนคือการแจกแจงโมเมนต์สัมพัทธ์ผกผันแรกซึ่งคล้ายกับฟังก์ชันควอนไทล์ เรามี:

> ### What this plot shows very clearly is that most of the contribution to the expectation come from the very extreme right tail!
# Example   
eq  <-  Er_inv(0.5, m, alpha)
ppareto1(eq, alpha, m)
eq

> > > [1] 0.984375
> [1] 32
> 

μn=5

set.seed(1234)
n  <-  5
N  <-  10000000  # Number of simulation replicas
means  <-  replicate(N,  mean(rpareto1(n, alpha, m) ))


> mean(means)
[1] 5.846645
> median(means)
[1] 2.658925
> min(means)
[1] 1.014836
> max(means)
[1] 633004.5
length(means[means <=100])
[1] 9970136

เพื่อให้ได้พล็อตที่อ่านได้เราจะแสดงฮิสโตแกรมสำหรับส่วนของตัวอย่างที่มีค่าต่ำกว่า 100 ซึ่งเป็นส่วนที่ใหญ่มากของตัวอย่าง

open_png("mean_sim_hist1.png")
hist(means[means<=100],  breaks=100, probability=TRUE)
dev.off()

ป้อนคำอธิบายรูปภาพที่นี่

การกระจายตัวของวิธีเลขคณิตนั้นเบ้มาก

> sum(means <= 6)/N
[1] 0.8596413
> 

เกือบ 86% ของวิธีเชิงประจักษ์มีค่าน้อยกว่าหรือเท่ากับค่าเฉลี่ยทางทฤษฎีความคาดหมาย นั่นคือสิ่งที่เราควรคาดหวังเนื่องจากส่วนใหญ่ของการบริจาคเพื่อค่าเฉลี่ยมาจากหางด้านบนมากซึ่งจะได้แนะนำให้รู้จักในตัวอย่างมากที่สุด

เราจำเป็นต้องกลับไปประเมินข้อสรุปก่อนหน้าของเราอีกครั้ง ในขณะที่การดำรงอยู่ของรถหมายถึงมันเป็นไปได้ที่จะคลุมเครือเกี่ยวกับขีด จำกัด บนเราจะเห็นว่าเมื่อ "หมายถึงเพิ่งมีอยู่" หมายความว่าหนึ่งคือมาบรรจบกันอย่างช้า ๆ เราไม่สามารถเป็นไปได้ว่ามันคลุมเครือเกี่ยวกับขีด จำกัด ช้าปริพันธ์มาบรรจบกันมีผลว่ามันอาจจะดีกว่าการใช้วิธีการที่ไม่คิดว่าความคาดหวังที่มีอยู่ เมื่ออินทิกรัลค่อย ๆ มาบรรจบกันมันก็อยู่ในทางปฏิบัติราวกับว่ามันไม่ได้มาบรรจบกันเลย ประโยชน์เชิงปฏิบัติที่ตามมาจากอินทิกรัลคอนเวอร์เจนต์คือความเพ้อฝันในกรณีที่เกิดการลู่เข้าอย่างช้าๆ! นั่นเป็นวิธีหนึ่งในการทำความเข้าใจข้อสรุปของ NN Taleb ในhttp://fooledbyrandomness.com/complexityAugust-06.pdf


2
คำตอบที่ยอดเยี่ยม
Karl

2

Variance คือการวัดการกระจายตัวของการแจกแจงค่าของตัวแปรสุ่ม มันไม่ได้เป็นเพียงมาตรการดังกล่าวเท่านั้นเช่นค่าเบี่ยงเบนสัมบูรณ์เป็นทางเลือกหนึ่ง

อนันต์แปรปรวนหมายความว่าค่าสุ่มไม่ได้มีแนวโน้มที่จะมีสมาธิรอบหมายถึงแน่นเกินไป มันอาจหมายถึงว่ามีขนาดใหญ่พอที่น่าจะเป็นที่สุ่มหมายเลขต่อไปจะเป็นมากห่างไกลจากค่าเฉลี่ย

การแจกแจงแบบปกติ (เกาส์เซียน) สามารถสร้างตัวเลขสุ่มห่างจากค่าเฉลี่ยได้มาก แต่ความน่าจะเป็นของเหตุการณ์ดังกล่าวลดลงอย่างรวดเร็วเมื่อขนาดของการเบี่ยงเบน

ในเรื่องนั้นเมื่อคุณดูพล็อตเรื่องการกระจาย Cauchy หรือการแจกแจงแบบเกาส์เซียน (ปกติ) พวกมันดูไม่แตกต่างกันมากนัก อย่างไรก็ตามหากคุณพยายามคำนวณความแปรปรวนของการแจกแจง Cauchy มันจะไม่มีที่สิ้นสุดในขณะที่ Gaussian มี จำกัด ดังนั้นการแจกแจงแบบปกติจะแน่นมากขึ้นเมื่อเทียบกับค่าเฉลี่ยของ Cauchy

Btw ถ้าคุณพูดกับนักคณิตศาสตร์พวกเขาจะยืนยันว่าการกระจาย Cauchy ไม่มีค่าเฉลี่ยที่กำหนดไว้อย่างชัดเจนว่ามันไม่มีที่สิ้นสุด มันฟังดูไร้สาระสำหรับนักฟิสิกส์ที่ชี้ให้เห็นถึงความจริงที่ว่าสมมาตรของ Cauchy ดังนั้นมันจึงมีค่าเฉลี่ย ในกรณีนี้พวกเขาต้องการโต้แย้งปัญหาที่เกิดขึ้นกับการกำหนดค่าเฉลี่ยของคุณไม่ใช่การกระจายของ Cauchy


2
-

1
@kjetilbhalvorsen "ไม่มีนักคณิตศาสตร์คนใดจะบอกว่า Cauchy มีค่าเฉลี่ยไม่สิ้นสุด" - ค่าเฉลี่ยนั้นไม่ได้นิยามไว้อย่างชัดเจนว่าเป็นสิ่งที่ฉันได้รับการบอกเล่าจากศาสตราจารย์สถิติของฉัน "แน่นอนว่ามันเป็นศูนย์และถ้าคุณไม่เห็นด้วยก็มีอะไรผิดปกติกับนิยามของค่าเฉลี่ยของคุณ"
Aksakal

คุณถามเขาเกี่ยวกับคำจำกัดความของคำว่าหมายถึงอะไร?
kjetil b halvorsen

@kjetilbhalvorsen, Riemann อินทิกรัลถ้าคุณพูดถึงคณิตศาสตร์ศ เหตุผลของเขาคือในผลรวมของ Riemann คุณไม่ได้กำหนดลำดับของผลรวมหรือการแบ่งผลรวมดังนั้นผลรวมของคุณจะไม่สิ้นสุด นักฟิสิกส์ชี้ให้เห็นว่าสมมาตรชัดเจน "ต้องเป็นศูนย์"
อักขซากัล

1
จากนั้นบางทีคุณสามารถบอกเขาได้ว่าเขานิยามค่ามัธยฐานไม่ใช่ค่าเฉลี่ย
kjetil b halvorsen

2

ทางเลือกอื่นในการดูก็คือฟังก์ชั่นควอไทล์

Q(F(x))=x

จากนั้นเราสามารถคำนวณช่วงเวลาหรือความคาดหวัง

E(T(x))=-T(x)(x)dx

(x)dx=dF

E(T(x))=01T(Q(F))dF

T(x)=xx=0T(x)<0x=0π

Cauchy กับ Normal

เส้นโค้งในภาพแสดงให้เห็นว่าแต่ละควอไทล์มีส่วนช่วยในการคำนวณเท่าใด

T(Q(F))

อินฟินิตี้นี้อาจไม่แปลกมากนักเนื่องจากตัวอินทิกแรนด์และระยะทาง (หมายถึง) หรือระยะกำลังสอง (ความแปรปรวน) สามารถกลายเป็นอนันต์ได้ มันเป็นเพียงคำถามว่าน้ำหนักเท่าไหร่เปอร์เซ็นต์ของ F ที่หางไม่มีที่สิ้นสุดมีเท่าไหร่

ในการรวม / การรวมกันของระยะทางจากศูนย์ (หมายถึง) หรือระยะห่างกำลังสองจากค่าเฉลี่ย (ความแปรปรวน) จุดเดียวที่อยู่ไกลมากจะมีผลต่อระยะทางเฉลี่ย (หรือระยะห่างกำลังสอง) มากกว่าจุดที่อยู่ใกล้มาก

ดังนั้นเมื่อเราเคลื่อนที่เข้าหาอนันต์ความหนาแน่นอาจลดลง แต่อิทธิพลที่มีต่อผลรวมของปริมาณ (เพิ่มขึ้น) บางอย่างเช่นระยะทางหรือระยะกำลังสองไม่จำเป็นต้องเปลี่ยนแปลง

x2xΣ12nΣ((2x)n)212n


1

การแจกแจงส่วนใหญ่ที่คุณพบอาจมีความแปรปรวนแน่นอน นี่คือตัวอย่างที่ไม่ต่อเนื่องX ที่มีความแปรปรวนอนันต์ แต่มีความหมาย จำกัด :

ปล่อยให้ฟังก์ชันความน่าจะเป็นเป็นได้ พี(k)=/|k|3สำหรับ kZ{0}, พี(0)=0ที่ไหน =(2ζ(3))-1=(2Σk=11/k3)-1<. ก่อนอื่นเพราะE|X| <มันมีค่าเฉลี่ย จำกัด นอกจากนี้ยังมีความแปรปรวนอนันต์เพราะ2Σk=1k2/|k|3=2Σk=1k-1=.

บันทึก: ζ(x)=Σk=1k-xเป็นฟังก์ชันซีตาของ Riemann มีตัวอย่างอื่น ๆ อีกมากมายที่ไม่น่ายินดีที่จะเขียน


4
เพียงเพราะการแจกแจงนั้นสมมาตร (นั่นคือฟังก์ชั่นคู่) ไม่จำเป็นต้องทำการหาค่าเฉลี่ย0; ค่าเฉลี่ยอาจไม่มีอยู่เนื่องจากผลรวม / อินทิกรัลเปลี่ยนเป็นแบบฟอร์ม-
Dilip Sarwate
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.