ความแตกต่างระหว่างผลต่างอันตะ จำกัด และความไม่สิ้นสุดคืออะไร? ความรู้สถิติของฉันค่อนข้างพื้นฐาน Wikipedia / Google ไม่ได้ช่วยอะไรมากที่นี่
ความแตกต่างระหว่างผลต่างอันตะ จำกัด และความไม่สิ้นสุดคืออะไร? ความรู้สถิติของฉันค่อนข้างพื้นฐาน Wikipedia / Google ไม่ได้ช่วยอะไรมากที่นี่
คำตอบ:
การสุ่มตัวแปรให้มี "ความแปรปรวนแบบไม่สิ้นสุด" หมายความว่าอย่างไร ตัวแปรสุ่มมีความคาดหวังที่ไม่มีที่สิ้นสุดหมายความว่าอย่างไร คำอธิบายในทั้งสองกรณีนั้นค่อนข้างคล้ายกันดังนั้นให้เราเริ่มด้วยกรณีของความคาดหวังจากนั้นความแปรปรวนหลังจากนั้น
ให้เป็นตัวแปรสุ่มแบบต่อเนื่อง (RV) (ข้อสรุปของเราจะใช้ได้โดยทั่วไปสำหรับกรณีที่ไม่ต่อเนื่องกันให้แทนที่อินทิกรัลด้วยผลรวม) การแสดงออกลดความซับซ้อนให้ถือว่าX ≥ 0
ความคาดหวังของมันจะถูกกำหนดโดยหนึ่ง เมื่ออินทิกรัลนั้นมีอยู่นั่นคือ จำกัด อย่างอื่นที่เราบอกว่าไม่มีความคาดหวัง นั่นคือหนึ่งที่ไม่เหมาะสมและโดยความหมายคือ ∫ ∞ 0 x F ( x
ในหลาย ๆ สถานการณ์ดูเหมือนว่าไม่สมจริง ให้บอกว่าเป็นรูปแบบการประกันชีวิตดังนั้นจึงเป็นแบบจำลองอายุการใช้งานของมนุษย์ เรารู้ว่าพูดว่าX > 1000ไม่เกิดขึ้น แต่ในทางปฏิบัติเราใช้โมเดลโดยไม่มีขีด จำกัด เหตุผลชัดเจน: ไม่ทราบขีด จำกัด ที่ยากหากบุคคล (พูด) อายุ 110 ปีไม่มีเหตุผลที่เขาไม่สามารถอยู่ได้อีกหนึ่งปี! ดังนั้นโมเดลที่มีขีด จำกัด สูงสุดอย่างหนักดูเหมือนว่าจะเป็นของเทียม ถึงกระนั้นเราไม่ต้องการให้หางบนสุดมีอิทธิพลมาก
หากมีความคาดหวัง จำกัด เราสามารถเปลี่ยนแบบจำลองเพื่อให้มีขีด จำกัด สูงสุดโดยไม่ส่งผลกระทบต่อแบบจำลอง ในสถานการณ์ที่มีขีด จำกัด บนคลุมเครือที่ดูเหมือนว่าดี หากโมเดลมีความคาดหวังอย่างไม่มีขีด จำกัด ขีด จำกัด บนที่หนักที่เราแนะนำให้กับโมเดลจะมีผลกระทบอย่างมาก! นั่นคือความสำคัญที่แท้จริงของความคาดหวังที่ไม่มีที่สิ้นสุด
ด้วยความคาดหวังอัน จำกัด เราสามารถคลุมเครือเกี่ยวกับขีด จำกัด บน ด้วยความคาดหวังที่ไม่มีที่สิ้นสุดเราไม่สามารถ
ตอนนี้สิ่งเดียวกันสามารถพูดเกี่ยวกับความแปรปรวนอนันต์ได้โดยอนุโลม
เพื่อให้ชัดเจนยิ่งขึ้นให้เราดูตัวอย่าง สำหรับตัวอย่างที่เราใช้การแจกแจงแบบ Pareto ซึ่งถูกนำไปใช้ในแพ็คเกจ R (บน CRAN) แบบ actuar เป็นแบบ pareto1 --- การแจกจ่ายแบบ Pareto แบบพารามิเตอร์เดียวหรือที่เรียกว่าการกระจายแบบ Pareto ชนิด 1 มันมีฟังก์ชั่นความหนาแน่นของความน่าจะเป็นที่กำหนดโดย สำหรับพารามิเตอร์บางm>0,α>0 เมื่อα>1มีความคาดหวังอยู่และมอบให้โดยα
เมื่อความคาดหวังมีอยู่ ( ) เราสามารถหารมันเพื่อให้ได้การแจกแจงโมเมนต์ที่สัมพันธ์แรกโดย E r ( M ) = E ( m ) / E ( ∞ ) = 1 - ( m เมื่อαมีขนาดใหญ่กว่าหนึ่งเล็กน้อยดังนั้นความคาดหวัง "มีอยู่เพียงแทบจะไม่" การรวมเป็นหนึ่งกำหนดความคาดหวังจะมาบรรจบกันอย่างช้าๆ ให้เราดูที่ตัวอย่างที่มีม.=1,α=1.2 ให้เราวางแผนแล้วEr(M)ด้วยความช่วยเหลือของ R:
### Function for opening new plot file:
open_png <- function(filename) png(filename=filename,
type="cairo-png")
library(actuar) # from CRAN
### Code for Pareto type I distribution:
# First plotting density and "graphical moments" using ideas from http://www.quantdec.com/envstats/notes/class_06/properties.htm and used some times at cross validated
m <- 1.0
alpha <- 1.2
# Expectation:
E <- m * (alpha/(alpha-1))
# upper limit for plots:
upper <- qpareto1(0.99, alpha, m)
#
open_png("first_moment_dist1.png")
Er <- function(M, m, alpha) 1.0 - (m/M)^(alpha-1.0)
### Inverse relative first moment distribution function, giving
# what we may call "expectation quantiles":
Er_inv <- function(eq, m, alpha) m*exp(log(1.0-eq)/(1-alpha))
plot(function(M) Er(M, m, alpha), from=1.0, to=upper)
plot(function(M) ppareto1(M, alpha, m), from=1.0, to=upper, add=TRUE, col="red")
dev.off()
ซึ่งสร้างพล็อตนี้:
ฟังก์ชั่น Er_inv ที่กำหนดไว้ด้านบนคือการแจกแจงโมเมนต์สัมพัทธ์ผกผันแรกซึ่งคล้ายกับฟังก์ชันควอนไทล์ เรามี:
> ### What this plot shows very clearly is that most of the contribution to the expectation come from the very extreme right tail!
# Example
eq <- Er_inv(0.5, m, alpha)
ppareto1(eq, alpha, m)
eq
> > > [1] 0.984375
> [1] 32
>
set.seed(1234)
n <- 5
N <- 10000000 # Number of simulation replicas
means <- replicate(N, mean(rpareto1(n, alpha, m) ))
> mean(means)
[1] 5.846645
> median(means)
[1] 2.658925
> min(means)
[1] 1.014836
> max(means)
[1] 633004.5
length(means[means <=100])
[1] 9970136
เพื่อให้ได้พล็อตที่อ่านได้เราจะแสดงฮิสโตแกรมสำหรับส่วนของตัวอย่างที่มีค่าต่ำกว่า 100 ซึ่งเป็นส่วนที่ใหญ่มากของตัวอย่าง
open_png("mean_sim_hist1.png")
hist(means[means<=100], breaks=100, probability=TRUE)
dev.off()
การกระจายตัวของวิธีเลขคณิตนั้นเบ้มาก
> sum(means <= 6)/N
[1] 0.8596413
>
เกือบ 86% ของวิธีเชิงประจักษ์มีค่าน้อยกว่าหรือเท่ากับค่าเฉลี่ยทางทฤษฎีความคาดหมาย นั่นคือสิ่งที่เราควรคาดหวังเนื่องจากส่วนใหญ่ของการบริจาคเพื่อค่าเฉลี่ยมาจากหางด้านบนมากซึ่งจะได้แนะนำให้รู้จักในตัวอย่างมากที่สุด
เราจำเป็นต้องกลับไปประเมินข้อสรุปก่อนหน้าของเราอีกครั้ง ในขณะที่การดำรงอยู่ของรถหมายถึงมันเป็นไปได้ที่จะคลุมเครือเกี่ยวกับขีด จำกัด บนเราจะเห็นว่าเมื่อ "หมายถึงเพิ่งมีอยู่" หมายความว่าหนึ่งคือมาบรรจบกันอย่างช้า ๆ เราไม่สามารถเป็นไปได้ว่ามันคลุมเครือเกี่ยวกับขีด จำกัด ช้าปริพันธ์มาบรรจบกันมีผลว่ามันอาจจะดีกว่าการใช้วิธีการที่ไม่คิดว่าความคาดหวังที่มีอยู่ เมื่ออินทิกรัลค่อย ๆ มาบรรจบกันมันก็อยู่ในทางปฏิบัติราวกับว่ามันไม่ได้มาบรรจบกันเลย ประโยชน์เชิงปฏิบัติที่ตามมาจากอินทิกรัลคอนเวอร์เจนต์คือความเพ้อฝันในกรณีที่เกิดการลู่เข้าอย่างช้าๆ! นั่นเป็นวิธีหนึ่งในการทำความเข้าใจข้อสรุปของ NN Taleb ในhttp://fooledbyrandomness.com/complexityAugust-06.pdf
Variance คือการวัดการกระจายตัวของการแจกแจงค่าของตัวแปรสุ่ม มันไม่ได้เป็นเพียงมาตรการดังกล่าวเท่านั้นเช่นค่าเบี่ยงเบนสัมบูรณ์เป็นทางเลือกหนึ่ง
อนันต์แปรปรวนหมายความว่าค่าสุ่มไม่ได้มีแนวโน้มที่จะมีสมาธิรอบหมายถึงแน่นเกินไป มันอาจหมายถึงว่ามีขนาดใหญ่พอที่น่าจะเป็นที่สุ่มหมายเลขต่อไปจะเป็นมากห่างไกลจากค่าเฉลี่ย
การแจกแจงแบบปกติ (เกาส์เซียน) สามารถสร้างตัวเลขสุ่มห่างจากค่าเฉลี่ยได้มาก แต่ความน่าจะเป็นของเหตุการณ์ดังกล่าวลดลงอย่างรวดเร็วเมื่อขนาดของการเบี่ยงเบน
ในเรื่องนั้นเมื่อคุณดูพล็อตเรื่องการกระจาย Cauchy หรือการแจกแจงแบบเกาส์เซียน (ปกติ) พวกมันดูไม่แตกต่างกันมากนัก อย่างไรก็ตามหากคุณพยายามคำนวณความแปรปรวนของการแจกแจง Cauchy มันจะไม่มีที่สิ้นสุดในขณะที่ Gaussian มี จำกัด ดังนั้นการแจกแจงแบบปกติจะแน่นมากขึ้นเมื่อเทียบกับค่าเฉลี่ยของ Cauchy
Btw ถ้าคุณพูดกับนักคณิตศาสตร์พวกเขาจะยืนยันว่าการกระจาย Cauchy ไม่มีค่าเฉลี่ยที่กำหนดไว้อย่างชัดเจนว่ามันไม่มีที่สิ้นสุด มันฟังดูไร้สาระสำหรับนักฟิสิกส์ที่ชี้ให้เห็นถึงความจริงที่ว่าสมมาตรของ Cauchy ดังนั้นมันจึงมีค่าเฉลี่ย ในกรณีนี้พวกเขาต้องการโต้แย้งปัญหาที่เกิดขึ้นกับการกำหนดค่าเฉลี่ยของคุณไม่ใช่การกระจายของ Cauchy
ทางเลือกอื่นในการดูก็คือฟังก์ชั่นควอไทล์
จากนั้นเราสามารถคำนวณช่วงเวลาหรือความคาดหวัง
เส้นโค้งในภาพแสดงให้เห็นว่าแต่ละควอไทล์มีส่วนช่วยในการคำนวณเท่าใด
อินฟินิตี้นี้อาจไม่แปลกมากนักเนื่องจากตัวอินทิกแรนด์และระยะทาง (หมายถึง) หรือระยะกำลังสอง (ความแปรปรวน) สามารถกลายเป็นอนันต์ได้ มันเป็นเพียงคำถามว่าน้ำหนักเท่าไหร่เปอร์เซ็นต์ของ F ที่หางไม่มีที่สิ้นสุดมีเท่าไหร่
ในการรวม / การรวมกันของระยะทางจากศูนย์ (หมายถึง) หรือระยะห่างกำลังสองจากค่าเฉลี่ย (ความแปรปรวน) จุดเดียวที่อยู่ไกลมากจะมีผลต่อระยะทางเฉลี่ย (หรือระยะห่างกำลังสอง) มากกว่าจุดที่อยู่ใกล้มาก
ดังนั้นเมื่อเราเคลื่อนที่เข้าหาอนันต์ความหนาแน่นอาจลดลง แต่อิทธิพลที่มีต่อผลรวมของปริมาณ (เพิ่มขึ้น) บางอย่างเช่นระยะทางหรือระยะกำลังสองไม่จำเป็นต้องเปลี่ยนแปลง
การแจกแจงส่วนใหญ่ที่คุณพบอาจมีความแปรปรวนแน่นอน นี่คือตัวอย่างที่ไม่ต่อเนื่อง ที่มีความแปรปรวนอนันต์ แต่มีความหมาย จำกัด :
ปล่อยให้ฟังก์ชันความน่าจะเป็นเป็นได้ สำหรับ , ที่ไหน . ก่อนอื่นเพราะมันมีค่าเฉลี่ย จำกัด นอกจากนี้ยังมีความแปรปรวนอนันต์เพราะ.
บันทึก: เป็นฟังก์ชันซีตาของ Riemann มีตัวอย่างอื่น ๆ อีกมากมายที่ไม่น่ายินดีที่จะเขียน