ฟังก์ชันผกผันของความแปรปรวน


9

สำหรับค่าคงที่จำนวน (เช่น 4) เป็นไปได้หรือไม่ที่จะหาการแจกแจงความน่าจะเป็นสำหรับดังนั้นเราจึงมี ?rXVar(X)=r


1
ไม่เว้นแต่ว่าคุณจะมีข้อมูลเพิ่มเติม
Hemant Rupani

@Hemant Rupani ต้องการข้อมูลอะไรเพิ่มเติม
amiref

1
ลักษณะของตัวแปรสุ่มใด ๆ 'X' …
Hemant Rupani

3
ฉันขอแนะนำให้คุณแก้ไขคำถามของคุณเพื่อแทนที่ "ค่าสำหรับ X" ด้วย "การแจกแจงสำหรับ X" - ถ้า X มีเพียงค่าเดียวดังนั้น X มีการกระจายที่ลดลงและจะมีค่าศูนย์แปรปรวน
Silverfish

1
เว้นแต่เป็นลบคำตอบคือได้เห็นได้ชัดว่าใช่แปรปรวนสามารถเป็นตัวเลขบวกใด ๆ r
dsaxton

คำตอบ:


13

พิจารณาอย่างรอบคอบถึงกรณีสำหรับ : if ดังนั้นการแจกแจงจะลดลง แต่ อาจมีค่าเฉลี่ย นั่นคือและสำหรับใด ๆ ดังนั้นเราจึงสามารถพบกระจายเป็นไปได้มากสำหรับแต่พวกเขาจะจัดทำดัชนีโดยและระบุไว้อย่างสมบูรณ์โดย{R}rr=0XPr(X=μ)=1Pr(X=c)=0cμXμR

ถ้ากระจายไม่สามารถพบได้ตั้งแต่0r<0Var(X)=E(XμX)20

สำหรับคำตอบจะขึ้นอยู่กับสิ่งที่ต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับการเป็นที่รู้จักกันXตัวอย่างเช่นถ้าเป็นที่รู้จักกันจะมีค่าเฉลี่ยแล้วสำหรับการใด ๆและเราสามารถหาการกระจายกับช่วงเวลาเหล่านี้โดยการR) นี่ไม่ใช่วิธีการแก้ปัญหาที่ไม่ซ้ำกันสำหรับปัญหาของการจับคู่ค่าเฉลี่ยและความแปรปรวน แต่เป็นวิธีการแก้ปัญหาแบบกระจายเท่านั้น (และของการแก้ปัญหาที่เป็นไปได้ทั้งหมดนี้เป็นวิธีที่เพิ่มเอนโทรปีให้มากที่สุดเท่าที่ Daniel ชี้ หากคุณต้องการจับคู่เช่นช่วงเวลากลางที่สามหรือสูงกว่าคุณจะต้องพิจารณาการแจกแจงความน่าจะเป็นในวงกว้างr>0XXμμRr>0XN(μ,r)

สมมติว่าเรามีข้อมูลเกี่ยวกับการกระจายของมากกว่าช่วงเวลา ตัวอย่างเช่นถ้าเรารู้ว่าต่อไปนี้การกระจาย Poisson แล้วทางออกที่ไม่ซ้ำกันจะเป็น(R) ถ้าเรารู้ว่าเป็นไปตามการแจกแจงแบบเอ็กซ์โพเนนเชียลแล้วอีกครั้งก็มีทางออกที่เป็นเอกลักษณ์ซึ่งเราได้พบพารามิเตอร์โดยการแก้2}XXXPoisson(r)XXExponential(1r)Var(X)=r=1λ2

ในกรณีอื่นเราสามารถค้นหาโซลูชันทั้งหมดในตระกูล ถ้าเรารู้ว่าดังต่อไปนี้เป็นรูปสี่เหลี่ยมผืนผ้า (เครื่องแบบต่อเนื่อง) การกระจายแล้วเราสามารถค้นหาความกว้างที่ไม่ซ้ำกันสำหรับการกระจายโดยการแก้{12} แต่จะมีการแก้ปัญหาทั้งครอบครัวพารามิเตอร์ของ - การแจกแจงในชุดนี้เป็นการแปลทั้งหมดของกันและกัน ในทำนองเดียวกันถ้าเป็นเรื่องปกติการกระจายใด ๆ จะใช้งานได้ (ดังนั้นเราจึงมีวิธีแก้ปัญหาทั้งชุดที่ทำดัชนีโดยซึ่งสามารถเป็นจำนวนจริงได้อีกครั้งและทุกครอบครัวแปลทั้งหมด ของกันและกัน) ถ้าXwVar(X)=r=w212XU(a,a+w)aRXXN(μ,r)μXตามการกระจายของแกมม่าจากนั้นโดยใช้การกำหนดพารามิเตอร์ระดับรูปร่างเราสามารถหาวิธีแก้ปัญหาทั้งครอบครัวได้พารามิเตอร์โดย0 สมาชิกในครอบครัวนี้ไม่ได้แปลจากกัน ที่จะช่วยให้เห็นภาพสิ่งที่เป็น "ครอบครัวของการแก้ปัญหา" อาจมีลักษณะเช่นนี้เป็นตัวอย่างบางส่วนของการแจกแจงปรกติดัชนีโดยแล้วแจกแจงแกมมาดัชนีโดยทั้งหมดที่มีความแปรปรวนเท่ากับสี่สอดคล้องกับตัวอย่างใน คำถามของคุณ.XGamma(rθ2,θ)θ>0μθr=4

การแจกแจงแบบปกติที่มีความแปรปรวนสี่ การแจกแจงแกมมาที่มีความแปรปรวนสี่

บนมืออื่น ๆ สำหรับการกระจายบางอย่างมันอาจหรือไม่อาจเป็นไปได้ที่จะหาทางออกขึ้นอยู่กับค่าของRตัวอย่างเช่นถ้าจะต้องเป็นตัวแปร Bernoulli แล้วมีสองแนวทางแก้ปัญหาเพราะมีสองน่าจะเป็นซึ่งการแก้สมการและในความเป็นจริงทั้งสองน่าจะประกอบเช่น1 สำหรับมีเพียงวิธีแก้ปัญหาเฉพาะและสำหรับไม่มีการแจกแจงเบอร์นูลีมีความแปรปรวนสูงพอสมควรrX0r<0.25XBernoulli(p)pVar(X)=r=p(1p)p1+p2=1r=0.25p=0.5r>0.25

ผมรู้สึกว่าผมควรพูดถึงกรณีที่\ มีโซลูชั่นสำหรับกรณีนี้มีมากเกินไปตัวอย่างเช่นนักศึกษากระจายกับสององศาอิสระr=t

รหัส R สำหรับแปลง

require(ggplot2)

x.df  <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
    mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")

x.df  <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
    theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
    coord_cartesian(ylim = c(0, 1)) 

17

สมมติว่าคุณหมายถึง "เป็นไปได้หรือไม่ที่จะหาการแจกแจงความน่าจะเป็นสำหรับ " คำตอบคือใช่เนื่องจากคุณไม่ได้ระบุเกณฑ์ใด ๆ ที่ต้องพึงพอใจ ในความเป็นจริงมีจำนวนอนันต์ของการแจกแจงที่เป็นไปได้ที่จะตอบสนองเงื่อนไขนี้ เพียงพิจารณาการกระจายปกติ2) คุณสามารถตั้งค่าและสามารถรับค่าใด ๆ ที่คุณต้องการ - จากนั้นคุณจะมีตามต้องการXXN(x;μ,σ2)σ2=rμVar[X]=r

ในความเป็นจริงการแจกแจงแบบปกติค่อนข้างพิเศษในเรื่องนี้เนื่องจากเป็นการกระจายความน่าจะเป็นเอนโทรปีสูงสุดสำหรับค่าเฉลี่ยและความแปรปรวนที่กำหนด


คุณพูดถูกฉันแก้ไข คุณช่วยอธิบายเพิ่มเติมได้ไหม
amiref

@AmirEf ไม่มีความชัดเจนอะไร
Daniel

6
ไม่ชัดเจนว่าดาเนียลควรอธิบายอะไร คำตอบที่นี่ดูเหมือนจะจัดการกับทุกสิ่งในคำถามที่คุณโพสต์
Glen_b -Reinstate Monica

15

คำถามนี้สามารถตีความได้ในวิธีที่ทำให้มันน่าสนใจและไม่น่ารำคาญเลย เมื่อพิจารณาถึงที่ดูเหมือนตัวแปรสุ่มสามารถกำหนดความน่าจะเป็นให้กับค่าของมัน (หรือเลื่อนความน่าจะเป็นที่มีอยู่ไปรอบ ๆ ) ในลักษณะที่ความแปรปรวนเท่ากับจำนวนที่กำหนดไว้ล่วงหน้า ? คำตอบก็คือทุกค่าที่เป็นไปเป็นที่อนุญาตถึงขีด จำกัด ที่กำหนดโดยช่วงของXXrr0X

ความสนใจที่อาจเกิดขึ้นในการวิเคราะห์นั้นอยู่ในแนวคิดของการเปลี่ยนการวัดความน่าจะเป็นในขณะที่รักษาตัวแปรสุ่มไว้เพื่อให้ได้จุดสิ้นสุดที่เฉพาะเจาะจง แม้ว่าแอปพลิเคชั่นนี้จะง่าย แต่ก็แสดงความคิดบางอย่างที่อยู่ภายใต้ทฤษฎีบท Girsanovซึ่งเป็นพื้นฐานของผลลัพธ์ทางการเงินทางคณิตศาสตร์


เราจะพูดซ้ำคำถามนี้ในแบบที่เข้มงวดและไม่คลุมเครือ สมมติ

X:(Ω,S)R

เป็นฟังก์ชั่นที่สามารถวัดได้กำหนดไว้ในพื้นที่วัดกับพีชคณิตซิกมา{S} สำหรับจำนวนจริงที่กำหนดเมื่อใดจึงจะสามารถหาการวัดความน่าจะเป็นในพื้นที่นี้ซึ่ง ?ΩSr>0PVar(X)=r

ผมเชื่อว่าคำตอบคือว่านี้เป็นไปได้เมื่อ{r} sup(X)inf(X)>2r (ความเสมอภาคสามารถเก็บได้ถ้า supremum และ infinite มีการบรรลุ: นั่นคือพวกเขาเป็นจริงสูงสุดและต่ำสุดของ ) เมื่อใดหรือเงื่อนไขนี้ กำหนดไม่ จำกัดและจากนั้นค่าที่ไม่เป็นลบทั้งหมดของความแปรปรวนเป็นไปได้Xsup(X)=inf(X)=r

หลักฐานคือโดยการก่อสร้าง เริ่มจากรุ่นง่าย ๆ เพื่อดูแลรายละเอียดและปักหมุดแนวคิดพื้นฐานแล้วย้ายไปที่การก่อสร้างจริง

  1. ให้จะอยู่ในภาพของ : ที่นี้หมายถึงมีที่x กำหนดฟังก์ชั่นการตั้งค่าเป็นตัวบ่งชี้ของ : นั่นคือถ้าและเมื่อAxXωxΩX(ωx)=xP:S[0,1]ωxP(A)=0ωxAP(A)=1ωxA

    ตั้งแต่เห็นได้ชัดน่าพอใจทั้งสองหลักการแรกของความน่าจะเป็น มีความจำเป็นต้องแสดงให้เป็นไปตามที่สาม กล่าวคือมันเป็น sigma-additive แต่นี่ก็เกือบจะเห็นได้ชัด: เมื่อใดก็ตามที่เป็นชุดที่ไม่มีที่สิ้นสุดหรือนับไม่ถ้วนของเหตุการณ์ที่ไม่เกิดร่วมกันซึ่งกันและกันแล้วก็ไม่มีใครมี - ในกรณีที่สำหรับทั้งหมด- หรือหนึ่งในนั้นมีซึ่งในกรณีนี้สำหรับบางตัวและอื่น ๆสำหรับทุกคนที่P(Ω)=1P{Ei,i=1,2,}ωxP(Ei)=0iωxP(Ej)=1jP(Ei)=0ij. ไม่ว่าในกรณีใด

    P(iEi)=iP(Ei)

    เพราะทั้งสองฝ่ายมีทั้งทั้งหรือทั้งสองอย่าง101

    เนื่องจากมุ่งเน้นความน่าจะเป็นทั้งหมดที่การกระจายของจึงเน้นที่และต้องมีความแปรปรวนเป็นศูนย์PωxXxX

  2. ให้เป็นสองค่าในช่วง ; นั่นคือและx_2 ในลักษณะที่คล้ายคลึงกับขั้นตอนก่อนหน้าการกำหนดตัวชี้วัดจะเป็นถัวเฉลี่ยถ่วงน้ำหนักของตัวชี้วัดของและ\ใช้ที่ไม่ใช่เชิงลบน้ำหนักและสำหรับจะได้รับการพิจารณา ก่อนหน้านี้เราพบว่าโดยการรวมกันของตัวชี้วัดที่กล่าวถึงในข้อ (1) - เป็นตัวชี้วัดความน่าจะเป็น การกระจายตัวของเทียบกับวัดนี้คือ Bernoullix1x2XX(ω1)=x1X(ω2)=x2Pω1ω21pppPX(p)การจัดจำหน่ายที่ได้รับการปรับขนาดโดยและขยับ-x_1เพราะความแปรปรวนของน Bernoulliกระจายความแปรปรวนของจะต้องเป็น(1-P)x2x1x1(p)p(1p)X(x2x1)2p(1p)

ผลที่ตามมาทันทีของ (2) คือใดที่มีในช่วงของและซึ่งrx1x2X0p<1

r=(x2x1)2p(1p)

สามารถแปรปรวนของXตั้งแต่นี่หมายถึงX0p(1p)1/4

2r=4rrp(1p)=(x2x1)2=x2x1sup(X)inf(X),

ด้วยความเสมอภาคถือถ้าและถ้ามีสูงสุดและต่ำสุดX

ในทางกลับกันถ้าเกินขอบเขตนี้ดังนั้นจึงไม่มีวิธีแก้ปัญหาเนื่องจากเราทราบแล้วว่าความแปรปรวนของตัวแปรสุ่มที่มีขอบเขตไม่สามารถเกินหนึ่งในสี่ กำลังสองของช่วงr(sup(X)inf(X))2/4


3
เพื่อนฉันคิดว่าคุณอยู่ในระดับที่แตกต่างจาก OP
Mark L. Stone

4
@ Mark อาจเป็นไปได้ (ฉันคิดว่าคุณตรวจพบอารมณ์ขันที่แห้งมากที่นี่) แต่ใครก็ตามที่ใช้แท็กคณิตศาสตร์ - สถิติกับโพสต์ของพวกเขาควรจะคาดหวังสิ่งต่าง ๆ :-)
whuber

2
มันเป็นสิ่งที่ทำให้ฉันนึกถึงตอนที่ฉันเรียนนักเรียน 4 คนจากศาสตราจารย์ซามูเอลคาร์ลิน (จากคาร์ลินและเทย์เลอร์มีชื่อเสียงในเรื่องอื่น ๆ ) ในหัวข้อ "ความเป็นไปได้ทั้งหมด" หัวข้อของทฤษฎีเกมเกิดขึ้น เขาพูดว่าโอ้ทฤษฎีเกม คุณมีมาตรการซิกม่า - ไฟไนต์ที่ไม่เป็นลบสองข้อ .... ลองจินตนาการว่าเขาแนะนำทฤษฎีเกมด้วยวิธีนี้กับนักเรียนในชั้นเรียนวิชาเศรษฐศาสตร์น้องใหม่ที่วิทยาลัยศิลปศาสตร์ นั่นคือสิ่งที่โพสต์ของคุณทำให้ฉันคิด
Mark L. Stone

@ มาร์กเข้าใจ หนึ่งจะไม่ทำอย่างนั้นและประสบความสำเร็จ ในขณะที่คุณชี้ให้เห็นว่าฉันกำลังเขียนที่นี่สำหรับผู้อ่านทั่วไป (ส่วนย่อยของ) มากกว่าผู้อ่านที่เฉพาะเจาะจง ในขณะที่วิชานามธรรมไม่ยาก (ในระดับประถมศึกษานี้) และได้พิสูจน์แล้วว่าสามารถเข้าถึงผู้ใต้บังคับบัญชาที่มีแรงบันดาลใจในวิทยาลัยศิลปศาสตร์ ดูความคิดเห็นที่stats.stackexchange.com/a/94876เช่น
whuber

4
@ MarkL.Stone Answers เป็นมากกว่าเพียงแค่ผู้ถามทันที (SE มีวัตถุประสงค์เพื่อเป็นพื้นที่เก็บข้อมูลของคำถามที่ดีและคำตอบที่ดีซึ่งเป็นประโยชน์ต่อผู้ที่มีคำถามคล้ายกันในภายหลัง) และเรามีคำตอบสำหรับมุมมองระดับประถมศึกษาเพิ่มเติมของคำถามที่นี่แล้ว . ผู้อ่านคนอื่น ๆ บางคนอาจได้รับสิ่งที่ไม่เกี่ยวกับสิ่งที่เรียนเบื้องต้นดังนั้นสไตล์และระดับของคำตอบที่หลากหลายทำให้คำถามมีประโยชน์สำหรับผู้คนจำนวนมากขึ้น
Glen_b -Reinstate Monica

10

ใช่เป็นไปได้ที่จะหาการกระจายดังกล่าว ในความเป็นจริงคุณสามารถทำการแจกแจงใด ๆ ที่มีความแปรปรวน จำกัดและปรับขนาดให้ตรงกับสภาพของคุณเพราะ

Var[cX]=c2Var[X]

ตัวอย่างเช่นการแจกแจงแบบสม่ำเสมอในช่วงเวลามีความแปรปรวน: ดังนั้นการกระจายแบบสม่ำเสมอในช่วงจะมีความแปรปรวนR[0,1]

σ2=112
[0,112r]r

อันที่จริงนี่เป็นวิธีทั่วไปในการเพิ่มพารามิเตอร์ให้กับการแจกแจงบางอย่างเช่น Student t มันมีเพียงหนึ่งพารามิเตอร์ - องศาอิสระ เมื่อการกระจายเข้าหามาตรฐานปกติ มันเป็นรูประฆังและมีลักษณะเหมือนปกติมาก แต่มีหางที่อ้วนขึ้น นั่นเป็นเหตุผลว่าทำไมมันจึงถูกใช้แทนการกระจายแบบปกติเมื่อหางมีไขมัน ปัญหาเดียวคือการกระจายแบบเกาส์มีสองพารามิเตอร์ ดังนั้นมารุ่นปรับขนาดของเสื้อนักศึกษาซึ่งบางครั้งเรียกว่า " ทีตั้งขนาด" กระจาย นี่เป็นการเปลี่ยนแปลงที่ง่ายมาก:โดยที่เป็นที่ตั้งและสเกล ตอนนี้คุณสามารถตั้งค่ามาตราส่วนเพื่อให้ตัวแปรใหม่ννξ=tμsμ,sξ จะมีความแปรปรวนที่จำเป็นและจะมีรูปร่างของการกระจายนักเรียน t

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.