ความแปรปรวนของตัวแปรสุ่มที่มีขอบเขต


22

สมมติว่าตัวแปรสุ่มมีขอบเขตที่ต่ำกว่าและขอบเขตสูงสุด [0,1] จะคำนวณความแปรปรวนของตัวแปรดังกล่าวได้อย่างไร?


8
เช่นเดียวกับตัวแปรที่ไม่ได้ จำกัด - การตั้งค่าการรวมหรือข้อ จำกัด การรวมอย่างเหมาะสม
Scortchi - Reinstate Monica

2
เป็น @Scortchi กล่าวว่า แต่ฉันอยากรู้ว่าทำไมคุณคิดว่ามันอาจจะแตกต่างกัน?
Peter Flom - Reinstate Monica

3
ถ้าคุณไม่ทราบอะไรเกี่ยวกับตัวแปร (ซึ่งในกรณีนี้ขอบเขตบนความแปรปรวนอาจถูกคำนวณจากการมีอยู่ของขอบเขต) ทำไมความจริงที่ว่าขอบเขตถูกนำมาคำนวณ
Glen_b -Reinstate Monica

6
ขอบเขตบนที่มีประโยชน์ในความแปรปรวนของตัวแปรสุ่มที่ใช้กับค่าในมีความน่าจะเป็นคือและสามารถทำได้โดยตัวแปรสุ่มแยกที่ใช้กับค่าและมีความน่าจะเท่ากัน{2} จุดอื่นที่ควรทราบคือความแปรปรวนรับประกันได้ว่าจะมีอยู่ในขณะที่ตัวแปรสุ่มที่ไม่มีขอบเขตอาจไม่มีความแปรปรวน (บางอย่างเช่นตัวแปรสุ่ม Cauchy ไม่มีแม้แต่ค่าเฉลี่ย) [a,b]11(ba)2/4a12
Dilip Sarwate

7
มีเป็นตัวแปรสุ่มต่อเนื่องที่มีความแปรปรวนเท่ากับว่า:ตัวแปรสุ่มที่ใช้เวลาอยู่กับค่าและมีโอกาสที่เท่าเทียมกัน{2} ดังนั้นอย่างน้อยเราก็รู้ว่าสากลขอบเขตบนแปรปรวนไม่สามารถจะมีขนาดเล็กกว่า{4} (-a)24 a12(-a)24
Dilip Sarwate

คำตอบ:


46

คุณสามารถพิสูจน์ความไม่เท่าเทียมของ Popoviciu ได้ดังนี้ ใช้สัญกรณ์และX กำหนดฟังก์ชั่นโดย การคำนวณอนุพันธ์และการแก้ปัญหา เราพบว่าค่าต่ำสุดที่ ( โปรดทราบว่า )ม.=INFXM=supXg

ก.(เสื้อ)=E[(X-เสื้อ)2].
ก.'
ก.'(เสื้อ)=-2E[X]+2เสื้อ=0,
ก.เสื้อ=E[X]ก.">0

ตอนนี้พิจารณาค่าของฟังก์ชั่นที่จุดพิเศษ{2} มันจะต้องเป็นกรณีที่ แต่ ตั้งแต่และเรามี หมายความว่า ก.เสื้อ=M+ม.2

VaR[X]=ก.(E[X])ก.(M+ม.2).
ก.(M+ม.2)=E[(X-M+ม.2)2]=14E[((X-ม.)+(X-M))2].
X-ม.0X-M0
((X-ม.)+(X-M))2((X-ม.)-(X-M))2=(M-ม.)2,
14E[((X-ม.)+(X-M))2]14E[((X-ม.)-(X-M))2]=(M-ม.)24.
V a r [ X ] ( M - m ) 2 ดังนั้นเราจึงพิสูจน์ความไม่เท่าเทียมของ Popoviciu
VaR[X](M-ม.)24.


3
วิธีการที่ดี: เป็นการดีที่ได้เห็นการสาธิตที่เข้มงวดของสิ่งต่าง ๆ เหล่านี้
whuber

22
+1 ดี! ฉันเรียนรู้สถิติมานานก่อนที่คอมพิวเตอร์จะเป็นสมัยและความคิดหนึ่งที่เจาะเข้ามาในตัวเราคือซึ่งได้รับอนุญาตสำหรับการคำนวณความแปรปรวนโดยการหาผลรวมของกำลังสองของการเบี่ยงเบนจากจุดที่สะดวกใด ๆแล้วจึงปรับความเบี่ยงเบน ที่นี่แน่นอนตัวตนนี้ให้หลักฐานง่าย ๆ ของผลลัพธ์ที่มีค่าขั้นต่ำที่โดยไม่จำเป็นต้องมีอนุพันธ์ ฯลฯ t g ( t ) t = μ
E[(X-เสื้อ)2]=E[((X-μ)-(เสื้อ-μ))2]=E[(X-μ)2]+(เสื้อ-μ)2
เสื้อก.(เสื้อ)เสื้อ=μ
Dilip Sarwate

18

ให้จะกระจายบน[0,1]เราจะแสดงให้เห็นว่าหากความแปรปรวนของเป็นค่าสูงสุดแล้วจะไม่สามารถรองรับการตกแต่งภายในได้ซึ่งจากนั้นจะตามมาว่าคือ Bernoulli และส่วนที่เหลือนั้นไม่สำคัญ[ 0 , 1 ] F F FF[0,1]FFF

ตามสัญกรณ์ให้เป็นช่วงเวลาดิบที่ของ (และตามปกติเราเขียนและสำหรับความแปรปรวน)k F μ = μ 1 σ 2 = μ 2 - μ 2μk=01xkdF(x)kFμ=μ1σ2=μ2-μ2

เรารู้ว่าไม่ได้รับการสนับสนุนทั้งหมดในคราวเดียว (ความแปรปรวนน้อยที่สุดในกรณีนั้น) เหนือสิ่งอื่นใดนี้หมายถึงโกหกอย่างเคร่งครัดระหว่างและ1เพื่อที่จะยืนยันโดยความขัดแย้งสมมติว่ามีเซตที่วัดบางในการตกแต่งภายในซึ่ง0 เราอาจสมมติ (โดยเปลี่ยนเป็นหากจำเป็น) โดยที่ : กล่าวอีกนัยหนึ่งจะได้รับโดยการตัดใด ๆ ส่วนหนึ่งของเหนือค่าเฉลี่ยและμ 0 1 I ( 0 , 1 ) F ( I ) > 0 X 1 - X F ( J = I ( 0 , μ ] ) > 0 J I JFμ01ผม(0,1)F(ผม)>0X1-XF(J=ผม(0,μ])>0JผมJ มีโอกาสในเชิงบวก

ขอให้เราปรับเปลี่ยนเพื่อโดยการทั้งหมดน่าจะออกจากและวางไว้ที่0F J 0 FF'J0 ในการทำเช่นนั้นเปลี่ยนเป็นμk

μk'=μk-JxkdF(x).

ตามสัญกรณ์ให้เราเขียนสำหรับอินทิกรัลเช่นไหน[ก.(x)]=Jก.(x)dF(x)

μ2'=μ2-[x2],μ'=μ-[x].

คำนวณ

σ'2=μ2'-μ'2=μ2-[x2]-(μ-[x])2=σ2+((μ[x]-[x2])+(μ[x]-[x]2)).

ระยะที่สองด้านขวา เป็นที่ไม่ใช่เชิงลบเพราะทุกที่บนJเทอมแรกทางด้านขวาสามารถเขียนใหม่ได้μ x J(μ[x]-[x]2)μxJ

μ[x]-[x2]=μ(1-[1])+([μ][x]-[x2]).

เทอมแรกทางด้านขวาเป็นค่าบวกอย่างเข้มงวดเพราะ (a)และ (b)เพราะเราคิดว่าไม่เข้มข้นที่จุดหนึ่ง ระยะที่สองคือไม่ติดลบเพราะสามารถเขียนใหม่เป็นและ integrand นี้เป็นค่าลบจากสมมติฐานบนและ1 มันตามที่0[ 1 ] = F ( J ) < 1 F [ ( μ - x ) ( x ) ] μ x J 0 x 1 σ ' 2 - σ 2 > 0μ>0[1]=F(J)<1F[(μ-x)(x)]μxJ0x1σ'2-σ2>0

เราเพิ่งแสดงให้เห็นว่าภายใต้สมมติฐานของเราการเปลี่ยนเป็นเพิ่มความแปรปรวนอย่างเคร่งครัด วิธีเดียวที่สิ่งนี้ไม่สามารถเกิดขึ้นได้คือเมื่อความน่าจะเป็นทั้งหมดของถูกรวมที่จุดสิ้นสุดและด้วยค่า (พูด) ค่าและตามลำดับ ความแปรปรวนของมันจะถูกคำนวณอย่างง่ายดายให้เท่ากับซึ่งเป็นค่าสูงสุดเมื่อและเท่ากับนั่นF ' F ' 0 1 1 - พีพีพี( 1 - P ) P = 1 / 2 1 / 4FF' F'011-พีพีพี(1-พี)พี=1/21/4

ตอนนี้เมื่อคือการกระจายบนเรา recenter และ rescale มันกระจายบน[0,1]recentering ไม่เปลี่ยนแปลงแปรปรวนในขณะที่แบ่ง rescaling มันโดย 2 ดังนั้นมีความแปรปรวนสูงสุดในสอดคล้องกับการแจกแจงที่มีความแปรปรวนสูงสุดใน : ดังนั้นจึงเป็น Bernoulliการกระจายการช่วยชีวิตและแปลเป็นมีความแปรปรวน , QED[ , ] [ 0 , 1 ] ( - ) 2 F [ , ] [ 0 , 1 ] ( 1 / 2 ) [ , B ] ( - ) 2 / 4F[a,][0,1](-a)2F[a,][0,1](1/2)[a,](-a)2/4


น่าสนใจมากขึ้น ฉันไม่รู้หลักฐานนี้
เซน

6
@ เซนมันไม่ได้งดงามเท่าของคุณ ฉันเสนอให้เพราะฉันพบว่าตัวเองคิดมานานหลายปีในลักษณะนี้เมื่อต้องเผชิญกับความไม่เท่าเทียมกันในการกระจายที่ซับซ้อนมากขึ้น: ฉันถามว่าความน่าจะเป็นที่จะถูกเลื่อนไปรอบ ๆ เพื่อให้ความไม่เท่าเทียมกันมากขึ้น ในฐานะที่เป็นฮิวริสติกแบบสัญชาตญาณมันมีประโยชน์ ด้วยการใช้วิธีการตามที่วางไว้ที่นี่ฉันสงสัยว่าทฤษฎีทั่วไปสำหรับการพิสูจน์ความไม่เท่าเทียมดังกล่าวสามารถเรียนรู้ได้ในระดับสูงด้วยรสชาติของพันธุ์ลูกผสมของแคลคูลัสของการแปรผันและเทคนิคการคูณตัวคูณ Lagrange
whuber

สมบูรณ์แบบ: คำตอบของคุณมีความสำคัญเพราะอธิบายเทคนิคทั่วไปที่สามารถใช้เพื่อจัดการกรณีอื่น ๆ อีกมากมาย
เซน

@whuber กล่าวว่า - "ฉันถามว่าความน่าจะเป็นที่สามารถเลื่อนไปรอบ ๆ เพื่อที่จะทำให้ความไม่เท่าเทียมที่รุนแรงมากขึ้น" - นี่เป็นวิธีธรรมชาติในการคิดเกี่ยวกับปัญหาดังกล่าว
Glen_b -Reinstate Monica

ดูเหมือนจะมีข้อผิดพลาดเล็กน้อยในการได้รับมา มันควรเป็นนอกจากนี้ไม่เท่ากับตั้งแต่ไม่เหมือนกับ[ ( μ - x ) ( x ) ] [ μ ] [ x ] - [ x 2 ] [ μ ] [
μ[x]-[x2]=μ(1-[1])[x]+([μ][x]-[x2]).
[(μ-x)(x)][μ][x]-[x2]μ [ x ][μ][x]μ[x]
Leo

13

ถ้าตัวแปรสุ่มจะมีการ จำกัดและเรารู้ว่าหมายถึง , ความแปรปรวนเป็นที่สิ้นสุดโดยMU-ก)μ = E [ X ] ( b - μ ) ( μ - a )[a,]μ=E[X](-μ)(μ-a)

ขอให้เราพิจารณากรณีที่ 1 หมายเหตุว่าทุก ,ทำไมยัง[X] การใช้ผลลัพธ์นี้ x [ 0 , 1 ] x 2x E [ X 2 ] E [ X ] σ 2 = E [ X 2 ] - ( E [ X ] 2 ) = E [ X 2 ] - μ 2μ - μ 2 = μ (a=0,=1x[0,1]x2xE[X2]E[X]

σ2=E[X2]-(E[X]2)=E[X2]-μ2μ-μ2=μ(1-μ).

ที่จะพูดคุยเพื่อช่วงกับพิจารณาจำกัด ให้b] กำหนดซึ่งถูก จำกัด ใน[0,1]เท่ากันและ โดยที่ความไม่เสมอภาคจะขึ้นอยู่กับผลลัพธ์แรก ตอนนี้โดยการแทนที่ , ขอบเขตที่ถูกผูกเท่ากับ ซึ่งเป็นผลลัพธ์ที่ต้องการb > a Y [ a , b ] X = Y - a[a,]>aY[a,] [0,1]Y=(b-a)X+aVar[Y]=(b-a)2Var[X](b-a)2μX(1-μX) μX=μY-aX=Y-a-a[0,1]Y=(-a)X+a

VaR[Y]=(-a)2VaR[X](-a)2μX(1-μX).
(b-a)2μX=μY-a-a
(-a)2μY-a-a(1-μY-a-a)=(-a)2μY-a-a-μY-a=(μY-a)(-μY),

8

ตามคำขอของ @ user603 ....

ที่มีประโยชน์บนผูกพันในความแปรปรวนของตัวแปรสุ่มที่จะใช้เวลาในค่าในที่มีความน่าจะเป็นคือ{4} หลักฐานสำหรับกรณีพิเศษ (ซึ่งเป็นสิ่งที่ OP ถามเกี่ยวกับ) สามารถพบได้ ที่นี่ใน math.SEและสามารถปรับให้เข้ากับกรณีทั่วไปได้ง่ายขึ้น ดังที่ระบุไว้ในความคิดเห็นของฉันด้านบนและในคำตอบที่อ้างถึงในที่นี้ตัวแปรสุ่มแบบแยกซึ่งใช้กับค่าและมีความน่าจะเป็นเท่ากับมีความแปรปรวนและไม่พบข้อ จำกัดทั่วไปที่เข้มงวดยิ่งขึ้น σ2[a,]1σ2(-a)24a=0,=1a12(-a)24

จุดอื่นที่ควรทราบคือตัวแปรสุ่มที่ล้อมรอบมีความแปรปรวนแน่นอนในขณะที่ตัวแปรสุ่มที่ไม่มีขอบเขตความแปรปรวนอาจไม่แน่นอนและในบางกรณีอาจไม่สามารถกำหนดได้ ตัวอย่างเช่น ไม่สามารถกำหนดค่าเฉลี่ยสำหรับตัวแปรสุ่มของ Cauchyและดังนั้นจึงไม่สามารถกำหนดค่าความแปรปรวนได้ (ตามความคาดหวังของการเบี่ยงเบนกำลังสองจากค่าเฉลี่ย)


นี่เป็นกรณีพิเศษของคำตอบของ @ Juho
Aksakal

มันเป็นเพียงความคิดเห็น แต่ฉันสามารถเพิ่มได้ว่าคำตอบนี้ไม่ตอบคำถามที่ถาม
Aksakal

@Aksakal ดังนั้น ??? Juho กำลังตอบคำถามที่แตกต่างออกไปเล็กน้อยและเมื่อเร็ว ๆ นี้ คำถามใหม่นี้ถูกรวมเข้ากับคำถามที่คุณเห็นด้านบนซึ่งฉันตอบไปสิบเดือนที่แล้ว
Dilip Sarwate

0

คุณแน่ใจหรือไม่ว่านี่เป็นความจริงโดยทั่วไป - สำหรับการแจกแจงแบบต่อเนื่องและแบบแยก คุณสามารถให้ลิงค์ไปยังหน้าอื่นได้หรือไม่? สำหรับการกระจายทั่วไปของมันเป็นเรื่องเล็กน้อยที่จะแสดงให้เห็นว่า ฉันสามารถจินตนาการได้ว่ามีความไม่เท่าเทียมที่คมชัดกว่านี้ ... คุณต้องการปัจจัยสำหรับผลลัพธ์ของคุณหรือไม่?V R ( X ) = E [ ( X - E [ X ] ) 2 ] E [ ( - ) 2 ] = ( - ) 2 1 / 4[a,]

VaR(X)=E[(X-E[X])2]E[(-a)2]=(-a)2.
1/4

ในทางกลับกันเราสามารถหาได้โดยใช้ตัวประกอบภายใต้ชื่อPopoviciu's_inequalityบนวิกิพีเดีย1/4

บทความนี้ดูดีกว่าบทความวิกิพีเดีย ...

สำหรับการแจกแจงแบบสม่ำเสมอมันถือได้ว่า

VaR(X)=(-a)212.

หน้านี้ระบุผลลัพธ์ด้วยจุดเริ่มต้นของการพิสูจน์ที่เกี่ยวข้องกับฉันมากเกินไปเนื่องจากดูเหมือนว่าต้องมีความเข้าใจใน "ทฤษฎีบทพื้นฐานของการโปรแกรมเชิงเส้น" sci.tech-archive.net/Archive/sci.math/2008-06/msg01239.html
Adam Russell

ขอบคุณสำหรับการตั้งชื่อ! "ความไม่เท่าเทียมของ Popoviciu" เป็นสิ่งที่ฉันต้องการ
Adam Russell

2
คำตอบนี้ทำให้คำแนะนำที่ไม่ถูกต้อง:ถูกต้องแน่นอน การอ้างอิงถึงความไม่เท่าเทียมของ Popoviciu จะใช้งานได้ แต่การพูดอย่างเคร่งครัดจะใช้เฉพาะกับการแจกแจงที่มีการสนับสนุนที่จำกัด (โดยเฉพาะอย่างยิ่งที่ไม่มีการแจกแจงแบบต่อเนื่อง) อาร์กิวเมนต์ที่ จำกัด จะทำเคล็ดลับ แต่จำเป็นต้องมีบางสิ่งเพิ่มเติมที่นี่ 1/4
whuber

2
การกระจายอย่างต่อเนื่องสามารถเข้าใกล้ discrete หนึ่ง (ในแง่ cdf) โดยพลการอย่างใกล้ชิด (เช่นสร้างความหนาแน่นอย่างต่อเนื่องจากที่ไม่ต่อเนื่องที่กำหนดโดยการวางเคอร์เนลรูปร่างเบต้าเล็กน้อย (4,4) - กึ่งกลางที่จุดศูนย์กลางแต่ละจุด และปล่อยให้ส่วนเบี่ยงเบนมาตรฐานของเคอร์เนลแต่ละตัวนั้นหดตัวเป็นศูนย์ในขณะที่รักษาพื้นที่ให้คงที่) ขอบเขตที่ไม่ต่อเนื่องดังที่กล่าวไว้ที่นี่จึงจะทำหน้าที่เป็นขอบเขตสำหรับการแจกแจงแบบต่อเนื่อง ฉันคาดหวังว่าคุณกำลังคิดเกี่ยวกับการแจกแจง unimodalอย่างต่อเนื่อง... ซึ่งมีขอบเขตที่แตกต่างกัน
Glen_b -Reinstate Monica

2
ดี ... คำตอบของฉันมีประโยชน์น้อยที่สุด แต่ฉันจะทิ้งไว้ที่นี่เนื่องจากความคิดเห็นที่ดี ไชโย, R
Ric
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.