ตัวแปรสุ่มแบบสม่ำเสมอเป็นผลรวมของตัวแปรสุ่มสองตัว


18

นำมาจากGrimmet และ Stirzaker :

แสดงว่าไม่สามารถเป็นกรณีที่U = X + YU=X+Yที่มีการกระจายอย่างสม่ำเสมอบน [0,1] และและมีความเป็นอิสระและกระจายตัวเหมือนกัน คุณไม่ควรสรุปว่า X และ Y เป็นตัวแปรต่อเนื่องคุณUX XYY

หลักฐานที่เรียบง่ายโดยขัดแย้งพอเพียงสำหรับกรณีที่ ,ถูกสมมติว่าไม่ต่อเนื่องโดยการโต้เถียงว่าเป็นไปได้เสมอที่จะหาและเช่นนั้นในขณะที่')X XY Yu uu u P ( U u + u ) P ( U u ) P(Uu+u)P(Uu)P ( X + Y u ) = P ( X + Y u + u )P(X+Yu)=P(X+Yu+u)

อย่างไรก็ตามหลักฐานนี้ไม่ได้ขยายไปถึงอย่างต่อเนื่องหรือเป็นเอกพจน์อย่างต่อเนื่อง คำแนะนำ / ความคิดเห็น / คำติชม?X , YX,Y


3
คำแนะนำ : ฟังก์ชั่นลักษณะเป็นเพื่อนของคุณ
พระคาร์ดินัล

1
X และ Y เป็น iid ดังนั้นฟังก์ชั่นลักษณะต้องเหมือนกัน คุณจำเป็นต้องใช้ฟังก์ชั่นคุณสมบัติไม่ใช่ฟังก์ชั่นสร้างช่วงเวลา - mgf ไม่รับประกันว่าจะมีอยู่สำหรับ X ดังนั้นการแสดง mgf มีคุณสมบัติที่เป็นไปไม่ได้ไม่ได้หมายความว่าไม่มี X เช่นนั้น RV ทั้งหมดมีฟังก์ชั่นพิเศษ ดังนั้นหากคุณแสดงให้เห็นว่ามีคุณสมบัติที่เป็นไปไม่ได้ดังนั้นจึงไม่มี X ดังกล่าว
Silverfish

1
หากการแจกแจงของXXและYYมีอะตอมใด ๆให้บอกว่าP { X = a } = P { Y = a } = b > 0P{X=a}=P{Y=a}=b>0ดังนั้นP { X + Y = 2 a } b 2 > 0P{X+Y=2a}b2>0และX + YX+Yไม่สามารถกระจายอย่างสม่ำเสมอใน[ 0 , 1 ][0,1]. ดังนั้นจึงไม่จำเป็นที่จะต้องพิจารณากรณีของการแจกแจงของXXและY ที่Yมีอะตอม
Dilip Sarwate

คำตอบ:


13

ผลที่ได้สามารถพิสูจน์ได้ด้วยภาพ:พื้นที่สีเทาที่มองเห็นได้แสดงให้เห็นว่าการกระจายตัวแบบไม่สามารถสลายตัวเป็นผลรวมของตัวแปรอิสระที่กระจายตัวเหมือนกันสองตัว

เอกสาร

ให้XXและYYเป็นคนแบบนั้น X + YX+ Yมีการกระจายเครื่องแบบ [ 0 , 1[ 0 , 1 ] ] ซึ่งหมายความว่าสำหรับ 0 a b 10 a b 1ทั้งหมด

Pr ( < X + Y ) = B -

Pr ( a < X+ Y) = B -

การสนับสนุนที่สำคัญของการแจกแจงร่วมของXXและYYคือ[ 0 , 1 / 2 ][ 0 , 1 / 2 ] (สำหรับมิฉะนั้นจะมีความน่าจะเป็นในแง่บวกว่า X + YX+ Yอยู่นอก [ 0 , 1 ][ 0 , 1 ] )

ภาพ

Let 0 < ε < 1 /0 < ε < 1 / 4 4 พิจารณาแผนภาพนี้แสดงให้เห็นว่าการคำนวณหาผลรวมของตัวแปรสุ่ม:

รูป

การกระจายความน่าจะเป็นพื้นฐานที่เป็นหนึ่งที่ร่วมกัน( X , Y ) ความน่าจะเป็นของเหตุการณ์ใด ๆที่< X + Y bถูกกำหนดโดยความน่าจะเป็นทั้งหมดที่ครอบคลุมโดยแถบเส้นทแยงมุมยืดระหว่างบรรทัดx + y = aและx + y = b( X, วาย)a < X+ Ybx + y= ax + y= b Bมีการแสดงสามแถบดังกล่าว: จาก0ถึงϵปรากฏเป็นรูปสามเหลี่ยมสีน้ำเงินเล็ก ๆ ที่ด้านซ้ายล่าง จาก1 / 2 - εไป1 / 20ε1 / 2 - ε+ ϵแสดงเป็นรูปสี่เหลี่ยมผืนผ้าสีเทาต่อยอดด้วยรูปสามเหลี่ยมสองรูป (สีเหลืองและสีเขียว) และจาก 1 - ϵถึง 1ปรากฏเป็นรูปสามเหลี่ยมสีแดงขนาดเล็กที่มุมขวาบน1 / 2 + ε1 - ϵ1

ภาพแสดงให้เห็นอะไร

เมื่อเปรียบเทียบสามเหลี่ยมล่างซ้ายในรูปภาพกับสี่เหลี่ยมจัตุรัสล่างซ้ายที่มีและใช้ประโยชน์จากสมมติฐาน iid สำหรับXและYจะเห็นได้ว่าXY

ϵ = Pr ( X + Y ϵ ) < Pr ( X ϵ ) Pr ( Y ε ) = Pr ( X ε ) 2

ϵ = Pr (X+Yϵ ) < Pr (Xϵ)Pr(Yϵ)=Pr(Xϵ)2.

โปรดทราบว่าความไม่เท่าเทียมนั้นเข้มงวด: ความเป็นไปไม่ได้เพราะมีความเป็นไปได้ในเชิงบวกบางประการที่ทั้งXXและYน้อยกว่าεแต่อย่างไรก็ตามX + Y > εYϵX+Y>ϵ

ในทำนองเดียวกันการเปรียบเทียบสามเหลี่ยมสีแดงกับสี่เหลี่ยมที่มุมขวาบน

ϵ = Pr ( X + Y > 1 - ϵ ) < Pr ( X > 1 / 2 - ε ) 2

ϵ=Pr(X+Y>1ϵ)<Pr(X>1/2ϵ)2.

ในที่สุดการเปรียบเทียบสามเหลี่ยมสองรูปแบบที่ตรงกันข้ามในด้านบนซ้ายและขวาล่างกับแถบเส้นทแยงมุมที่มีความไม่เท่าเทียมกันอีกอัน

2 ε < 2 Pr ( X ε ) Pr ( X > 1 / 2 - ε ) < Pr ( 1 / 2 - ε < X + Y1 / 2 + ε ) = 2 ε

2ϵ<2Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)=2ϵ.

ensues ความไม่เท่าเทียมกันครั้งแรกจากก่อนหน้านี้สอง (ใช้รากที่สองของพวกเขาและพวกเขาคูณ) ในขณะที่คนที่สองอธิบาย (เข้มงวด) รวมของรูปสามเหลี่ยมที่อยู่ภายในวงและความเสมอภาคที่ผ่านมาเป็นการแสดงออกถึงความสม่ำเสมอของX + Y สรุปได้ว่า2 ϵ < 2X+Y εขัดแย้งพิสูจน์เช่น Xและ Yไม่สามารถอยู่QED2ϵ<2ϵXY


3
(+1) ฉันชอบวิธีนี้ การกู้คืนด้านหลังซองจดหมายของฉันจากตะกร้ากระดาษทิ้งฉันสามารถเห็นฉันวาดไดอะแกรมเดียวกันยกเว้นว่าฉันไม่ได้ทำเครื่องหมายบนสามเหลี่ยมสีเหลืองและสีเขียวภายในวง ฉันได้รับความไม่เท่าเทียมกันสำหรับสามเหลี่ยมสีน้ำเงินและสีแดง ฉันเล่นกับพวกเขาและความน่าจะเป็นอื่น ๆ สองสามอย่าง แต่ไม่เคยคิดที่จะตรวจสอบความน่าจะเป็นของแถบซึ่งเป็นขั้นตอนที่สำคัญยิ่ง ฉันสงสัยว่ากระบวนการคิดใดที่อาจกระตุ้นความเข้าใจนี้
Silverfish

ในความเป็นจริงที่ @whuber มีรูปสามเหลี่ยมสีเหลืองและสีเขียวฉันวาดรูปสี่เหลี่ยมจัตุรัส (ฉันแยกย่อยได้อย่างมีประสิทธิภาพ[ 0 , 0.5 ] 2ลงในตาราง) มองไปที่ขั้นตอนที่ "อธิบาย (เข้มงวด) รวมของรูปสามเหลี่ยมภายในวง" 2 พีอาร์( X ε ) Pr ( X > 1 / 2 - ε ) < Pr ( 1 / 2 - ε < X + Y [0,0.5]2 1 / 2 + ε )2Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)ฉันสงสัยว่าจริง ๆ แล้วสิ่งนี้จะเป็นธรรมชาติมากขึ้นทางเรขาคณิตกับสี่เหลี่ยมที่กำหนดวงดนตรีมากกว่าสามเหลี่ยม?
Silverfish

1
@ เงินฉันนึกถึงการวิเคราะห์ผลรวมของการแจกแจงเครื่องแบบที่ฉันโพสต์เมื่อสองสามปีที่แล้ว ที่แนะนำให้เห็นภาพผลรวมX + Yทางเรขาคณิต มันเห็นได้ชัดทันทีว่าจำนวนมากของความน่าจะต้องมีความเข้มข้นใกล้มุม( 0 , 0 )และ( 1 / 2 , 1 / 2 )เพื่อให้ผลรวมที่จะเป็นเครื่องแบบและความน่าจะเป็นค่อนข้างน้อยที่จะอยู่ใกล้เส้นทแยงมุมศูนย์X + YX+Y(0,0)(1/2,1/2) = 1 / 2 นั่นนำไปสู่แผนภาพซึ่งฉันวาดในMathematicaX+Y=1/2ณ จุดนั้นคำตอบที่เขียนเอง ใช่การใช้ช่องสี่เหลี่ยมในวงกลางอาจจะเป็นแบบทวีคูณ
whuber

ขอบคุณ! "โปรดทราบว่าอสมการเข้มงวด: ความเท่าเทียมกันเป็นไปไม่ได้เพราะมีบางอย่างที่น่าจะเป็นในแง่บวกว่าอย่างใดอย่างหนึ่ง XหรือYน้อยกว่าεแต่อย่างไรก็ตามX + Y > ε ." ฉันไม่แน่ใจว่าฉันทำตามนี้ ดูเหมือนว่าฉันจะมีจุดมุ่งหมายที่นี่เพื่อแสดงPr ( X + Y ϵ ) < Pr ( X ϵ Y ϵ )ไม่จำเป็นต้องมีความน่าจะเป็นเชิงบวกสำหรับเหตุการณ์Aที่ทั้งXและXXYϵX+Y>ϵPr(X+Yϵ)<Pr(XϵYϵ)A XYน้อยกว่าหรือเท่ากับ ϵYϵและยังX + Y > ϵ ? มันเป็น "อย่างใดอย่างหนึ่ง" กับ "ทั้งสอง" ฉันกำลังจะพ้นไป X+Y>ϵ
Silverfish

@Silverfish ขอบคุณ; ฉันไม่ได้พูดอย่างนั้นตามที่ตั้งใจไว้ คุณถูกต้อง: ภาษามีวัตถุประสงค์เพื่ออธิบายส่วนของสี่เหลี่ยมจัตุรัสเล็ก ๆ ที่ไม่ได้อยู่ในรูปสามเหลี่ยม
whuber

10

ฉันพยายามหาหลักฐานโดยไม่คำนึงถึงฟังก์ชั่นพิเศษ Kurtosis ส่วนเกินทำเคล็ดลับ ต่อไปนี้เป็นคำตอบสองบรรทัด: Kurt ( U ) = Kurt ( X + Y ) = Kurt ( X ) / 2เนื่องจากXและYเป็น iid จากนั้น เคิร์ต( U ) = - 1.2หมายถึงเคิร์ต( X ) = - 2.4ซึ่งเป็นความขัดแย้งเป็นเคิร์ต( X )Kurt(U)=Kurt(X+Y)=Kurt(X)/2XYKurt(U)=1.2Kurt(X)=2.4- 2สำหรับตัวแปรสุ่มใด ๆKurt(X)2

สิ่งที่น่าสนใจมากกว่านั้นคือเหตุผลที่ทำให้ฉันถึงจุดนั้น X (และY ) จะต้องมีขอบเขตระหว่าง 0 ถึง 0.5 - มีความชัดเจนมาก แต่เป็นประโยชน์หมายถึงช่วงเวลาและช่วงเวลาส่วนกลาง เริ่มจากการพิจารณาค่าเฉลี่ยและความแปรปรวน: E ( U ) = 0.5และVar ( U ) = 1XYE(U)=0.512 . ถ้าXและYมีการกระจายเหมือนกันเรามี:Var(U)=112XY

E ( X + Y ) = E ( X ) + E ( Y ) = 2 E ( X ) = 0.5

E(X+Y)=E(X)+E(Y)=2E(X)=0.5

ดังนั้นE ( X ) = 0.25 สำหรับความแปรปรวนที่เรายังต้องใช้ความเป็นอิสระในการใช้:E(X)=0.25

Var ( X + Y ) = Var ( X ) + Var ( Y ) = 2 Var ( X ) = 112

Var(X+Y)=Var(X)+Var(Y)=2Var(X)=112

ดังนั้นVar ( X ) = 124และσX=1Var(X)=1242 60.204 ว้าว! นั่นคือความแตกต่างมากมายสำหรับตัวแปรสุ่มที่การสนับสนุนอยู่ในช่วงตั้งแต่ 0 ถึง 0.5 แต่เราควรคาดหวังว่าเนื่องจากค่าเบี่ยงเบนมาตรฐานจะไม่ขยายในลักษณะเดียวกันกับที่ค่าเฉลี่ยได้σX=1260.204

ทีนี้ค่าเบี่ยงเบนมาตรฐานที่ใหญ่ที่สุดที่ตัวแปรสุ่มสามารถมีได้ถ้าค่าที่เล็กที่สุดที่สามารถใช้ได้คือ 0, ค่าที่ใหญ่ที่สุดที่สามารถใช้ได้คือ 0.5 และค่าเฉลี่ยคือ 0.25? การรวบรวมความน่าจะเป็นทั้งหมดที่มวลสองจุดบนสุดขั้ว 0.25 ห่างจากค่าเฉลี่ยจะให้ค่าเบี่ยงเบนมาตรฐานอย่างชัดเจน 0.25 ดังนั้นσ Xของเรามีขนาดใหญ่ แต่ไม่เป็นไปไม่ได้ (ฉันหวังว่าจะแสดงให้เห็นว่าสิ่งนี้บ่งบอกถึงความน่าจะเป็นที่มากเกินไปที่จะอยู่ในหางเพื่อให้X + Yเหมือนกัน แต่ฉันไม่สามารถไปไหนมาไหนได้ที่ด้านหลังของซองจดหมาย)σXX+Y

การพิจารณาช่วงเวลาที่สองเกือบทำให้ข้อ จำกัด ที่เป็นไปไม่ได้บนXดังนั้นลองพิจารณาช่วงเวลาที่สูงขึ้น สิ่งที่เกี่ยวกับค่าสัมประสิทธิ์เพียร์สันของเบ้ , แกมมา1 = E ( X - μ X ) 3Xσ 3 X =κ3κ 3 / 2 2 ? นี้มีอยู่ตั้งแต่ช่วงเวลากลางอยู่และσX0 มันจะช่วยให้ทราบคุณสมบัติบางอย่างของ cumulants โดยเฉพาะอย่างยิ่งการใช้ความเป็นอิสระและจากนั้นการกระจายที่เหมือนกันให้:γ1=E(XμX)3σ3X=κ3κ3/22σX0

κi(U)=κi(X+Y)=κi(X)+κi(Y)=2κi(X)

κi(U)=κi(X+Y)=κi(X)+κi(Y)=2κi(X)

This additivity property is precisely the generalisation of how we dealt with the mean and variance above - indeed, the first and second cumulants are just κ1=μκ1=μ and κ2=σ2κ2=σ2.

Then κ3(U)=2κ3(X)κ3(U)=2κ3(X) and (κ2(U))3/2=(2κ2(X))3/2=23/2(κ2(X))3/2(κ2(U))3/2=(2κ2(X))3/2=23/2(κ2(X))3/2. The fraction for γ1γ1 cancels to yield Skew(U)=Skew(X+Y)=Skew(X)/2Skew(U)=Skew(X+Y)=Skew(X)/2. Since the uniform distribution has zero skewness, so does XX, but I can't see how a contradiction arises from this restriction.

So instead, let's try the excess kurtosis, γ2=κ4κ22=E(XμX)4σ4X3γ2=κ4κ22=E(XμX)4σ4X3. By a similar argument (this question is self-study, so try it!), we can show this exists and obeys:

Kurt(U)=Kurt(X+Y)=Kurt(X)/2

Kurt(U)=Kurt(X+Y)=Kurt(X)/2

The uniform distribution has excess kurtosis 1.21.2 so we require XX to have excess kurtosis 2.42.4. But the smallest possible excess kurtosis is 22, which is achieved by the Binomial(1,12)Binomial(1,12) Bernoulli distribution.


2
(+1) This is a quite clever approach, which was new to me. Thanks. Note that some of your analysis could have been streamlined by considering a uniform centered at zero. (The equivalence of the problem is immediate.) That would have immediately told you that considering skew was a dead-end.
cardinal

@cardinal: I knew the skew was a dead-end before I worked on it. The purpose was expository: it's a self-study question so I didn't want to solve it in full! Rather I wanted to leave a hint on how to deal with the next level up...
Silverfish

@cardinal: I was in two minds whether to center or not. I did back-of-envelope calculations more conveniently, but in the final analysis we just need (1) a simple case of the general result that Kurt(X1+...+Xn)=1nKurt(X)Kurt(X1+...+Xn)=1nKurt(X) for iid XiXi, (2) that Kurt(U)=1.2Kurt(U)=1.2 for any uniform distribution, and (3) Kurt(X)Kurt(X) exists since XX is bounded and σX0σX0 (which is trivial, else σU=0σU=0). So none of the key results actually required centering, though bits may have looked less ugly!
Silverfish

Yes, the word "streamlined" was carefully chosen. :-) I did not intend my comment to be read as criticism of your exposition. Cheers.
cardinal

@cardinal Incidentally, variance considerations alone almost worked, but the uniform isn't quite spread out enough. With a bit more probability mass nearer the extremes, e.g. fT(t)=12t2fT(t)=12t2 on [-0.5, 0.5], then Var(T)=.15Var(T)=.15 and if T=X1+X2T=X1+X2 then σX=.15/20.27>0.25σX=.15/20.27>0.25 which is impossible as XX is bounded by -0.25 and 0.25. Of course, you will see immediately how this relates to the present example! I wonder if the approach generalises, I'm sure other bounded RVs can't be decomposed into sums but require even higher moments investigated to find the contradiction.
Silverfish
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.