ทฤษฎีบทของเบย์ยึดถือความคาดหวังหรือไม่?


18

มันเป็นความจริงว่าสำหรับสองตัวแปรสุ่มและ ,ABB

E ( A B ) = E ( B A ) E ( A )E ( B ) ?

E(AB)=E(BA)E(A)E(B)?

3
อืม ... ฉันไม่คิดว่าทั้งสองฝ่ายนั้นเท่าเทียมกัน
จอน

6
ดังที่ได้กล่าวไว้ในคำตอบแล้วคำถามนี้ไม่มีความหมายที่น่าจะเป็นเพราะการรวมตัวของตัวแปรสุ่มในด้านหนึ่งนั่นคือตัวแปรปรับอากาศในอีกด้านหนึ่ง
ซีอาน

คำตอบ:


25

E [ A B ] ? = E [ B A ] E [ A ]E [ B ]

E[AB]=?E[BA]E[A]E[B](1)
ผลการคาดคะเน(1)(1)เป็นนิด ๆ จริงสำหรับอิสระตัวแปรสุ่มและBด้วยวิธีการที่ไม่ใช่ศูนย์AB

ถ้าE [ B ] = 0E[B]=0ดังนั้นด้านขวาของ( 1 )(1)เกี่ยวข้องกับการหารด้วย00และดังนั้น( 1 )(1)นั้นไม่มีความหมาย โปรดทราบว่าAAและBBเป็นอิสระหรือไม่นั้นไม่เกี่ยวข้อง

โดยทั่วไปแล้ว( 1 )(1)ไม่ได้มีไว้สำหรับตัวแปรสุ่มที่ขึ้นอยู่กับ แต่ตัวอย่างที่เฉพาะเจาะจงของAAและB ที่Bพึงพอใจ( 1 )(1)สามารถพบได้ โปรดทราบว่าเราต้องยืนยันต่อไปว่าE [ B ] 0E[B]0มิฉะนั้นทางด้านขวาของ( 1 )(1)นั้นไม่มีความหมาย จำไว้ว่าE [ A B ]E[AB]เป็นตัวแปรสุ่มที่เกิดขึ้นเป็นฟังก์ชั่นของตัวแปรสุ่มBBพูดg (B )g(B)ในขณะที่ E [ B | ]E[BA]เป็นตัวแปรสุ่มที่มีฟังก์ชั่นของตัวแปรสุ่มกล่าวว่าเอช( ) ดังนั้น ( 1 )จึงคล้ายกับการถามว่าAh(A)(1)

กรัม( B ) ? = h ( A ) E [ A ]E [ B ]

g(B)=?h(A)E[A]E[B](2)
สามารถเป็นข้อความจริงและเห็นได้ชัดว่าคำตอบคือg(B)g(B)ไม่สามารถเป็นหลายเท่าของh(A)h(A) โดยทั่วไป

สำหรับความรู้ของฉันมีเพียงสองกรณีพิเศษที่( 1 )(1)สามารถเก็บได้

  • ตามที่ระบุไว้ข้างต้นสำหรับอิสระตัวแปรสุ่มและB , G ( B )และเอช( )เป็นคนเลวตัวแปรสุ่ม (เรียกว่าค่าคงที่โดย folks ทางสถิติที่ไม่รู้หนังสือ) ที่เท่ากับE [ ]และE [ B ] ตามลำดับและดังนั้นหากE [ B ] 0เรามีความเท่าเทียมกันใน( 1 )ABg(B)h(A)E[A]E[B]E[B]0(1)

  • อีกด้านหนึ่งของสเปกตรัมจากความเป็นอิสระสมมติว่า A = g ( B )A=g(B)โดยที่g ( )g()เป็นฟังก์ชันกลับด้านดังนั้นA = g ( B )A=g(B)และB = g - 1 ( A )B=g1(A)เป็นตัวแปรสุ่มที่พึ่งพาทั้งหมด ในกรณีนี้ E [ | B ] = กรัม( B ) ,E [ B A ] = g - 1 ( A ) = g - 1 ( g ( B ) ) = B

    E[AB]=g(B),E[BA]=g1(A)=g1(g(B))=B
    และดังนั้น ( 1 )(1)กลายเป็น g ( B ) ? = B E [ A ]E [ B ]
    g(B)=?BE[A]E[B]
    ซึ่งถืออย่างแน่นอนเมื่อg(x)=αxg(x)=αxโดยที่ααสามารถเป็นจำนวนจริงใด ๆ ที่ไม่ใช่ศูนย์ ดังนั้น(1)(1)ถือเมื่อใดก็ตามที่AAเป็นสเกลาร์หลายตัวของBBและแน่นอนว่าE[B]E[B]จะต้องไม่ใช่ศูนย์ (เทียบกับคำตอบของ Michael Hardy) การพัฒนาข้างต้นแสดงให้เห็นว่าg(x)g(x)จะต้องเป็นฟังก์ชันเชิงเส้นและ (1)(1)ไม่สามารถเก็บเลียนแบบได้ฟังก์ชั่นG ( x ) = α x + βg(x)=αx+βกับβ β0 0 อย่างไรก็ตามโปรดทราบว่า Alecos Papadopolous ใน คำตอบของเขาและความคิดเห็นของเขาหลังจากนั้นอ้างว่าถ้าBB เป็นตัวแปรสุ่มปกติที่มีค่าเฉลี่ยไม่ใช่ศูนย์ดังนั้นสำหรับ ค่าเฉพาะของααและβ 0β0ที่เขาให้ A = α B + βA=αB+β และBBพอใจ( 1(1) ) ในความคิดของฉันตัวอย่างของเขาไม่ถูกต้อง

ในความคิดเห็นเกี่ยวกับคำตอบนี้ฮูเบอร์ได้แนะนำให้พิจารณาความเท่าเทียมกันที่สมมาตรสมมาตร E [ A B ] E [ B ] ? = E [ B A ] E [ A ]

E[AB]E[B]=?E[BA]E[A](3)
ซึ่งแน่นอนเสมอสำหรับตัวแปรสุ่มอิสระโดยไม่คำนึงถึงค่าของ E [ A ]E[A]และE [ B ]E[B]และสำหรับสเกลาร์A = α BA=αBเช่นกัน แน่นอนมากขึ้นเล็กน้อย( 3 )(3) ถือใด ๆ ที่ เป็นศูนย์หมายถึงตัวแปรสุ่มและB (อิสระหรือขึ้นอยู่กับหลายเกลาหรือไม่มันไม่ได้เรื่อง!): E [ ] = E [ B ] = 0จะเพียงพอเพื่อความเท่าเทียมกันใน( 3 ) ดังนั้น( 3 )อาจไม่น่าสนใจเท่ากับ( 1 )เป็นหัวข้อสำหรับการสนทนาABE[A]=E[B]=0 (3)(3)(1)

9
+1 หากต้องการให้มีความใจกว้างคำถามสามารถตีความได้ว่าถามว่าE ( A | B ) E ( B ) = E ( B | A ) E ( A )หรือไม่ซึ่งคำถามของการหารโดยศูนย์หายไป E(A|B)E(B)=E(B|A)E(A)
whuber

1
@whuber ขอบคุณ ฉันแก้ไขที่อยู่ที่คำถามทั่วไปมากขึ้นเป็นไปได้ว่ามันเป็นไปได้ที่จะมีE [ | B ] E [ B ] = E [ B | ] E [ ] E[AB]E[B]=E[BA]E[A]
Dilip Sarwate

11

ผลที่ได้ไม่เป็นความจริงโดยทั่วไปให้เราเห็นว่าในตัวอย่างง่ายๆ ให้X P = pมีการแจกแจงแบบทวินามพร้อมพารามิเตอร์n , pและPมีการแจกแจงแบบเบตากับพารามิเตอร์( α , β )นั่นคือแบบจำลองแบบเบส์ที่มีคอนจูเกตก่อน ตอนนี้เพียงแค่คำนวณสูตรสองด้านของคุณทางซ้ายมือคือE X P = n Pในขณะที่ด้านขวามือคือ E ( P X ) E XXP=pn,pP(α,β)EXP=nPE P=α+Xn + α + β α/(α+β)n α / ( α + β ) และแน่นอนไม่เท่ากัน

E(PX)EXEP=α+Xn+α+βα/(α+β)nα/(α+β)

2

ค่าที่คาดหวังแบบมีเงื่อนไขของตัวแปรสุ่มA ที่ให้ไว้กับเหตุการณ์ที่B = bเป็นตัวเลขที่ขึ้นอยู่กับว่าหมายเลขbคืออะไร ดังนั้นเรียกว่าเอช( ) จากนั้นคาดว่าจะมีเงื่อนไขค่าE ( | B )เป็นชั่วโมง( B ) ,ตัวแปรสุ่มที่มีค่าจะถูกกำหนดอย่างสมบูรณ์โดยค่าของตัวแปรสุ่มB ดังนั้นE ( A B )เป็นฟังก์ชันของBและE (AB=bbh(b).E(AB)h(B),BE(AB)BBA)E(BA) is a function of AA.

The quotient E(A)/E(B)E(A)/E(B) is just a number.

So one side of your proposed equality is determined by AA and the other by BB, so they cannot generally be equal.

(Perhaps I should add that they can be equal in the trivial case when the values of AA and BB determine each other, as when for example, A=αB,α0A=αB,α0 and E[B]0E[B]0, when E[AB]=αB=E[BA]α=E[BA]αE[B]E[B]=E[BA]E[A]E[B].

E[AB]=αB=E[BA]α=E[BA]αE[B]E[B]=E[BA]E[A]E[B].
But functions equal to each other only at a few points are not equal.)

You mean they are not necessarily equal? I mean they CAN be equal?
BCLC

1
@BCLC : They are equal only in trivial cases. And two functions equal to each other at some points and not at others are not equal.
Michael Hardy

2
"But only in that trivial case can they be equal" (emphasis added) is not quite correct. Consider independent AA and BB with E[B]0E[B]0. Then, E[AB]=E[A]E[AB]=E[A] while E[BA]=E[B] and so E[BA]E[A]E[B]=E[B]E[A]E[B]=E[A]=E[AB].
Dilip Sarwate

@DilipSarwate I was about to say that haha!
BCLC

I edited your answer to add a few details for the case you pointed out. Please roll back if you don't like the changes.
Dilip Sarwate

-1

The expression certainly does not hold in general. For the fun of it, I show below that if A and B follow jointly a bivariate normal distribution, and have non-zero means, the result will hold if the two variables are linear functions of each other and have the same coefficient of variation (the ratio of standard deviation over mean) in absolute terms.

For jointly normals we have

E(AB)=μA+ρσAσB(BμB)

and we want to impose

μA+ρσAσB(BμB)=[μB+ρσBσA(AμA)]μAμB

μA+ρσAσB(BμB)=μA+ρσBσAμAμB(AμA)

Simplify μA and then ρ, and re-arrange to get

B=μB+σ2Bσ2AμAμB(AμA)

So this is the linear relationship that must hold between the two variables (so they are certainly dependent, with correlation coefficient equal to unity in absolute terms) in order to get the desired equality. What it implies?

First, it must also be satisfied that

E(B)μB=μB+σ2Bσ2AμAμB(E(A)μA)μB=μB

so no other restirction is imposed on the mean of B ( or of A) except of them being non-zero. Also a relation for the variance must be satisfied,

Var(B)σ2B=(σ2Bσ2AμAμB)2Var(A)

(σ2A)2σ2B=(σ2B)2σ2A(μAμB)2

(σAμA)2=(σBμB)2(cvA)2=(cvB)2

|cvA|=|cvB|

which was to be shown.

Note that equality of the coefficient of variation in absolute terms, allows the variables to have different variances, and also, one to have positive mean and the other negative.


1
Isn't this a convoluted way to A=αB where α is some scalar?
Matthew Gunn

1
@MatthewGunn Your comment is right on target. Normality has nothing to do with the matter. For random variables A and B such that A=αB, E[AB]=αB=A and similarly, E[BA]=B. Consequently, assuming that E[B]0, E[AB]=αB=E[BA]α=E[BA]αE[B]E[B]=E[BA]E[A]E[B].
No normality, no |cvA|=|cvB| etc, and actually just a rehash of a comment in Michael Hardy's answer.
Dilip Sarwate

If you write \text{Var} instaed of \operatorname{Var} then you'll see aVarX and aVar(X) instead of aVarX and aVar(X). That's why the latter is standard usage.
Michael Hardy

@MatthewGun It seems to me that providing answers that contain specific examples is considered valuable content in this site. So yes, when a random variable is an affine function of another, and they are jointly normal with non-zero means, then one needs to have equal coefficients of variation, while, also there are no restrictions on the means of these rv's. On the other hand, when a random variable is just a linear function of another, the relation holds always. So no my answer is not a convoluted way to say A=aB. (cc:@DilipSarwate)
Alecos Papadopoulos

2
If B is a non-normal random variable with E[B]=μB0 and A=cB+d (and so B=Adc), then E[AB]=cB+d=A,E[BA]=Adc=B.
Now, if we want to have E[AB]=cB+d to equal E[BA]μAμB=BμAμB, it must be that cB+d=BμAμBd=0,c=μAμB
and so A=cB=μAμBB. So, for nonnormal B, the OP's conjectured result holds if A=cB but not if A=cB+d,d0.Of course, as you have proved, the result holds for normal random variables if A=cB+d,d0 .
Dilip Sarwate
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.