ความแปรปรวนของผลผลิตของตัวแปรตาม


31

สูตรสำหรับความแปรปรวนของผลิตภัณฑ์ของตัวแปรตามคืออะไร

ในกรณีของตัวแปรอิสระสูตรนั้นง่าย:

var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2
แต่สูตรสำหรับตัวแปรที่เกี่ยวข้องคืออะไร

โดยวิธีการฉันจะค้นหาความสัมพันธ์ตามข้อมูลทางสถิติได้อย่างไร

คำตอบ:


32

โดยการใช้เอกลักษณ์ที่คุณคุ้นเคย

var(XY)=E(X2Y2)E(XY)2

ใช้สูตรอะนาล็อกเพื่อความแปรปรวนร่วม

E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)

และ

E(XY)2=[cov(X,Y)+E(X)E(Y)]2

ซึ่งหมายความว่าโดยทั่วไปแล้วสามารถเขียนเป็นvar(XY)

cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2

โปรดสังเกตว่าในกรณีที่เป็นอิสระและสิ่งนี้จะลดcov(X2,Y2)=cov(X,Y)=0

[var(X)+E(X)2][var(Y)+E(Y)2][E(X)E(Y)]2

และทั้งสองคำศัพท์จะถูกยกเลิกและคุณจะได้รับ[E(X)E(Y)]2

var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2

ตามที่คุณชี้ไป

แก้ไข:หากสิ่งที่คุณสังเกตเห็นคือและไม่ใช่XและYแยกกันฉันไม่คิดว่าจะมีวิธีให้คุณประมาณc o v ( X , Y )หรือc o v ( X 2 , Y 2 )ยกเว้น ในกรณีพิเศษ (ตัวอย่างเช่นถ้าX , Yมีวิธีการที่รู้จักนิรนัย )XYXYcov(X,Y)cov(X2,Y2)X,Y


2
ทำไมคุณใส่ [var (X) + E (X) 2] ⋅ [var (Y) + E (Y) 2] แทน E (X2) E (Y2) ???

1
@ user35458 ดังนั้นเขาสามารถจบลงด้วยสมการเป็นการแสดงออกของ var (X) และ var (Y) จึงเปรียบได้กับคำสั่งของ OP ขอให้สังเกตว่า E (X ^ 2) = Var (X) + E (X) ^ 2
Waldir Leoncio

2
เพื่อที่จะตอบสนอง (ออฟไลน์) กับความท้าทายที่ถูกลบไปแล้วในขณะนี้กับความถูกต้องของคำตอบนี้ฉันเปรียบเทียบผลลัพธ์กับการคำนวณโดยตรงความแปรปรวนของผลิตภัณฑ์ในแบบจำลองจำนวนมาก ไม่ใช่สูตรที่ใช้งานได้จริงหากคุณสามารถหลีกเลี่ยงได้เพราะมันอาจสูญเสียความแม่นยำอย่างมากผ่านการยกเลิกเพื่อลบคำที่มีขนาดใหญ่หนึ่งคำจากอีกคำหนึ่ง แต่นั่นไม่ใช่ประเด็น ข้อผิดพลาดประการหนึ่งที่ควรระวังคือคำถามนี้เกี่ยวข้องตัวแปรสุ่ม ผลลัพธ์นำไปใช้กับข้อมูลที่ให้คุณคำนวณความแปรปรวนและความแปรปรวนร่วมโดยใช้ตัวส่วนของแทนn - 1nn1 (ตามปกติสำหรับซอฟต์แวร์)
whuber

14

นี่เป็นภาคผนวกของคำตอบที่ดีมากของ @ Macro ซึ่งแสดงให้เห็นอย่างชัดเจนถึงสิ่งที่จำเป็นต้องทราบเพื่อกำหนดความแปรปรวนของผลิตภัณฑ์ของตัวแปรสุ่มสองตัวที่มีความสัมพันธ์กัน ตั้งแต่ โดยที่cov(X,Y),E[X],E[Y],E

(1)var(XY)=E[(XY)2](E[XY])2=E[(XY)2](cov(X,Y)+E[X]E[Y])2(2)=E[X2Y2](cov(X,Y)+E[X]E[Y])2(3)=(cov(X2,Y2)+E[X2]E[Y2])(cov(X,Y)+E[X]E[Y])2
cov(X,Y)E[X]E[Y]และ E [ Y 2 ]E[X2]E[Y2] สามารถสันนิษฐานได้ว่าเป็นปริมาณที่รู้กันเราต้องสามารถกำหนดค่าของ ใน( 2 )หรือcov ( X 2 , Y 2 )ใน( 3 ) นี้ไม่ใช่เรื่องง่ายที่จะทำในทั่วไป แต่เป็นแหลมออกแล้วถ้า XและYมีอิสระตัวแปรสุ่มแล้ว COV ( X ,E[X2Y2](2)cov(X2,Y2)(3)XY 0 ในความเป็นจริงการพึ่งพาอาศัยกันไม่มีความสัมพันธ์ (หรือขาดมัน) เป็นปัญหาสำคัญ ที่เรารู้ว่า cov ( X , Y )เท่ากับ 0 แทนค่าที่ไม่ใช่ศูนย์บางตัวไม่ช่วยตัวเองอย่างน้อยที่สุดในความพยายามของเราคือการหาค่าของ E [ X 2 Y 2 ]หรือ cov ( X 2 , Y 2 )แม้ว่ามันจะ cov(X,Y)=cov(X2,Y2)=0cov(X,Y)0E[X2Y2]cov(X2,Y2)ไม่ลดความซับซ้อนด้านขวาของและ( 3 )เล็ก ๆ น้อย ๆ(2)(3)

เมื่อและYเป็น ตัวแปรสุ่มขึ้นอยู่กับอย่างน้อยหนึ่งกรณีพิเศษ (ค่อนข้างธรรมดาหรือค่อนข้างสำคัญ) มันเป็นไปได้ที่จะหาค่าของE [ X 2 Y 2 ]ได้อย่างง่ายดายXYE[X2Y2]

สมมติว่าและYมีกันปกติตัวแปรสุ่มที่มีค่าสัมประสิทธิ์สหสัมพันธ์ρ จากนั้นปรับอากาศ ในX = xที่เงื่อนไขความหนาแน่นของYคือความหนาแน่นปกติที่มีค่าเฉลี่ย E [ Y ] + ρ XYρX=xYE[Y]+ρvar(Y)var(X)(xE[X])var(Y)(1ρ2)

E[X2Y2X]=X2E[Y2X]=X2[var(Y)(1ρ2)+(E[Y]+ρvar(Y)var(X)(XE[X]))2]
Xg(X)
(4)E[X2Y2]=E[E[X2Y2X]]=E[g(X)]
(4)X

ภาคผนวกเพิ่มเติม: ในคำตอบที่ถูกลบตอนนี้ @Hydrologist ให้ความแปรปรวนของ XY เช่น

(5)Var[xy]=(E[x])2Var[y]+(E[y])2Var[x]+2E[x]Cov[x,y2]+2E[y]Cov[x2,y]+2E[x]E[y]Cov[x,y]+Cov[x2,y2](Cov[x,y])2
and claims that this formula is from two papers published a half-century ago in JASA. This formula is an incorrect transcription of the results in the paper(s) cited by Hydrologist. Specifically, Cov[x2,y2] is a mistranscription of E[(xE[x])2(yE[y])2] in the journal article, and similarly for Cov[x2,y] and Cov[x,y2].

For the computation of E(X2Y2) in the joint normal case, also see math.stackexchange.com/questions/668641/…
Samuel Reid
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.