ความแปรปรวนของผลผลิตของตัวแปรสุ่มที่สัมพันธ์กัน k


คำตอบ:


12

ข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อนี้มากกว่าที่คุณต้องการสามารถพบได้ในกู๊ดแมน (1962): "ความแปรปรวนของผลิตภัณฑ์ของตัวแปรสุ่ม K"ซึ่งได้มาจากสูตรสำหรับตัวแปรสุ่มอิสระและตัวแปรสุ่มที่มีความสัมพันธ์พร้อมกับการประมาณบางอย่าง ในบทความก่อนหน้านี้ ( Goodman, 1960 ) สูตรสำหรับผลิตภัณฑ์ของตัวแปรสุ่มสองตัวที่ได้รับมาซึ่งค่อนข้างง่ายกว่า (แม้ว่ายังค่อนข้างน่ารักมาก) ดังนั้นนั่นอาจเป็นจุดเริ่มต้นที่ดีกว่าถ้าคุณต้องการเข้าใจการสืบทอด .

เพื่อความสมบูรณ์แม้ว่ามันจะเป็นเช่นนี้

ตัวแปรสองตัว

สมมติว่าต่อไปนี้:

  • yxและเป็นตัวแปรสุ่มสองตัวy
  • YXและเป็นความคาดหวัง (ไม่เป็นศูนย์)Y
  • V ( y )V(x)และเป็นผลต่างV(y)
  • δ yδx=(xX)/X (และเช่นเดียวกันกับ )δy
  • Di,j=E[(δx)i(δy)j]
  • Δ yΔx=xX (และเช่นเดียวกันกับ )Δy
  • Ei,j=E[(Δx)i(Δy)j]
  • V ( x ) / X 2 G ( Y )G(x)คือสัมประสิทธิ์กำลังสองของการแปรผัน: (เช่นเดียวกันกับ )V(x)/X2G(Y)

จากนั้น: หรือเทียบเท่า:

V(xy)=(XY)2[G(y)+G(x)+2D1,1+2D1,2+2D2,1+D2,2D1,12]

V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12

มากกว่าสองตัวแปร

บทความ 1960 แสดงให้เห็นว่านี่เป็นแบบฝึกหัดสำหรับผู้อ่าน (ซึ่งดูเหมือนจะเป็นแรงบันดาลใจให้กับกระดาษ 2505!)

สัญกรณ์คล้ายกันโดยมีนามสกุลไม่กี่รายการ:

  • x y(x1,x2,xn)เป็นตัวแปรสุ่มแทนและxy
  • M=E(i=1kxi)
  • A=(M/i=1kXi)1
  • si = 0, 1, หรือ 2 สำหรับi=1,2,k
  • u = จำนวนของ 1 ใน(s1,s2,sk)
  • m = จำนวน 2 ใน(s1,s2,sk)
  • D(u,m)=2u2สำหรับและสำหรับ ,m=02um>1
  • C(s1,s2,,sk)=D(u,m)E(i=1kδxisi)
  • s1skหมายถึงการรวมชุดชุดโดยที่3kk1(s1,s2,sk)2m+u>1

จากนั้นในที่สุดก็นาน:

V(i=1kxi)=Xi2(s1skC(s1,s2sk)A2)

ดูเอกสารเพื่อดูรายละเอียดและการประมาณที่ง่ายขึ้นอีกเล็กน้อย!


โปรดทราบว่าคำตอบข้างต้นจาก Matt Krause มีข้อผิดพลาดเช่นเดียวกับกระดาษ ในคำจำกัดความของฟังก์ชั่น C (s1, ... , sk) มันควรจะเป็นผลิตภัณฑ์แทนที่จะเป็นผลรวม
Nicolas Gisler

คุณช่วยอธิบายเพิ่มเติมอีกหน่อย .. "เพราะฉัน - บุคคลนิรนามจากอินเทอร์เน็ต - พูดอย่างนั้น" ไม่ใช่คำตอบจริงๆ ...
ทิม

หากคุณพยายามที่จะรับค่าความแปรปรวน var (x * y) สำหรับตัวแปรสุ่มอิสระผ่านสูตรสำหรับการสุ่มคุณจะเห็นว่ามีเพียงผลิตภัณฑ์และไม่ใช่ผลรวมที่ให้คำตอบที่ถูกต้อง นอกจากนี้หากคุณดูกระดาษคุณสามารถดูได้เช่นกันในหน้า 59 ของกระดาษ (อย่างน้อยในรุ่นของฉัน) เขาใช้ผลิตภัณฑ์แทนผลรวม
Nicolas Gisler

1
สำหรับกรณีของตัวแปรสุ่มสองตัวสูตรที่ง่ายต่อการอ่านสำหรับความแปรปรวนของผลิตภัณฑ์ของตัวแปรสุ่มสองตัวที่สัมพันธ์กันสามารถพบได้ในคำตอบนี้โดย @macro คำตอบนี้ชี้ให้เห็นถึงปัญหาที่สำคัญในกล่าวคือ,ความหนาของสัญกรณ์ปกปิดความจริงที่สำคัญว่ามีเงื่อนไขในมันซึ่งไม่สามารถกำหนดมูลค่าเว้นแต่ว่าเรารู้ covหรือเพียงพอเกี่ยวกับความหนาแน่นร่วมของตัวแปรสุ่มสองตัวเพื่อกำหนดปริมาณนี้
V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12,
(x2,y2)
Dilip Sarwate

ข้อเสนอแนะการแก้ไขที่ควรได้รับความคิดเห็นแนะนำว่ากระดาษต้นฉบับที่มีการพิมพ์ผิดที่ผลรวมและผลิตภัณฑ์ที่ถูกผสมและคำตอบนี้ควรได้รับการแก้ไข ดูstats.stackexchange.com/review/suggested-edits/83662
Silverfish

4

เพียงเพิ่มคำตอบที่ยอดเยี่ยมของ Matt Krause (อันที่จริงสามารถสืบได้จากที่นั่น) ถ้า x, y เป็นอิสระแล้ว

E1,1=E[(xE[x])(yE[y])]=Cov(x,y)=0E1,2=E[(xE[x])(yE[y])2]=E[xE(x)]E[(yE[y])2]=(E[x]E[x])E[(yE[y])2]=0E2,1=0E2,2=E[(xE[x])2(yE[y])2]=E[(xE[x])2]E[(yE[y])2=V[x]V[y]V[xy]=E[x]2V[y]+E[y]2V[x]+V[x]V[y]

1
ผลสำหรับกรณีของตัวแปรสุ่มอิสระได้รับการกล่าวถึงที่นี่ n
Dilip Sarwate

3

นอกจากสูตรทั่วไปที่ให้โดย Matt อาจมีค่าเมื่อสังเกตว่ามีสูตรที่ค่อนข้างชัดเจนสำหรับตัวแปรสุ่มแบบเกาส์ที่มีค่าเฉลี่ยเป็นศูนย์ มันตามมาจากทฤษฎีบทของ Isserlisดูช่วงเวลาที่สูงขึ้นสำหรับการแจกแจงปกติหลายตัวแปรที่กึ่งกลาง

สมมติว่าดังต่อไปนี้การกระจายปกติหลายตัวแปรที่มีค่าเฉลี่ย 0 และแปรปรวนเมทริกซ์\หากจำนวนตัวแปรเป็นเลขคี่ และ โดยที่หมายถึงการรวมพาร์ติชันทั้งหมดของลงใน disjoint pairsในแต่ละเทอมเป็นผลิตภัณฑ์ ของสอดคล้องกันและ (x1,,xk)ΣkE(ixi)=0

V(ixi)=E(ixi2)=Σ~i,j
Σ{1,,2k}k{i,j}k Σ~i,j
Σ~=(ΣΣΣΣ)
เป็นเมทริกซ์ความแปรปรวนร่วมสำหรับx_k) ถ้าเป็นคู่, ในกรณีที่เราจะได้ ถ้าเราจะได้ ซึ่งมี 15 คำในผลรวม(x1,,xk,x1,,xk)k
V(ixi)=Σ~i,j(Σi,j)2.
k=2
V(x1x2)=Σ1,1Σ2,2+2(Σ1,2)2Σ1,22=Σ1,1Σ2,2+(Σ1,2)2.
k=3
V(x1x2x3)=Σi,jΣk,lΣr,t,

ในความเป็นจริงมันเป็นไปได้ที่จะใช้สูตรทั่วไป ส่วนที่ยากที่สุดคือการคำนวณพาร์ติชั่นที่ต้องการ ในการวิจัยนี้สามารถทำได้ด้วยฟังก์ชั่นจากแพคเกจsetparts partitionsการใช้แพ็คเกจนี้ไม่มีปัญหาในการสร้างพาร์ติชัน 2,027,025 สำหรับสามารถสร้างพาร์ติชัน 34,459,425 สำหรับได้ แต่ไม่สามารถสร้างพาร์ติชัน 654,729,075 สำหรับ (บนแล็ปท็อป 16 GB ของฉัน)k = 9 k = 10k=8k=9k=10

สองสิ่งอื่น ๆ ที่น่าสังเกต ข้อแรกสำหรับตัวแปรเกาส์ที่ไม่ได้เป็นศูนย์หมายความว่ามันเป็นไปได้ที่จะได้รับนิพจน์เช่นกันจากทฤษฎีบทของ Isserlis ประการที่สองมันไม่ชัดเจน (สำหรับฉัน) หากสูตรข้างต้นมีความทนทานต่อการเบี่ยงเบนจากภาวะปกตินั่นคือถ้ามันสามารถใช้เป็นการประมาณแม้ว่าตัวแปรจะไม่กระจายหลายตัวแปรตามปกติ ประการที่สามแม้ว่าสูตรด้านบนจะถูกต้อง แต่ก็เป็นที่สงสัยว่าความแปรปรวนบอกเกี่ยวกับการกระจายของผลิตภัณฑ์เป็นเท่าใด แม้แต่สำหรับการกระจายตัวของผลิตภัณฑ์ก็ค่อนข้าง leptokurtic และสำหรับใหญ่ขึ้นมันจะกลายเป็น leptokurtic อย่างรวดเร็วมากkk=2k


เรียบร้อยแล้ว! สำหรับสิ่งที่มีค่าสูตรในคำตอบของฉันยังมีการระเบิดแบบ combinatorial ด้วย: การรวมเหนือ C เกี่ยวข้องกับการรวมคำศัพท์O(3k)
Matt Krause
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.