คำอธิบายที่เข้าใจง่ายของการมีส่วนร่วมกับผลรวมของตัวแปรสุ่มแบบกระจายสองตัว


16

ถ้าฉันมีตัวแปรสุ่มอิสระแบบกระจายสองตัวคือXและYด้วยค่าเฉลี่ยμXและμYและส่วนเบี่ยงเบนมาตรฐานσXและσYและฉันค้นพบว่าX+Y=cดังนั้น (สมมติว่าฉันไม่ได้ทำผิดพลาด) การแจกแจงแบบมีเงื่อนไข ของXและYได้รับcจะกระจายตามปกติด้วย μY| c=μY+(c-μX-μY)σ 2 Y

μX|c=μX+(cμXμY)σX2σX2+σY2
และค่าเบี่ยงเบนมาตรฐาน σX| c=σY| c=
μY|c=μY+(cμXμY)σY2σX2+σY2
σX|c=σY|c=σX2σY2σX2+σY2.

ไม่น่าแปลกใจที่การเบี่ยงเบนมาตรฐานตามเงื่อนไขนั้นเหมือนกับกำหนดหากใครขึ้นไปอีกคนหนึ่งจะต้องลงมาด้วยจำนวนเดียวกัน เป็นที่น่าสนใจว่าค่าเบี่ยงเบนมาตรฐานตามเงื่อนไขไม่ได้ขึ้นอยู่กับcc

สิ่งที่ฉันไม่สามารถหาได้จากหัวของฉันคือเงื่อนไขแบบมีเงื่อนไขซึ่งพวกเขารับส่วนแบ่งจากส่วนเกินตามสัดส่วนของความแปรปรวนดั้งเดิมไม่ใช่ส่วนเบี่ยงเบนมาตรฐานดั้งเดิม (cμXμY)

ตัวอย่างเช่นหากพวกเขามีค่าเฉลี่ยเป็นศูนย์และส่วนเบี่ยงเบนมาตรฐานσ X = 3และσ Y = 1ดังนั้นเงื่อนไขในc = 4เราจะมีE [ X | c = 4 ] = 3.6และE [ Y | c = 4 ] = 0.4 , คือในอัตราส่วน9แม้ว่าฉันจะคิดอย่างหยั่งรู้ว่าอัตราส่วน3μX=μY=0σX=3σY=1c=4E[X|c=4]=3.6E[Y|c=4]=0.49:13:1จะเป็นธรรมชาติมากกว่า ทุกคนสามารถให้คำอธิบายที่เข้าใจง่ายสำหรับเรื่องนี้ได้หรือไม่?

สิ่งนี้ถูกกระตุ้นโดยคำถาม Math.SE

คำตอบ:


16

คำถามลดลงอย่างรวดเร็วในกรณีโดยดูที่X - μ XและY - μ YμX=μY=0XμXYμY Y

เห็นได้ชัดว่าการแจกแจงเงื่อนไขเป็นปกติ ดังนั้นค่าเฉลี่ยมัธยฐานและโหมดของแต่ละคนจึงเหมือนกัน โหมดจะเกิดขึ้นที่พิกัดของท้องถิ่นสุดของรูปแบบไฟล์ PDF bivariate ของและYบีบบังคับให้โค้งกรัม( x , Y ) = x + Y = C สิ่งนี้แสดงถึงรูปร่างของ PDF แบบแปรสภาพที่ตำแหน่งนี้และเส้นโค้งข้อ จำกัด มีแทนเจนต์ขนาน (นี่คือทฤษฏีของตัวคูณลากรองจ์) เนื่องจากสมการของรูปร่างใด ๆ อยู่ในรูปแบบf ( x , y ) = x 2 / ( 2XYg(x,y)=x+y=cสำหรับบางคนคง ρ (นั่นคือรูปทรงทั้งหมดเป็นวงรี), การไล่ระดับสีของพวกเขาจะต้องขนานไหนมีอยู่ λดังกล่าวว่าf(x,y)=x2/(2σX2)+y2/(2σY2)=ρρλ

(xσX2,yσY2)=f(x,y)=λg(x,y)=λ(1,1).

enter image description here

มันจะตามมาทันทีว่าโหมดของการแจกแจงแบบมีเงื่อนไข (และด้วยวิธีการ) จะถูกกำหนดโดยอัตราส่วนของความแปรปรวนไม่ใช่ของ SDs

XY


มันน่าประทับใจมากและค่อนข้างสมบูรณ์กว่าที่ฉันเคยถาม ฉันจะได้รับความพึงพอใจกับแผนภาพและคำสั่งที่แทนเจนต์กับวงรีไม่ผ่านจุดศูนย์กลางของวงรีดังนั้นจุดสีแดงแทนเจนต์ต้องใช้เวลามากขึ้นจากตัวแปรสุ่มที่มีค่าเบี่ยงเบนมาตรฐานที่สูงกว่า
Henry

1
นั่นเป็นคำที่ไม่ดี สิ่งที่ฉันหมายถึงคือเส้นจากกึ่งกลางถึงจุดสีแดงไม่ได้ตั้งฉากกับแทนเจนต์
Henry
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.