ความคาดหวังของสแควร์รูทของผลรวมของตัวแปรสุ่มชุดกำลังสองอิสระ


9

ให้เป็นอิสระและตัวแปรสุ่มชุดมาตรฐานแบบกระจายเหมือนกันX1,,XnU(0,1)

ปล่อย Yn=ΣผมnXผม2ฉันค้นหา: E[Yn]


ความคาดหวังของนั้นง่าย:Yn

E[X2]=01Y2Y=13E[Yn]=E[ΣผมnXผม2]=ΣผมnE[Xผม2]=n3

ตอนนี้ส่วนที่น่าเบื่อ เมื่อต้องการใช้ LOTUS, ฉันจะต้องไฟล์ PDF ของy_nแน่นอนว่าไฟล์ PDF ของผลรวมของตัวแปรสุ่มอิสระสองตัวคือการแปลงไฟล์ PDF ของพวกเขา อย่างไรก็ตามที่นี่เรามีตัวแปรสุ่มตัวและฉันเดาว่าการโน้มน้าวใจจะนำไปสู่ ​​... การแสดงออกที่ซับซ้อน มีวิธีที่ฉลาดกว่านี้ไหม?Ynn

ฉันอยากเห็นวิธีแก้ปัญหาที่ถูกต้องแต่ถ้ามันเป็นไปไม่ได้หรือซับซ้อนเกินไปการประมาณเชิงซีมโทติคสำหรับขนาดใหญ่อาจเป็นที่ยอมรับได้ โดยความไม่เท่าเทียมของเซ่นฉันรู้ว่าn

E[Yn]=n3E[Yn]

แต่มันก็ไม่ได้ช่วยอะไรมากนักเว้นแต่ฉันจะพบว่าขอบเขตล่างที่ไม่สำคัญ โปรดทราบว่า CLT ไม่ได้ใช้โดยตรงที่นี่เพราะเรามีรากที่สองของผลรวมของ RV อิสระไม่ใช่แค่ผลรวมของ RV อิสระ อาจจะมีทฤษฎีบทขีด จำกัด อื่น ๆ (ซึ่งฉันเพิกเฉย) ที่อาจช่วยได้ที่นี่


3
ดูคำถามนี้สำหรับผลเชิงซีโมติก
S. Catterall Reinstate Monica

4
ฉันได้ตามคำถามที่เชื่อมโยงข้างต้น E[Yn]n3-115
S. Catterall Reinstate Monica

2
ฉันไม่คิดว่าฉันจะใช้วิธีการใด ๆ ที่อธิบายไว้ในคำตอบนั้น (ซึ่งมีมากกว่าสอง!) :-) เหตุผลก็คือคุณสามารถใช้ประโยชน์จากสถานการณ์จำลองที่เรียบง่ายและตรงไปตรงมาเพื่อประเมินความคาดหวังในขณะที่โซลูชันการวิเคราะห์ดูเหมือนว่าหาไม่ได้ ฉันชอบวิธีการของ @ S.Catterall มาก (+1 สำหรับวิธีแก้ปัญหานั้นซึ่งฉันไม่ได้อ่านมาก่อน) แสดงให้เห็นว่าการจำลองก็ทำงานได้ดีแม้สำหรับขนาดเล็กnn
whuber

3
การจำลองนั้นมีค่าที่ควรทำ :-) พล็อตแตกต่างระหว่างค่าเฉลี่ยจำลองและสูตรตัวอย่างกับnมันจะแสดงให้คุณเห็นอย่างชัดเจนว่าการประมาณการทำงานของอย่างไร nn
whuber

4
เห็นได้ชัดว่าในขณะที่การประมาณจะให้0.516 ในกรณีนั้นจะถูกต้อง แต่การประมาณจะดีขึ้นหลังจากนั้น E[Y1]=0.513-115=4150.51613-112
เฮนรี่

คำตอบ:


11

วิธีแรกคือการคำนวณฟังก์ชันสร้างโมเมนต์ (mgf) ของกำหนดโดยโดยที่เป็นอิสระและกระจายตัวแปรสุ่มแบบมาตรฐานเหมือนกัน .YnYn=ยู12++ยูn2ยูผม,ผม=1,...,n

เมื่อเราได้ว่าเราจะเห็นว่า เป็นช่วงเวลาที่เศษส่วนของของการสั่งซื้อ1/2 จากนั้นเราสามารถใช้ผลลัพธ์จากบทความ Noel Cressie และ Marinus Borkent: "ฟังก์ชั่นการสร้างช่วงเวลามีช่วงเวลา", วารสารการวางแผนเชิงสถิติและการอนุมาน 13 (1986) 337-344 ซึ่งให้ช่วงเวลาเศษส่วนผ่านการแยกส่วนของฟังก์ชันสร้างช่วงเวลา .

EYn
Ynα=1/2

ครั้งแรกที่ฟังก์ชั่นช่วงเวลาที่ก่อให้เกิดของซึ่งเราเขียน(t) และฉันประเมินว่า (ด้วยความช่วยเหลือของ Maple และ Wolphram Alpha) เพื่อให้ โดยที่เป็นหน่วยจินตภาพ (อัลฟา Wolphram ให้คำตอบที่คล้ายกันแต่ในแง่ของหนึ่งดอว์สัน. ) มันจะเปิดออกเราส่วนใหญ่จะต้องเป็นกรณีสำหรับ<0 ตอนนี้มันง่ายที่จะหา mgf ของ : จากนั้นสำหรับผลลัพธ์จากกระดาษที่อ้างถึง สำหรับยู12M1(เสื้อ)

M1(เสื้อ)=Eอีเสื้อยู12=01อีเสื้อx2xdx
M1(เสื้อ)=ERF(-เสื้อ)π2-เสื้อ
ผม=-1เสื้อ<0Yn
Mn(เสื้อ)=M1(เสื้อ)n
μ>0พวกเขากำหนดลำดับที่ครบถ้วนของฟังก์ชันขณะที่ แล้วสำหรับและ nonintegral,เป็นจำนวนเต็มบวกและดังกล่าวว่า\จากนั้นอนุพันธ์ของของคำสั่งถูกกำหนดเป็น จากนั้นพวกเขาระบุ (และพิสูจน์) ผลลัพธ์ต่อไปนี้สำหรับตัวแปรสุ่มที่เป็นบวก : สมมติว่า (mgf) ถูกกำหนดไว้ จากนั้นสำหรับμ
ผมμ(เสื้อ)Γ(μ)-1-เสื้อ(เสื้อ-Z)μ-1(Z)dZ
α>0n0<λ<1α=n-λα
Dα(เสื้อ)Γ(λ)-1-เสื้อ(เสื้อ-Z)λ-1dn(Z)dZndZ.
XMXα>0 , ตอนนี้เราสามารถพยายามที่จะใช้ผลลัพธ์เหล่านี้เพื่อy_nด้วยเราพบ โดยที่นายกหมายถึงอนุพันธ์ เมเปิ้ลให้ทางออกต่อไปนี้: ฉันจะแสดงพล็อตของความคาดหวังนี้ทำในต้นเมเปิลโดยใช้การรวมตัวเลขพร้อมกับโซลูชันโดยประมาณ
DαMX(0)=EXα<
Ynα=1/2
EYn1/2=D1/2Mn(0)=Γ(1/2)-1-0|Z|-1/2Mn'(Z)dZ
0n(erf(z)π2ezz)en(2ln2+2ln(erf(z))ln(z)+ln(π))22π(z)3/2erf(z)dZ
A(n)=n/3-1/15จากความคิดเห็นบางส่วน (และกล่าวถึงในคำตอบโดย @Henry) พวกเขาอยู่ใกล้อย่างน่าทึ่ง:

การเปรียบเทียบที่แน่นอนและโดยประมาณ

พล็อตข้อผิดพลาดของเปอร์เซ็นต์:

ข้อผิดพลาดญาติ (ร้อยละ) ในพล็อตข้างต้น

ด้านบนประมาณการประมาณใกล้เคียงที่แน่นอน ด้านล่างรหัสเมเปิ้ลที่ใช้:n=20

int( exp(t*x)/(2*sqrt(x)), x=0..1 ) assuming t>0;
int( exp(t*x)/(2*sqrt(x)), x=0..1 ) assuming t<0;
M := t -> erf(sqrt(-t))*sqrt(Pi)/(2*sqrt(-t))
Mn := (t,n) -> exp(n*log(M(t)))
A  :=  n -> sqrt(n/3 - 1/15)
Ex :=  n ->   int( diff(Mn(z,n),z)/(sqrt(abs(z))*GAMMA(1/2) ), z=-infinity..0 ,numeric=true)

plot([Ex(n),A(n)],n=1..100,color=[blue,red],legend=[exact,approx],labels=[n,expectation],title="expectation of sum of squared uniforms")
plot([((A(n)-Ex(n))/Ex(n))*100],n=1..100,color=[blue],labels=[n,"% error"],title="Percentage error of approximation")

1
น่าสนใจมาก. หากคุณสามารถเพิ่มบางแปลงได้นี่จะเป็นคำตอบที่ยอดเยี่ยม อย่างไรก็ตามฉันจะสังเกตเห็นข้อดีอย่างหนึ่งของการประมาณ CLT ที่นี่ ประมาณที่แสดงให้เห็นอย่างชัดเจนว่าเติบโตเป็นเมื่อnวิธีการแก้ปัญหาเมเปิ้ลไม่ได้ (หรืออย่างน้อยฉันไม่สามารถคิดออก) E[Yn]nn
DeltaIV

5

ในฐานะที่เป็นความคิดเห็นเพิ่มเติม: มันชัดเจนที่นี่ว่าเริ่มต้นด้วยเมื่อจากนั้นเข้าใกล้เป็นเพิ่มขึ้นที่เกี่ยวข้องกับความแปรปรวนของตกลงมาจากต่อ{15} คำถามที่ถูกเชื่อมโยงของฉันซึ่ง S.Catterall คำตอบให้เหตุผลสำหรับผลเชิงแต่ละคนมีค่าเฉลี่ยและความแปรปรวนE[Yn]=E[ΣผมXผม2]E[Yn]=12=n3-112n=1n3-115nYn112115n3-115Xผม213445และสำหรับการแจกแจงจะอยู่ที่ประมาณและไม่ปกติ

คำถามนี้เป็นคำถามเกี่ยวกับประสิทธิภาพการกระจายของระยะทางจากจุดกำเนิดของจุดสุ่มในนั้นหน่วย hypercube มิติ n มันคล้ายกับคำถามเกี่ยวกับการกระจายของระยะทางระหว่างจุดต่าง ๆ ใน hypercubeดังนั้นฉันสามารถปรับสิ่งที่ฉันทำที่นั่นเพื่อแสดงความหนาแน่นของต่าง ๆจากถึงโดยใช้การคำนวณเชิงตัวเลข สำหรับการประมาณปกติที่แนะนำซึ่งแสดงด้วยสีแดงเป็นแบบที่ดีและจากคุณจะเห็นเส้นโค้งรูประฆัง n[0,1]nn116n=16n=4

ป้อนคำอธิบายรูปภาพที่นี่

สำหรับและคุณจะได้จุดสูงสุดที่คมชัดที่โหมดซึ่งมีความหนาแน่นเท่ากันทั้งสองกรณี เปรียบเทียบสิ่งนี้กับการกระจายของโดยที่เส้นโค้งเบลล์ปรากฏขึ้นพร้อมและความแปรปรวนเป็นสัดส่วนกับn=2n=31ΣผมXผมn=3n


2
ความแปรปรวนเกือบคงที่นำไปสู่ผลลัพธ์ที่ต่อต้านการหยั่งรู้ ตัวอย่างเช่นกับ , (ระยะทางจากจุดกำเนิดของจุดสุ่มในมิติหน่วย hypercube) สามารถใช้ค่าใด ๆ จากถึงแต่ของกรณีจะอยู่ระหว่างและและแทบทั้งหมดระหว่างและn=400Y40040002094%11121013
เฮนรี่

1
มันเป็นบิตต่อต้านง่ายในความเป็นจริง เนื่องจากคำสาปของความเป็นมิติฉันจึงคาดหวังว่าคะแนนส่วนใหญ่จะอยู่ใกล้กับมุม (การรับรู้ st ) แต่ดูเหมือนว่าจุดส่วนใหญ่อยู่ไกลจากจุดกำเนิด แต่ไม่ไกลเท่ามุมอาจเป็นข้อผิดพลาดคือเราควรพิจารณาระยะทางจากจุดศูนย์กลางของ hypercubeไม่ใช่ระยะทางจากจุดกำเนิดซึ่งเป็นเพียง มุมหนึ่งของไฮเปอร์คิวบ์ Y400Y400=20
DeltaIV

3
@DeltaIV: ถ้าคุณสร้างไฮเปอร์คิวบ์ด้านที่ดังนั้นและวัดจากจุดกำเนิดคุณจะได้การกระจายความคาดหวังและความแปรปรวนเหมือนกัน ด้วยคะแนนมากที่สุดใน hypecube ขนาดใหญ่นี้จะใกล้เคียงกับเขตแดนของ hypercube นี้ (ระยะทางปกติของการสั่งซื้อของ ) แต่ไม่ใกล้กับมุม (ระยะทางปกติที่ใกล้ที่สุดหนึ่งในหรืออีกครั้ง)2[-1,1]nn=4000.021112
เฮนรี่

1
ที่ทำให้ความรู้สึก - ฉันไม่ได้มีเวลาที่จะทำคณิตศาสตร์ แต่สังหรณ์ใจที่ฉันคาดหวังผลที่คล้ายกันสำหรับ1]) ฉันคาดหวังความคาดหวัง (ขออภัยสำหรับปุน) ที่จะเปลี่ยนแปลงโดยปัจจัยคงที่ แต่อย่างที่ฉันบอกว่าฉันไม่มีเวลาตรวจสอบ ยู([-1,1])
DeltaIV
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.