เราจะได้การแจกแจงแบบปกติเป็นอย่างไรถ้าช่วงของค่าของตัวแปรสุ่มของเราถูก จำกัด ขอบเขต


12

สมมติว่าเรามีตัวแปรสุ่มที่มีช่วงของค่าที่ล้อมรอบด้วยและโดยที่คือค่าต่ำสุดและคือค่าสูงสุดabab

ฉันบอกว่าเป็นโดยที่คือขนาดตัวอย่างของเราการกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างของเราคือการแจกแจงแบบปกติ นั่นคือการที่เราเพิ่มเราได้ใกล้ชิดและใกล้ชิดกับการกระจายปกติ แต่ขีด จำกัด ที่เกิดขึ้นจริงเป็นคือเท่ากับการกระจายปกติnnnn

อย่างไรก็ตามไม่ได้เป็นส่วนหนึ่งของคำจำกัดความของการแจกแจงแบบปกติที่จะต้องขยายจากเป็น ?

ถ้าสูงสุดของช่วงของเราคือแล้วตัวอย่างค่าเฉลี่ยสูงสุด (โดยไม่คำนึงถึงขนาดของกลุ่มตัวอย่าง) เป็นไปได้เท่ากับและตัวอย่างขั้นต่ำเฉลี่ยเท่ากับbba

ดังนั้นจึงดูเหมือนว่าฉันว่าแม้ว่าเราจะใช้วงเงินเป็นแนวทางอินฟินิตี้จัดจำหน่ายของเราไม่ได้มีการกระจายปกติที่เกิดขึ้นจริงเพราะมันมีขอบเขตโดยและขnab

ฉันกำลังคิดถึงอะไร

คำตอบ:


15

นี่คือสิ่งที่คุณขาดหายไป การกระจาย asymptotic ไม่ได้เป็นของ (ตัวอย่างค่าเฉลี่ย) แต่ของที่เป็นค่าเฉลี่ยของXX¯nn(X¯nθ)θX

ให้จะ IID ตัวแปรสุ่มดังกล่าวที่และมีค่าเฉลี่ยและความแปรปรวน 2 ดังนั้นจึงสนับสนุนขอบเขต CLT บอกว่า X1,X2,a<Xi<bXiθσ2Xi

n(X¯nθ)dN(0,σ2),

โดยที่คือค่าเฉลี่ยตัวอย่าง ตอนนี้X¯n

a<Xi<ba<X¯n<baθ<X¯nθ<bθn(aθ)<n(X¯nθ)<n(bθ).

เมื่อขอบล่างและขอบบนมีแนวโน้มที่จะและตามลำดับและเมื่อการสนับสนุนของเป็นเส้นจริงทั้งหมดnnn(X¯nθ)

เมื่อใดก็ตามที่เราใช้ CLT ในทางปฏิบัติเราจะพูดว่าและสิ่งนี้จะเป็นการประมาณX¯nN(θ,σ2/n)


แก้ไข:ฉันคิดว่าส่วนหนึ่งของความสับสนมาจากการตีความผิด ๆ ของทฤษฎีขีด จำกัด กลาง คุณถูกต้องว่าการกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างคือ

X¯nN(θ,σ2/n).

อย่างไรก็ตามการกระจายการสุ่มตัวอย่างเป็นคุณสมบัติตัวอย่างที่ จำกัด อย่างที่คุณพูดเราต้องการให้ ; เมื่อเราทำเช่นนั้นแล้วสัญญาณจะเป็นผลลัพธ์ที่แน่นอน อย่างไรก็ตามหากเราปล่อยเราจะไม่สามารถมีอยู่ทางด้านขวามืออีกต่อไป (เนื่องจากคือตอนนี้ ) ดังนั้นข้อความต่อไปนี้จึงไม่ถูกต้องnnnn

X¯ndN(θ,σ2/n) as n.

[ที่นี่ย่อมาจากการบรรจบกันในแง่ของการกระจาย] เราต้องการเขียนผลลัพธ์ให้ถูกต้องดังนั้นไม่อยู่ทางด้านขวามือ ตอนนี้เราใช้คุณสมบัติของตัวแปรสุ่มเพื่อรับdn

n(X¯nθ)dN(0,σ2)

เพื่อดูว่าพีชคณิตทำงานออกมาให้ดูที่คำตอบที่นี่


ขอบคุณ. ฉันเข้าใจพีชคณิตของคุณไม่เท่ากัน แต่ฉันยังมีความสับสนเกี่ยวกับย่อหน้าแรกของคุณ: "การแจกแจงเชิงเส้นกำกับนั้นไม่ใช่ (ค่าเฉลี่ยตัวอย่าง) แต่เป็น ... " ฉันคิดว่า CLT กล่าวว่าการกระจายตัวตัวอย่างของกลุ่มตัวอย่างหมายถึงการกระจายตัวแบบปกติที่และฉันคิดว่าคือ RV ที่ใช้ค่าตัวอย่างที่เป็นไปได้ขนาดทั้งหมด ที่ไหนมาจากไหน? ทำไมเราถึงสนใจในการกระจายนั้นและไม่ใช่การกระจายของ ? X¯nn(X¯nθ)nX¯nnn(X¯nθ)X¯n
jeremy radcliff

(ต่อ) นี่เกี่ยวกับการทำให้การกระจายตัวของตัวอย่างเป็นปกติหรือไม่? นี่คือรากที่สองที่มาจากไหน? มันเกี่ยวกับคะแนนหรือไม่? Z
jeremy radcliff

@ jeremyradcliff ฉันได้แก้ไขคำตอบของฉันแล้วและมีลิงก์ที่อธิบายรายละเอียดบางอย่าง หวังว่านี่จะสมเหตุสมผลมากกว่านี้
Greenparker

1
ขอบคุณมากที่สละเวลาแก้ไขลิงก์ที่คุณให้ไว้เป็นสิ่งที่ฉันกำลังมองหา และคุณกำลังขวาปัญหาคือการที่ฉันมีปัญหาในการกลับมาคืนดีธรรมชาติ จำกัด ของการกระจายการสุ่มตัวอย่างและความจริงที่ว่าเราจะพาจะ\n
jeremy radcliff

7

หากคุณอ้างถึงทฤษฎีบทขีด จำกัด กลางโปรดทราบว่าวิธีหนึ่งที่เหมาะสมในการเขียนออกมาคือ

(x¯μσ)ndN(0,1)

ภายใต้สภาวะปกติ (เป็นค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของ )μ,σxi

ที่มีความหมายอย่างเป็นทางการนี้คุณสามารถดูได้ทันทีว่าด้านซ้ายมือสามารถใช้เวลาในการค่าสำหรับช่วง จำกัด ใดก็ตามที่มีขนาดใหญ่พอที่nn

เพื่อช่วยในการเชื่อมต่อกับแนวคิดที่ไม่เป็นทางการว่า "ค่าเฉลี่ยใกล้การแจกแจงแบบปกติสำหรับขนาดใหญ่" เราจำเป็นต้องตระหนักว่า "การกระจายแบบปกติ" หมายถึงการที่ CDF เข้าใกล้การแจกแจงแบบปกติโดยพลการเมื่อมีขนาดใหญ่ แต่เมื่อมีขนาดใหญ่ค่าเบี่ยงเบนมาตรฐานของการกระจายโดยประมาณนี้จะลดลงดังนั้นความน่าจะเป็นของหางที่รุนแรงที่สุดของค่าประมาณปกติก็เท่ากับ 0nnn

ตัวอย่างเช่นสมมติว่า0.5) จากนั้นคุณสามารถใช้การประมาณแบบไม่เป็นทางการเพื่อบอกว่าXiBern(p=0.5)

X¯˙N(p,p(1p)n)

ดังนั้นในขณะที่มันเป็นความจริงว่าสำหรับ จำกัด ใด ๆ ,n

P(N(p,p(1p)n)<0)>0

(หมายความประมาณอย่างชัดเจนไม่เคยสมบูรณ์แบบ) เช่น ,n

P(N(p,p(1p)n)<0)0

ดังนั้นความคลาดเคลื่อนระหว่างการแจกแจงจริงกับการแจกแจงโดยประมาณนั้นก็หายไปอย่างที่ควรจะเกิดขึ้นกับการประมาณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.