เหตุใดจึงใช้ไคสแควร์เมื่อสร้างช่วงความมั่นใจสำหรับความแปรปรวน


15

นี่เป็นคำถามพื้นฐานมาก ทำไมเราถึงใช้การแจกแจงแบบไคสแควร์? ความหมายของการแจกแจงนี้คืออะไร? ทำไมการแจกแจงแบบนี้ใช้สำหรับสร้างช่วงความมั่นใจสำหรับความแปรปรวน?

ทุกสถานที่ที่ฉัน google สำหรับคำอธิบายเพียงนำเสนอความจริงนี้อธิบายว่าเมื่อใดที่จะใช้ไค แต่ไม่ได้อธิบายว่าทำไมต้องใช้ไคและทำไมมันดูวิธีที่มันทำ

ขอบคุณมากสำหรับใครก็ตามที่ชี้ให้ฉันไปในทิศทางที่ถูกต้องและนั่นคือ - เข้าใจจริงๆว่าทำไมฉันถึงใช้ไคเมื่อฉันสร้างช่วงความมั่นใจสำหรับความแปรปรวน


4
คุณสามารถใช้มันเพราะ - เมื่อข้อมูลที่เป็นปกติ -{n-1} (สิ่งนี้ทำให้เป็นปริมาณที่สำคัญ)Q=(n1)s2σ2χn12Q
Glen_b

2
ดูเพิ่มเติมstats.stackexchange.com/questions/15711/และลิงค์ของมัน
นิคค็อกซ์

1
สำหรับผู้ที่มีความสนใจในการใช้งานหรือวิจัยเพิ่มเติมเกี่ยวกับχ2คุณจะต้องใส่ใจกับความแตกต่างระหว่างการแจกแจงχ2 ("ไคสแควร์") และการ ("ไค") ( สแควร์รูทของ aแปลกใจ) χχ2
whuber

คำตอบ:


23

คำตอบที่รวดเร็ว

เหตุผลก็คือสมมติว่าข้อมูลคือ iid และและการกำหนด เมื่อสร้างช่วงความเชื่อมั่นการสุ่มตัวอย่าง การแจกแจงที่เกี่ยวข้องกับความแปรปรวนตัวอย่าง (จำไว้ว่าตัวแปรสุ่ม!) คือการแจกแจงแบบไคสแควร์ ( ) เช่นเดียวกับการกระจายตัวตัวอย่างที่เกี่ยวข้องกับค่าเฉลี่ยตัวอย่างคือการแจกแจงแบบปกติมาตรฐาน ( ) เมื่อคุณทราบความแปรปรวน และกับ t-student เมื่อคุณไม่ ( )ˉ XXiN(μ,σ2) S2S2(N-1)/σ2χ2n-1(ˉX-μ)

X¯=NXiNS2=N(X¯Xi)2N1
S2S2(N1)/σ2χn12( ˉ X -μ)(X¯μ)n/σ~Z(0,1)(X¯-μ)n/S~Tn-1

คำตอบที่ยาว

ก่อนอื่นเราจะพิสูจน์ว่าติดตามการแจกแจงแบบไคสแควร์ที่มีองศาอิสระหลังจากนั้นเราจะมาดูกันว่าการพิสูจน์นี้มีประโยชน์อย่างไรเมื่อได้รับช่วงความมั่นใจสำหรับความแปรปรวนและวิธีการแจกแจงแบบไคสแควร์ปรากฏขึ้น (และทำไมมันจึงมีประโยชน์มาก!) เอาล่ะ.S2(ยังไม่มีข้อความ-1)/σ2ยังไม่มีข้อความ-1

การพิสูจน์

สำหรับเรื่องนี้บางทีคุณอาจจะต้องรับใช้ในการกระจายไคสแควร์ในครั้งนี้บทความวิกิพีเดีย การกระจายนี้มีเพียงพารามิเตอร์เดียว: องศาอิสระและเกิดขึ้นกับฟังก์ชันการสร้างช่วงเวลา (MGF) ที่กำหนดโดย: ถ้าเราสามารถแสดงให้เห็นว่าการกระจายของมีฟังก์ชั่นการสร้างช่วงเวลาเช่นนี้ แต่ด้วยจากนั้นเราได้แสดงให้เห็นว่าตามด้วยการแจกแจงแบบไคสแควร์ที่มีองศาอิสระเพื่อแสดงสิ่งนี้ให้สังเกตข้อเท็จจริงสองประการ:เมตรχ 2 ν ( T ) = ( 1 - 2 ที) - ν / 2 S 2 ( N - 1 ) / σ 2 ν = N - 1 S 2 ( N - 1 ) / σ 2 N - 1ν

ม.χν2(เสื้อ)=(1-2เสื้อ)-ν/2.
S2(ยังไม่มีข้อความ-1)/σ2ν=ยังไม่มีข้อความ-1S2(ยังไม่มีข้อความ-1)/σ2ยังไม่มีข้อความ-1
  1. ถ้าเรานิยาม โดยที่คือตัวแปรสุ่มมาตรฐานแบบปกติฟังก์ชันการสร้างช่วงเวลาของถูกกำหนดโดย MGF ของมอบให้โดย ที่ฉันใช้ PDF ของมาตรฐานปกติ,และด้วยเหตุนี้ ZฉันN(0,1)Y m Y (t)

    Y=Σ(Xผม-X¯)2σ2=ΣZผม2,
    Zผม~ยังไม่มีข้อความ(0,1)YZ2 m Z 2 ( t )
    mY(t)=E[etY]=E[etZ12]×E[etZ22]×...E[อีเสื้อZยังไม่มีข้อความ2]=ม.Zผม2(เสื้อ)×ม.Z22(เสื้อ)×...ม.Zยังไม่มีข้อความ2(เสื้อ).
    Z2 F(Z)=อี- Z 2 / 2/
    ม.Z2(เสื้อ)=-(Z)ประสบการณ์(เสื้อZ2)dZ=(1-2เสื้อ)-1/2,
    mY(t)=(1-2t) - N / 2 ,YN(Z)=อี-Z2/2/2π
    ม.Y(เสื้อ)=(1-2เสื้อ)-ยังไม่มีข้อความ/2,
    ซึ่งหมายความว่าดังต่อไปนี้การกระจายไคสแควร์กับYยังไม่มีข้อความองศาอิสระ
  2. หากและมีความเป็นอิสระและแต่ละการกระจายเป็นการกระจายแบบไคสแควร์ แต่มีและองศาอิสระแล้วกระจายด้วยการกระจายแบบไคสแควร์ที่มีองศาอิสระ จากการใช้ MGF ของทำสิ่งนี้!)Y 2Y1Y2ν1ν2W=Y1+Y2ν1+ν2W

จากข้อเท็จจริงข้างต้นโปรดทราบว่าหากคุณเพิ่มความแปรปรวนตัวอย่างด้วยคุณจะได้รับ (หลังจากพีชคณิต), และดังนั้นหารด้วย , โปรดสังเกตว่าเทอมที่สองในด้านซ้ายของผลรวมนี้เป็นการกระจายแบบไคสแควร์ที่มีอิสระ 1 องศาและการรวมกันทางด้านขวามือจะเป็นไคสแควร์ที่มีองศาอิสระ . ดังนั้นกระจายเป็นไคสแควร์ที่มีองศาอิสระN1

(N1)S2=n(X¯μ)+(Xiμ)2,
σ2
(N1)S2σ2+(X¯μ)2σ2/N=(Xiμ)2σ2.
NS2(N1)/σ2N1.

การคำนวณ Confidence Interval สำหรับความแปรปรวน

เมื่อค้นหาช่วงความมั่นใจสำหรับความแปรปรวนคุณต้องการทราบค่า จำกัดและใน มาเล่นด้วยความไม่เท่าเทียมกันในวงเล็บ ก่อนอื่นหารด้วย , แล้วจำได้สองสิ่ง: (1) สถิติมีการแจกแจงแบบไคสแควร์ที่มีองศาอิสระและ (2) ความแปรปรวนคือ ยิ่งใหญ่กว่าศูนย์ซึ่งหมายความว่าคุณสามารถคว่ำความไม่เท่าเทียมกันได้เพราะL1L2

P(L1σ2L2)=1α.
S2(N1)
L1S2(N1)σ2S2(N1)L2S2(N1).
S2(N1)/σ2N1
L1S2(N1)σ2S2(N1)S2(N1)σ2S2(N1)L1,σ2S2(N1)L2S2(N1)S2(N1)L2S2(N1)σ2,
ดังนั้นความน่าจะเป็นที่เรากำลังมองหาคือ: โปรดทราบว่า(N-1) เราต้องการแล้ว
P(S2(N1)L2S2(N1)σ2S2(N1)L1)=1α.
S2(N1)/σ2χ2(N1)
S2(N1)L2N1pχ2(x)dx=(1α)/2   ,N1S2(N1)L1pχ2(x)dx=(1α)/2  
N1เพราะคาดว่าค่าตัวของตัวแปรสุ่มไคสแควร์กับองศาอิสระคือ ) หรือเท่ากัน กำลังโทรหาและโดยที่ค่าและสามารถพบได้ในตารางไคสแควร์ (ในคอมพิวเตอร์ ส่วนใหญ่!) และการแก้สำหรับและ , N1N1
0S2(N1)L2pχ2(x)dx=α/2,S2(N1)L1pχ2(x)dx=α/2.
χα/22=S2(N1)L2χ1α/22=S2(N1)L1χα/22χ1α/22L1L2
L1=S2(N1)χ1α/22,L2=S2(N1)χα/22.
ดังนั้นช่วงความมั่นใจของคุณสำหรับความแปรปรวนคือ
C.I.=(S2(N1)χ1α/22,S2(N1)χα/22).

1
เพียงเพราะไม่ปฏิบัติตามการกระจายตัวไคสแควร์ที่กึ่งกลางในขณะที่ทำและทำให้ง่ายต่อการทำงานด้วย คุณกำลังขอคำตอบสำหรับสิ่งนั้นหรือไม่? (เช่นคุณต้องการให้ใครสักคนแสดงให้คุณเห็นว่าติดตามการกระจายไคสแควร์ที่มีองศาอิสระหรือไม่?)S2S2(ยังไม่มีข้อความ-1)/σ2S2(ยังไม่มีข้อความ-1)/σ2ยังไม่มีข้อความ-1
Néstor

4
มันจะเป็นประโยชน์ในการปรับเปลี่ยนคำตอบนี้จะรวมถึงความแข็งแรงมากสมมติฐาน แต่อันเป็นที่แปรปรวนตัวอย่างต่อไปนี้การกระจายไคสแควร์เมื่อข้อมูลที่เป็นพื้นฐานที่มีอิสระและเป็นไปตามปกติการจัดจำหน่าย แตกต่างจากทฤษฎีของการกระจายตัวของค่าเฉลี่ยตัวอย่างซึ่งในทางปฏิบัติการกระจายตัวตัวอย่างจะประมาณปกติถึงความแม่นยำที่สมเหตุสมผลในหลาย ๆ สถานการณ์พฤติกรรม asymptotic เดียวกันนี้มีแนวโน้มที่จะไม่เกิดขึ้นกับความแปรปรวนตัวอย่าง (จนกระทั่งขนาดตัวอย่างมีขนาดใหญ่มาก)
whuber

1
อุ่ย ดังนั้นจริง! สิ่งนี้มาจากการแก้ปัญหาที่ฉันส่งให้นักเรียนบางคนโดยที่ฉันระบุคำถามทั้งหมดที่กล่าวมา ฉันแก้ไขคำตอบทันที
Néstor

1
@ user34756 เหตุผลที่เราไม่ใช้การแจกแจงของโดยตรงคือการแจกแจงนั้นขึ้นอยู่กับค่าของพารามิเตอร์ คุณอาจพบว่ามีประโยชน์ในการตรวจสอบการใช้ปริมาณการพิจาณาในการสร้างช่วงความมั่นใจ S2
Glen_b -Reinstate Monica

1
ไม่ได้แทน ? (Z)=อี-Z2/2(Z)=อี-Z2
Benoît Legat
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.