การกระจายตัวของความแตกต่างของการแจกแจงสองค่าคืออะไร


19

... และทำไม ?

สมมติว่า , X 2เป็นตัวแปรสุ่มอิสระที่มีค่าเฉลี่ยμ 1 , μ 2และความแปรปรวนσ 2 1 , σ 2 2ตามลำดับ หนังสือสถิติพื้นฐานของฉันบอกฉันว่าการกระจายตัวของX 1 - X 2มีคุณสมบัติดังต่อไปนี้:X1X2μ1,μ2σ12,σ22X1X2

  • E(X1X2)=μ1μ2
  • Var(X1X2)=σ12+σ22

สมมุติว่า , X 2 คือการแจกแจงแบบ t กับn 1 - 1 , n 2 - 2ดีกรีอิสระ การกระจายตัวของX 1 - X 2คืออะไร?X1X2n11n22X1X2

คำถามนี้ได้รับการแก้ไข:คำถามเดิมคือ"อะไรคือองศาอิสระของความแตกต่างของการแจกแจงแบบสองจุด?" . mpiktas ได้ชี้ให้เห็นแล้วว่าสิ่งนี้ไม่สมเหตุสมผลเนื่องจากไม่ได้ถูกแจกแจงแบบ t ไม่ว่าจะประมาณX 1 , X 2ปกติเท่าไหร่(เช่น high df)X1X2X1,X2


1
นี่คือคำถามที่เกี่ยวข้องซึ่งอาจเป็นที่สนใจ
mpiktas

2
Google the Satterthwaite t-test, CABF t-test (การประเมินโดย Cochran ต่อ Behrens-Fisher) และปัญหาของ Behrens-Fisher
whuber

3
สำหรับกรณีพิเศษที่องศาอิสระเท่ากับ 1 (การแจกแจงโคชี) คำตอบของคำถามเดิมคือ 1 ผลรวม (หรือความแตกต่าง) ของตัวแปรอิสระแบบกระจายของโคชีสองตัวที่สองคือ Cauchy พร้อมตัวแปรสเกลแต่จากนั้นอีกครั้ง การกระจาย Cauchy ไม่มีแม้แต่ค่าเฉลี่ย 2
NRH

1
คุณต้องตรวจสอบการแจกจ่ายของ Behrens - Fisher
Wis

คำตอบ:


15

ผลรวมของตัวแปรสุ่มแบบกระจาย t สองตัวที่ไม่ได้กระจายตัว ดังนั้นคุณไม่สามารถพูดเกี่ยวกับดีกรีอิสระของการแจกแจงนี้ได้เนื่องจากการแจกแจงที่ได้จะไม่มีดีกรีอิสระใด ๆ ในแง่ที่การแจกแจงแบบ t มี


@mpiktas: คำถามโง่ หากการแจกแจงแบบ t ด้วย n-1 df สามารถหาได้จากผลรวมของการแจกแจงปกติ n อิสระ (ดูวิกิพีเดีย) และให้ค่า df สูงพอที่การแจกแจงแบบ t จะใกล้เคียงกับการแจกแจงแบบปกติไม่ได้มาจากผลรวม ของการแจกแจงแบบ t คือการแจกแจงแบบทีอีกครั้ง?
steffen

@mpiktas: สิ่งที่เกี่ยวกับการทดสอบสถิติของการทดสอบ t- ซึ่งดูเหมือนว่าจะได้มาจากความแตกต่างของการแจกแจง t สอง?
steffen

1
@steffen ไม่ มันจะเป็นปกติประมาณเนื่องจากคุณจะเพิ่มตัวแปรปกติกระจายสองปกติประมาณ การแจกแจงแบบ t ที่มีค่า df สูงเป็นปกติโดยประมาณ แต่โดยทั่วไปไม่จำเป็นต้องแจกแจงแบบ t ด้วยค่า df สูง
mpiktas

1
@steffen สถิติการทดสอบ t ได้มาจากความแตกต่างของสองบรรทัดฐานไม่ใช่สองการแจกแจงแบบ t โปรดทราบว่าคำจำกัดความของการแจกแจงทีเป็นเศษส่วนของรากปกติและสแควร์ของไคสแควร์
mpiktas

1
@steffen ฉันมักจะพูดกับนักเรียนของฉันไม่มีคำถามโง่ ๆ เพียงคนโง่ที่ไม่ถามคำถามใด ๆ ผมไม่ได้เป็นครูที่นิยมมากฉันควรเพิ่ม :)
mpiktas

4

เห็นด้วยกับคำตอบข้างต้นความแตกต่างของตัวแปรสุ่มสองตัวที่แจกแจงแบบ t จะไม่ถูกแจกแจง แต่ฉันต้องการเพิ่มวิธีการคำนวณนี้

  1. วิธีที่ง่ายที่สุดในการคำนวณคือการใช้วิธีมอนติคาร์โล ตัวอย่างเช่นใน R คุณสุ่มตัวอย่างตัวเลข 100,000 จากการแจกแจง t แรกจากนั้นคุณสุ่มสุ่มตัวเลขอีก 100,000 ตัวจากการแจกแจงรอบที่สอง คุณปล่อยให้ชุดแรกของ 100,000 หมายเลขลบชุดที่สองของ 100,000 หมายเลข 100,000 หมายเลขใหม่ที่ได้รับคือตัวอย่างแบบสุ่มจากการแจกแจงความแตกต่างระหว่างการแจกแจงสองแบบ คุณสามารถคำนวณค่าเฉลี่ยและความแปรปรวนโดยเพียงแค่ใช้และmean()var()

    1. สิ่งนี้เรียกว่าการกระจาย Behrens-Fisher คุณสามารถดูที่หน้าวิกิพีเดีย: https://en.wikipedia.org/wiki/Behrens%E2%80%93Fisher_distribution CI ที่ได้รับจากการกระจายนี้ถูกเรียกว่า "ช่วงเวลาที่แม่นยำ" นี้เป็นไม่ CI

    2. การรวมตัวเลขอาจทำงานได้ สิ่งนี้ยังคงเป็นจุด bullet 2 คุณอาจอ้างถึงส่วนที่ 2.5.2 ในการอนุมานแบบเบย์ในการวิเคราะห์ทางสถิติโดย Box, George EP, Tiao, George C. มันมีขั้นตอนโดยละเอียดของการรวมและวิธีการประมาณนี้เป็นอย่างไร การกระจายของ Behrens-Fisher


1
สำหรับฉันแล้วการแจกแจงของ Behrens-Fisher นั้นใช้ในกรณีที่ความแปรปรวนของการแจกแจงแบบสองตัวไม่เท่ากัน สามารถพูดได้เหมือนกันหรือไม่ถ้าความแปรปรวนของการแจกแจงสองตัวนั้นเท่ากัน?
Ian Sudbery

1
ขออภัยกด Enter สองต้นหรือไม่ เพื่อดำเนินการต่อ ... ตัวอย่างเช่นสมมติว่าเรามีการแจกแจงปกติสองแบบที่มีค่าความแปรปรวนเท่ากัน แต่ไม่ทราบค่า เราวาดตัวอย่างสองตัวอย่างจากการแจกแจงแต่ละครั้ง ความแตกต่างของค่าเฉลี่ยระหว่างสองตัวอย่างจากการแจกแจงแบบเดียวกันจะเป็นไปตามการแจกแจงแบบ t แต่การกระจายตัวของความแตกต่างของความแตกต่างคืออะไร
Ian Sudbery
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.