ในตัวอย่างหนึ่ง t-test, เกิดอะไรขึ้นถ้าในความแปรปรวนประมาณการค่าเฉลี่ยของกลุ่มตัวอย่างจะถูกแทนที่ด้วย


10

สมมติหนึ่งตัวอย่าง t-test ที่สมมติฐานคือ\สถิติแล้วโดยใช้กลุ่มตัวอย่างส่วนเบี่ยงเบนมาตรฐานsในการประเมินหนึ่งเปรียบเทียบการสังเกตกับค่าเฉลี่ยตัวอย่าง : t = ¯ x - μ 0μ=μ0 ss¯xเสื้อ=x¯-μ0s/nssx¯

s=1n-1Σผม=1n(xผม-x¯)22}

อย่างไรก็ตามหากเราถือว่าที่ระบุเป็นจริงเราสามารถประมาณค่าเบี่ยงเบนมาตรฐานโดยใช้แทนค่าเฉลี่ยตัวอย่าง :s μ 0 ¯ xμ0s* * * *μ0x¯

s* * * *=1n-1Σผม=1n(xผม-μ0)22}

สำหรับฉันวิธีการนี้ดูเป็นธรรมชาติมากขึ้นเนื่องจากเราใช้สมมติฐานว่างเพื่อประเมิน SD ไม่มีใครรู้ว่าสถิติที่เกิดขึ้นนั้นถูกนำไปใช้ในการทดสอบหรือรู้ว่าทำไม?


ฉันติดตามคำถามนี้เพราะฉันกำลังจะโพสต์และ SE เตือนฉัน ฉันสงสัยว่ามีเอกสารอ้างอิงในคำถามนี้หรือไม่ อย่างสังหรณ์ใจจะเป็นการประมาณที่ดีกว่าของและการกระจายของสามารถรับได้ (ไม่ใช่นักเรียนสันนิษฐาน) การอ้างอิงใด ๆ จะได้รับการชื่นชม! s'2=1nΣ(xผม-μ0)2σ2x¯-μ0s'/n
AG

คำตอบ:


6

มีปัญหากับการจำลองแบบดั้งเดิมในโพสต์นี้ซึ่งตอนนี้หวังว่าจะได้รับการแก้ไขแล้ว

ในขณะที่ประมาณการของส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างมีแนวโน้มที่จะเติบโตไปพร้อมกับเศษเป็นเบี่ยงเบนเฉลี่ยจากผลัดนี้ออกไปไม่ได้ทั้งหมดที่มีขนาดใหญ่ส่งผลกระทบต่ออำนาจที่ระดับ "ปกติ" ระดับนัยสำคัญเพราะในระดับปานกลางถึงตัวอย่างขนาดใหญ่s / μ0ยังคงมีแนวโน้มที่จะมีขนาดใหญ่พอที่จะปฏิเสธ ในตัวอย่างขนาดเล็กอาจมีผลกระทบบางอย่างแม้ว่าและในระดับความสำคัญน้อยมากสิ่งนี้อาจกลายเป็นสิ่งที่สำคัญมากเพราะมันจะวางขอบเขตบนอำนาจที่จะน้อยกว่า 1s* * * */n

ประเด็นที่สองอาจมีความสำคัญมากกว่าในระดับความสำคัญ 'ทั่วไป' ดูเหมือนว่าตัวเศษและส่วนของสถิติการทดสอบไม่เป็นอิสระอีกต่อไปที่โมฆะ (ตารางของมีความสัมพันธ์กับการประมาณค่าความแปรปรวน)x¯-μ

นี่หมายความว่าการทดสอบไม่มีการแจกแจงแบบ t ภายใต้ค่า null อีกต่อไป ไม่ใช่ข้อบกพร่องร้ายแรง แต่หมายความว่าคุณไม่สามารถใช้ตารางและรับระดับนัยสำคัญที่คุณต้องการ (อย่างที่เราจะเห็นในอีกไม่กี่นาที) นั่นคือการทดสอบจะอนุรักษ์นิยมและส่งผลกระทบต่อพลัง

เมื่อ n กลายเป็นใหญ่การพึ่งพาอาศัยกันนี้จะกลายเป็นปัญหาน้อยลง (ไม่น้อยเพราะคุณสามารถเรียกใช้ CLT สำหรับตัวเศษและใช้ทฤษฎีบทของ Slutsky เพื่อบอกว่ามีการแจกแจงปกติแบบเชิงเส้นกำกับสำหรับสถิติที่ปรับเปลี่ยนแล้ว)

นี่คือเส้นโค้งพลังงานสำหรับสามัญสองเสื้อตัวอย่าง (เส้นโค้งสีม่วงสองทดสอบเทลด์) และสำหรับการทดสอบโดยใช้ค่า Null ของในการคำนวณs (จุดสีฟ้าที่ได้รับผ่านการจำลองและการใช้เสื้อตาราง) เช่น ค่าเฉลี่ยประชากรย้ายออกจากค่าที่ตั้งสมมติฐานสำหรับn = 10 :μ0sn=10

n = 10

ป้อนคำอธิบายรูปภาพที่นี่

คุณสามารถเห็นเส้นโค้งพลังงานต่ำลง (มันยิ่งแย่ลงเมื่อขนาดตัวอย่างต่ำกว่า) แต่ส่วนมากดูเหมือนจะเป็นเพราะการพึ่งพาระหว่างตัวเศษและส่วนได้ลดระดับนัยสำคัญลง หากคุณปรับค่าวิกฤตอย่างเหมาะสมจะมีค่าเล็กน้อยระหว่างค่าเหล่านั้นแม้ที่ n = 10

และนี่คือกราฟพลังงานอีกครั้ง แต่ตอนนี้สำหรับn=30

n = 30

ป้อนคำอธิบายรูปภาพที่นี่

สิ่งนี้ชี้ให้เห็นว่าในขนาดตัวอย่างที่ไม่ใช่ขนาดเล็กนั้นมีไม่มากนักระหว่างสิ่งเหล่านี้ตราบใดที่คุณไม่จำเป็นต้องใช้ระดับนัยสำคัญน้อยมาก


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.