เหตุใดจึงต้องมีการทดสอบแบบ t เนื่องจากเรามีการทดสอบ z


9

ใครสามารถให้คำอธิบายว่าทำไมการทดสอบแบบทดสอบ "เกิดขึ้น"? ฉันถูกสอนให้ใช้การทดสอบ t เมื่อคุณไม่ทราบค่าเบี่ยงเบนมาตรฐานของประชากร (เช่นคุณรู้ค่าเบี่ยงเบนมาตรฐานของตัวอย่างของคุณ) แต่ฉันไม่แน่ใจว่าทำไมจึงทำให้แตกต่างจากการทดสอบ z .


ฉันได้อัปเดตชื่อของคุณเพื่อรับคำถามที่ฉันคิดว่าคุณกำลังถาม อย่าลังเลที่จะแก้ไขหากฉันเข้าใจผิด
Jeromy Anglim

คำตอบ:


3

ฉันไม่คิดว่าฉันเข้าใจคำถามของคุณอย่างสมบูรณ์ คุณถามว่าทำไมคุณถึงต้องใช้การทดสอบ t?

หากคุณเข้าใจว่าทำไมคุณถึงต้องใช้การทดสอบ z คุณควรมีความคิดที่ดีว่าทำไมคุณถึงใช้การทดสอบ t สำหรับตัวอย่างขนาดใหญ่การทดสอบ z และการทดสอบ t ควรแสดงผลลัพธ์ที่คล้ายกันหรือเหมือนกัน แต่ในขณะที่การทดสอบ z จะใช้การแจกแจงแบบปกติการทดสอบแบบ t จะคำนึงถึงความไม่แน่นอนในการกระจายตัวอย่างที่ขนาดตัวอย่างที่เล็กกว่า


3
อืมการทดสอบ t ยังถือว่าเป็นการแจกแจงแบบปกติ บางทีสิ่งที่คุณตั้งใจจะพูดก็คือเราต้องการข้อมูลน้อยลงเกี่ยวกับการแจกจ่ายนั้น
JohnK

@ จอห์นฉันไม่คิดว่ามันสมเหตุสมผลที่จะบอกว่าการทดสอบถือว่าการแจกแจงในตอนแรก แต่ฉันคิดว่าเบนจามินหมายความว่าคะแนน t / คะแนนทางสถิติถือว่าการกระจายตัวแบบ T ไม่ใช่การกระจายตัวแบบ Z
Datoraki

3

จริง ๆ แล้วการทดสอบ z-test นั้นเป็นการทดสอบอัตราส่วนความน่าจะเป็นระหว่างความน่าจะเป็นที่สมมติว่าสมมติฐานว่างและความน่าจะเป็นที่สมมุติฐานทางเลือก สมมติว่ามีการแจกแจงปกติพื้นฐานที่มีค่าความแปรปรวนที่รู้จักและทดสอบเพียงค่าเฉลี่ยพีชคณิตจะลดความซับซ้อนของการทดสอบซีที่เรารู้จักและชื่นชอบ (DeGroot 1986, pp. 442–447)

การใช้กระบวนการโอกาสสูงสุดเดียวกัน แต่การรักษาความแปรปรวนเป็นที่ไม่รู้จักสร้างคู่ที่แตกต่างของโอกาสและอัตราส่วนของพวกเขาและปล่อยให้พีชคณิตลดความซับซ้อนออกให้สถิติ:

n(X¯n-μ0)Sn2n-1
(DeGroot 1986, pp. 485–489) การแจกแจงการทดสอบในคำถามจะเปลี่ยนไปเช่นกันเนื่องจากตัวกระจายของสถิติข้างต้นนั้นถูกแจกจ่ายX¯และตัวส่วนนั้นถูกกระจายเป็นสแควร์รูทของบรรทัดฐานกำลังสอง, S2ซึ่งเป็นรากที่สองของตัวแปรสุ่มไคสแควร์ Gosset (นักเรียน) แสดงให้เห็นว่าถ้าคุณมีตัวแปรสุ่ม:
Y~ยังไม่มีข้อความ(0,1)Z~χn2X~YZn
จากนั้น X จะถูกกระจายด้วยการแจกแจงแบบ t และองศาอิสระ

ดังนั้นเพื่อระบุว่าไม่มีความเข้มงวด t-test จึงเป็นผลลัพธ์ตามธรรมชาติของกระบวนการอัตราส่วนความน่าจะเป็นแบบเดียวกันซึ่งอยู่เบื้องหลังการทดสอบ z เมื่อความแปรปรวนของข้อมูลไม่ทราบตัวเองและถูกประเมินผ่านโอกาสสูงสุด


1
นี่เป็นความกระจ่างมาก ฉันลืมไปอย่างสิ้นเชิงว่าการทดสอบ t มาจาก likelihoood สูงสุด
Moderat

1

คำตอบที่ไม่เข้มงวดคือคุณต้องการใช้การทดสอบ t เมื่อคุณมีตัวอย่างจำนวนน้อยเนื่องจากมีโอกาสที่กลุ่มตัวอย่างจะปิดกันอย่างผิดปกติ (เทียบกับความแปรปรวนประชากรจริง) ในกรณีนั้นตัวส่วนในสูตรสำหรับสถิติ t จะมีขนาดเล็กผิดปกติและดังนั้นสถิติของตัวเองจะมีขนาดใหญ่ผิดปกติ ดังนั้นคุณมีแนวโน้มที่จะได้รับค่ามากสำหรับ t-stat เมื่อคุณมีตัวอย่างจำนวนน้อยกว่าที่คุณจะได้รับ z-stat ที่มีขนาดใหญ่กว่าดังนั้นคุณต้องใช้ค่าที่มากกว่าเพื่อปฏิเสธค่า null โดยใช้ t-test กว่า z-test ที่ระดับนัยสำคัญเดียวกัน


ฉันพบข้อโต้แย้งที่น่าสนใจ แต่เมื่อไตร่ตรองไม่เชื่อฟัง ท้ายที่สุดถ้าโดยบังเอิญกลุ่มตัวอย่างอยู่ห่างกันมากผิดปกติ (ซึ่งน่าจะเกิดขึ้นได้ง่ายเหมือนกับอยู่ใกล้ผิดปกติ) ดูเหมือนว่าตรรกะเดียวกันนี้จะนำไปสู่ข้อสรุปที่ตรงกันข้าม
whuber

0

ความแตกต่างที่สำคัญที่สุดคือขนาดตัวอย่างตามกฎง่ายๆ: ถ้า n มีขนาดเล็กกว่า 30 ควรใช้การทดสอบ t- มิฉะนั้นการทดสอบ z

ภาพรวมที่ดีของสมมติฐานและความแตกต่างพื้นฐาน (และความคล้ายคลึงกัน) ของการทดสอบทั้งสองมีให้ที่นี่:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.