ฉันออกจากย่อหน้านี้เพื่อแสดงความคิดเห็นเพื่อความเข้าใจ: อาจเป็นไปได้ว่าสมมติฐานของภาวะปกติในประชากรดั้งเดิมนั้นเข้มงวดเกินไปและสามารถลืมการเน้นไปที่การแจกแจงตัวอย่างและขอบคุณทฤษฎีบทขีด จำกัด กลางโดยเฉพาะอย่างยิ่งสำหรับกลุ่มตัวอย่างขนาดใหญ่
การใช้การทดสอบอาจเป็นความคิดที่ดีถ้า (โดยปกติเป็นกรณีนี้) คุณไม่ทราบความแปรปรวนประชากรและคุณจะใช้ความแปรปรวนตัวอย่างเป็นตัวประมาณ โปรดทราบว่าข้อสันนิษฐานของความแปรปรวนเหมือนกันอาจจะต้องมีการทดสอบกับการทดสอบ F ความแปรปรวนหรือการทดสอบก่อนที่จะใช้ Lavene แปรปรวน pooled - ฉันมีบันทึกบางบน GitHub ที่นี่เสื้อ
ดังที่คุณพูดถึงการแจกแจงแบบ t จะรวมเข้ากับการแจกแจงแบบปกติเมื่อตัวอย่างเพิ่มขึ้นเนื่องจากพล็อตต์ R แบบด่วนนี้แสดง:
ในสีแดงคือ pdf ของการแจกแจงแบบปกติและเป็นสีม่วงคุณสามารถเห็นการเปลี่ยนแปลงที่ก้าวหน้าใน "fat tails" (หรือหางที่หนักกว่า) ของ pdf ของการกระจายตัวเมื่อองศาเพิ่มขึ้นจนกว่ามันจะผสมกับ พล็อตปกติเสื้อ
ดังนั้นการใช้ z-test น่าจะใช้ได้กับกลุ่มตัวอย่างขนาดใหญ่
การจัดการปัญหาด้วยคำตอบเริ่มต้นของฉัน ขอบคุณ Glen_b สำหรับความช่วยเหลือของคุณกับ OP (ความผิดพลาดที่น่าจะเกิดขึ้นในการตีความใหม่เป็นของฉันทั้งหมด)
- T สถิติต่อไปนี้ที่จัดจำหน่ายภายใต้การสันนิษฐานผิดปกติ:
ทิ้งความซับซ้อนในสูตรสำหรับตัวอย่างหนึ่งโวลต์สองตัวอย่าง (จับคู่และไม่จับคู่) สถิติทั่วไป t ที่เน้นไปที่กรณีของการเปรียบเทียบค่าเฉลี่ยตัวอย่างกับค่าเฉลี่ยประชากรคือ:
t-test = X¯- μsn√= X¯- μσ/ n√s2σ2---√= X¯- μσ/ n--√Σnx = 1( X- X¯)2n - 1σ2--------√(1)
ถ้าตามหลังการแจกแจงปกติที่มีค่าเฉลี่ยและความแปรปรวน :Xμσ2
- เศษของ(1,0)( 1 ) ∼ N( 1 , 0 )
- ตัวหารของจะเป็นสแควร์รูทของ (ปรับขนาดไคสแควร์) ตั้งแต่เป็นมาที่นี่( 1 )s2/ σ2n - 1∼ 1n - 1χ2n - 1( n - 1 ) s2/ σ2∼ χ2n - 1
- ตัวเศษและส่วนควรเป็นอิสระ
ภายใต้เงื่อนไขเหล่านี้n-1)t-statistic ∼ t ( dฉ= n - 1 )
- ทฤษฎีการ จำกัด ภาคกลาง:
แนวโน้มที่มีต่อความเป็นมาตรฐานของการกระจายตัวตัวอย่างของกลุ่มตัวอย่างหมายถึงเมื่อขนาดตัวอย่างเพิ่มขึ้นสามารถพิสูจน์ได้ว่าสมมุติว่ามีการแจกแจงแบบปกติของตัวเศษแม้ว่าจำนวนประชากรจะไม่ปกติ อย่างไรก็ตามมันไม่ได้มีอิทธิพลต่ออีกสองเงื่อนไข (การกระจายไคสแควร์ของตัวส่วนและความเป็นอิสระของตัวเศษจากตัวส่วน)
แต่ไม่ใช่ทั้งหมดจะหายไปในโพสต์นี้มีการกล่าวถึงว่าทฤษฎีบท Slutzky สนับสนุนการลู่แบบซีมโทติกไปสู่การแจกแจงแบบปกติแม้ว่าการแจกแจงไคของตัวส่วนจะไม่เป็นไปตามนั้น
- ความทนทาน:
บนกระดาษ "ดูสมจริงยิ่งขึ้นถึงความทนทานและคุณสมบัติข้อผิดพลาดประเภทที่ 2 ของการทดสอบเพื่อออกจากสภาพปกติของประชากร" โดย Sawilowsky SS และ Blair RC ในวารสารจิตวิทยา, 1992, Vol. 111, หมายเลข 2, 352-360ซึ่งพวกเขาทดสอบการกระจายตัวแบบอุดมคติน้อยกว่าหรือมากกว่า "โลกปกติ" (น้อยกว่าปกติ) สำหรับพลังงานและสำหรับความผิดพลาดประเภทที่ 1 ข้อยืนยันดังต่อไปนี้สามารถพบได้: "แม้จะมีลักษณะอนุรักษ์นิยม ฉันผิดพลาดจากการทดสอบ t สำหรับการแจกแจงจริงเหล่านี้บางอย่างมีผลเพียงเล็กน้อยต่อระดับพลังงานสำหรับความหลากหลายของเงื่อนไขการรักษาและขนาดตัวอย่างที่ศึกษานักวิจัยอาจชดเชยการสูญเสียพลังงานเล็กน้อยได้อย่างง่ายดายโดยเลือกขนาดตัวอย่างใหญ่ขึ้นเล็กน้อย " .
" มุมมองที่เด่นชัดดูเหมือนว่าการทดสอบตัวอย่างอิสระมีความแข็งแกร่งพอตราบเท่าที่ข้อผิดพลาด Type I เกี่ยวข้องกับรูปร่างของประชากรที่ไม่ใช่แบบเกาส์ตราบใดที่ (a) ขนาดตัวอย่างมีค่าเท่ากันหรือเกือบ (b) ขนาดมีขนาดค่อนข้างใหญ่ (Boneau, 1960, กล่าวถึงขนาดตัวอย่างของ 25 ถึง 30) และ (c) การทดสอบเป็นแบบสองด้านแทนที่จะเป็นแบบหนึ่งด้านโปรดทราบว่าเมื่อเงื่อนไขเหล่านี้ตรงกับความแตกต่างระหว่าง alpha และ alpha จริง เกิดขึ้นความคลาดเคลื่อนมักจะเป็นแบบอนุรักษ์นิยมมากกว่าแบบเสรีนิยม "
ผู้เขียนเน้นย้ำถึงประเด็นที่ถกเถียงกันของหัวข้อและฉันหวังว่าจะได้ทำแบบจำลองบางอย่างบนพื้นฐานของการแจกแจงล็อกนอร์มอลตามที่ศาสตราจารย์ฮาร์เรลล์กล่าวถึง ฉันอยากจะลองเปรียบเทียบกับ Monte Carlo ด้วยวิธีที่ไม่ใช้พารามิเตอร์ (เช่นการทดสอบ Mann-Whitney U) กำลังดำเนินการ ...
SIMULATIONS:
ข้อจำกัดความรับผิดชอบ:สิ่งต่อไปนี้คือหนึ่งในแบบฝึกหัดเหล่านี้ใน "การพิสูจน์ด้วยตัวเอง" ไม่ทางใดก็ทางหนึ่ง ผลลัพธ์ไม่สามารถใช้ในการสร้างภาพรวม (อย่างน้อยไม่ใช่ฉัน) แต่ฉันเดาว่าฉันสามารถพูดได้ว่าการจำลอง MC ทั้งสอง (อาจมีข้อบกพร่อง) MC ดูเหมือนจะไม่ท้อใจเกินไปสำหรับการใช้การทดสอบ t ในสถานการณ์ อธิบาย
ข้อผิดพลาดประเภทที่ฉัน:
ในปัญหาของข้อผิดพลาดประเภทที่ 1 ฉันใช้การจำลอง Monte Carlo โดยใช้การแจกแจงแบบ Lognormal การแยกสิ่งที่จะถือว่าเป็นตัวอย่างที่มีขนาดใหญ่กว่า ( ) หลายครั้งจากการแจกแจงล็อกนอร์มัลด้วยพารามิเตอร์และฉันคำนวณค่า t-values และค่า p ที่จะส่งผลถ้าเราเปรียบเทียบค่าเฉลี่ย ของตัวอย่างเหล่านี้ทั้งหมดเกิดจากประชากรเดียวกันและมีขนาดเท่ากันทั้งหมด lognormal ได้รับเลือกตามความคิดเห็นและความเบ้ของการแจกแจงทางด้านขวา:n=50μ=0σ=1
การตั้งค่าระดับความสำคัญของอัตราความผิดพลาดที่แท้จริงของฉันจะเป็นไม่เลวเกินไป ...5%4.5%
ในความเป็นจริงพล็อตของความหนาแน่นของการทดสอบทีได้รับดูเหมือนจะทับซ้อนกับไฟล์ PDF จริงของการแจกแจงแบบที:
ส่วนที่น่าสนใจที่สุดคือดูที่ "ส่วน" ของการทดสอบ t ส่วนที่ควรจะเป็นไปตามการแจกแจงแบบไคสแควร์:
(n−1)s2/σ2=98(49(SD2A+SD2A))/98(eσ2−1)e2μ+σ2
2}}
ที่นี่เราใช้ส่วนเบี่ยงเบนมาตรฐานทั่วไปเช่นเดียวกับในรายการ Wikipedia :
SX1X2=(n1−1)S2X1+(n2−1)S2X2n1+n2−2−−−−−−−−−−−−−−−−−−−−−−√
และน่าประหลาดใจ (หรือไม่) พล็อตนั้นต่างจากไฟล์ PDF แบบไคสแควร์ที่ซ้อนทับ:
ข้อผิดพลาด Type II และพลังงาน:
การกระจายของความดันโลหิตเป็นไปได้ที่จะเข้าสู่ระบบปกติซึ่งมีประโยชน์อย่างมากในการตั้งค่าสถานการณ์สังเคราะห์ซึ่งกลุ่มเปรียบเทียบจะแยกกันในค่าเฉลี่ยโดยระยะทางที่เกี่ยวข้องทางคลินิกกล่าวในการศึกษาทางคลินิกทดสอบผลของความดันโลหิต ยาเสพติดที่มุ่งเน้นไปที่ diastolic BP ผลกระทบอย่างมีนัยสำคัญอาจพิจารณาลดลงเฉลี่ย mmHg (เลือก SD ประมาณ mmHg):9109
ทำการเปรียบเทียบการทดสอบ t บนการจำลอง Monte Carlo ที่คล้ายคลึงกันสำหรับข้อผิดพลาดประเภท I ระหว่างกลุ่มที่สมมติขึ้นเหล่านี้และมีระดับนัยสำคัญเราจบลงด้วยข้อผิดพลาด type II และกำลังเพียง .0.024 % 99 %5%0.024%99%
รหัสที่นี่