ฉันคิดว่าการทดสอบเกณฑ์ปกติอาจมีประโยชน์ในฐานะเพื่อนร่วมในการตรวจสอบเชิงกราฟิก พวกเขาต้องใช้อย่างถูกวิธี ในความคิดของฉันนี่หมายความว่าไม่ควรใช้การทดสอบยอดนิยมหลายอย่างเช่น Shapiro-Wilk, Anderson-Darling และ Jarque-Bera
ก่อนที่ฉันจะอธิบายมุมมองของฉันให้ฉันพูดเล็กน้อย:
- ในกระดาษล่าสุดที่น่าสนใจ Rochon และคณะ ศึกษาผลกระทบของการทดสอบชาปิโร - วิลก์ต่อการทดสอบสองตัวอย่าง ขั้นตอนสองขั้นตอนของการทดสอบความเป็นมาตรฐานก่อนดำเนินการเช่นการทดสอบ t ไม่มีปัญหา จากนั้นอีกครั้งทั้งสองขั้นตอนของการตรวจสอบความปกติของกราฟิกก่อนดำเนินการทดสอบ t ความแตกต่างคือผลกระทบของสิ่งหลังนั้นยากกว่ามากในการตรวจสอบ (เนื่องจากจะต้องมีนักสถิติเพื่อตรวจสอบความเป็นบรรทัดฐานทางกราฟิกครั้งหรือมากกว่านั้น ... )100,000
- มันมีประโยชน์ในการหาปริมาณที่ไม่เป็นมาตรฐานเช่นโดยการคำนวณความเบ้ตัวอย่างแม้ว่าคุณจะไม่ต้องการทำการทดสอบอย่างเป็นทางการก็ตาม
- กฎเกณฑ์หลายตัวแปรอาจเป็นเรื่องยากที่จะประเมินกราฟและการลู่เข้าสู่การแจกแจงแบบแอมโมติกติกอาจช้าสำหรับสถิติหลายตัวแปร การทดสอบความเป็นมาตรฐานจึงมีประโยชน์มากกว่าในการตั้งค่าหลายตัวแปร
- การทดสอบภาวะปกติอาจจะเป็นประโยชน์อย่างยิ่งสำหรับผู้ปฏิบัติงานที่ใช้สถิติเป็นชุดของวิธีการดำกล่อง เมื่อปฏิเสธภาวะปกติผู้ประกอบวิชาชีพควรตื่นตระหนกและแทนที่จะดำเนินการขั้นตอนมาตรฐานตามข้อสันนิษฐานทั่วไปพิจารณาใช้ขั้นตอนที่ไม่ใช่พารามิเตอร์ใช้การแปลงหรือให้คำปรึกษากับนักสถิติที่มีประสบการณ์มากกว่า
- ตามที่คนอื่นชี้ให้เห็นถ้ามีขนาดใหญ่พอ CLT มักจะช่วยให้วันนั้น อย่างไรก็ตามสิ่งที่ "ใหญ่พอ" แตกต่างกันสำหรับคลาสที่แตกต่างกันของการแจกแจงn
(ในคำจำกัดความของฉัน) การทดสอบความเป็นไปได้นั้นจะมุ่งไปที่คลาสของทางเลือกถ้ามันอ่อนไหวต่อทางเลือกจากคลาสนั้น แต่ไม่ไวต่อทางเลือกจากคลาสอื่น ตัวอย่างทั่วไปคือการทดสอบที่มุ่งตรงไปยังทางเลือกที่เอียงหรือผิดเพี้ยน ตัวอย่างที่ง่ายที่สุดใช้ตัวอย่างความเบ้และความโด่งเป็นตัวอย่างของสถิติทดสอบ
การทดสอบกำกับการแสดงของภาวะมี arguably มักจะดีกว่าที่จะทดสอบรถโดยสาร (เช่นการทดสอบ Shapiro-Wilk และ Jarque-Bera) ตั้งแต่มันเป็นเรื่องธรรมดาที่มีเพียงบางชนิดที่ไม่ปกติมีความกังวลสำหรับขั้นตอนการอนุมานโดยเฉพาะอย่างยิ่ง
ลองพิจารณาการทดสอบ t ของนักเรียนเป็นตัวอย่าง สมมติว่าเรามีตัวอย่าง iid จากการแจกแจงที่มีความเบ้และ (เกิน) kurtosisถ้าเป็นสมมาตรเกี่ยวกับค่าเฉลี่ยของ 0 ทั้งและเป็น 0 สำหรับการแจกแจงแบบปกติγ=E(X−μ)3σ3κ=E(X−μ)4σ4−3.Xγ=0γκ
ภายใต้สมมติฐานปกติเราได้รับการขยาย asymptoticสำหรับ cdf ของสถิติการทดสอบ :
TnP(Tn≤x)=Φ(x)+n−1/216γ(2x2+1)ϕ(x)−n−1x(112κ(x2−3)−118γ2(x4+2x2−3)−14(x2+3))ϕ(x)+o(n−1),
โดยที่คือ cdf และคือ pdf ของการแจกแจงแบบปกติมาตรฐานΦ(⋅)ϕ(⋅)
γปรากฏขึ้นเป็นครั้งแรกในระยะขณะที่ปรากฏในระยะ asymptoticประสิทธิภาพการทำงานของมากขึ้นความไวต่อการเบี่ยงเบนไปจากปกติในรูปแบบของเบ้กว่าในรูปแบบของความโด่งn−1/2κn−1 T nTn
มันสามารถตรวจสอบได้โดยใช้แบบจำลองที่เป็นจริงสำหรับขนาดเล็กเช่นกัน ดังนั้นนักศึกษา t-test มีความไวต่อเบ้ แต่ค่อนข้างแข็งแกร่งกับหางหนักและมันก็มีเหตุผลที่จะใช้สำหรับการทดสอบภาวะปกติที่เป็นผู้กำกับที่มีต่อทางเลือกเอียงก่อนที่จะใช้ t-testn
ตามกฎของหัวแม่มือ ( ไม่ใช่กฎแห่งธรรมชาติ) การอนุมานเกี่ยวกับวิธีการนั้นมีความอ่อนไหวต่อความเบ้และการอนุมานเกี่ยวกับความแปรปรวนนั้นมีความอ่อนไหวต่อ kurtosis
การใช้การทดสอบโดยตรงเพื่อหาบรรทัดฐานมีประโยชน์ในการรับพลังงานที่สูงกว่าทางเลือก '' อันตราย '' และพลังงานที่ต่ำกว่ากับทางเลือกที่ 'อันตราย' 'น้อยกว่าซึ่งหมายความว่าเรามีโอกาสน้อยที่จะปฏิเสธกฎเกณฑ์เนื่องจากการเบี่ยงเบนจากปกติ ไม่ส่งผลกระทบต่อประสิทธิภาพการทำงานของขั้นตอนอนุมานของเรา ปริมาณที่ไม่ได้อยู่ในเกณฑ์ปกตินั้นจะถูกวัดในลักษณะที่เกี่ยวข้องกับปัญหา นี่ไม่ใช่การทำกราฟิกที่ง่ายเสมอไป
เมื่อมีขนาดใหญ่ขึ้นความเบ้และความโด่งเป็นสิ่งที่มีความสำคัญน้อยลงและการทดสอบโดยตรงนั้นมีแนวโน้มที่จะตรวจสอบว่าปริมาณเหล่านี้เบี่ยงเบนจาก 0 แม้เพียงเล็กน้อย ในกรณีเช่นนี้ดูเหมือนว่าสมเหตุสมผลทดสอบว่าหรือ (ดูที่คำแรกของการขยายตัวด้านบน)มากกว่าว่า 0 นี้จะดูแลบางส่วนของปัญหาที่เราเผชิญเป็นอย่างอื่นขนาดใหญ่ได้รับn|γ|≤1|n−1/216γ(2z2α/2+1)ϕ(zα/2)|≤0.01
γ=0n