อะไรคือความแตกต่างระหว่างการทดสอบตามปกติของชาปิโร - วิลค์กับการทดสอบภาวะปกติของ Kolmogorov-Smirnov? ผลลัพธ์จากทั้งสองวิธีนี้จะแตกต่างกันเมื่อใด
อะไรคือความแตกต่างระหว่างการทดสอบตามปกติของชาปิโร - วิลค์กับการทดสอบภาวะปกติของ Kolmogorov-Smirnov? ผลลัพธ์จากทั้งสองวิธีนี้จะแตกต่างกันเมื่อใด
คำตอบ:
คุณไม่สามารถเปรียบเทียบทั้งสองได้จริง ๆ เนื่องจาก Kolmogorov-Smirnov มีไว้สำหรับการแจกแจงที่ระบุอย่างสมบูรณ์ (ดังนั้นหากคุณกำลังทดสอบภาวะปกติคุณต้องระบุค่าเฉลี่ยและความแปรปรวนโดยไม่สามารถประมาณค่าได้จากข้อมูล *) ขณะที่ ชาปิโร่วิลก์นั้นเป็นเรื่องปกติโดยมีค่าเฉลี่ยและความแปรปรวนที่ไม่ระบุรายละเอียด
* คุณไม่สามารถสร้างมาตรฐานโดยใช้พารามิเตอร์ที่ประมาณไว้และทดสอบมาตรฐานปกติ นั่นคือสิ่งเดียวกัน
วิธีหนึ่งในการเปรียบเทียบคือการเสริม Shapiro-Wilk ด้วยการทดสอบสำหรับค่าเฉลี่ยและความแปรปรวนที่ระบุในแบบปกติ (รวมการทดสอบในบางลักษณะ) หรือโดยการปรับตาราง KS สำหรับการประมาณค่าพารามิเตอร์ (แต่ก็ไม่มีการกระจายอีกต่อไป) -ฟรี).
มีการทดสอบดังกล่าว (เทียบเท่า Kolmogorov-Smirnov พร้อมพารามิเตอร์ประมาณ) - การทดสอบ Lilliefors รุ่นทดสอบปกติสามารถเปรียบเทียบได้อย่างถูกต้องกับ Shapiro-Wilk (และโดยทั่วไปจะมีพลังงานต่ำกว่า) การแข่งขันที่มากขึ้นคือการทดสอบ Anderson-Darling (ซึ่งจะต้องปรับเพื่อการประมาณค่าพารามิเตอร์สำหรับการเปรียบเทียบให้ถูกต้อง)
สำหรับสิ่งที่พวกเขาทดสอบ - การทดสอบ KS (และ Lilliefors) ดูความแตกต่างที่ใหญ่ที่สุดระหว่าง CDF เชิงประจักษ์และการกระจายที่ระบุในขณะที่ Shapiro Wilk เปรียบเทียบความแปรปรวนสองแบบได้อย่างมีประสิทธิภาพ Shapiro-Francia ที่เกี่ยวข้องอย่างใกล้ชิดถือได้ว่าเป็นฟังก์ชั่นโมโนโทนิกของสหสัมพันธ์กำลังสองในพล็อต QQ หากฉันจำได้ถูกต้อง Shapiro-Wilk ยังคำนึงถึงความแปรปรวนร่วมระหว่างสถิติการสั่งซื้อด้วย
[ควรจำไว้ว่ามีการทดสอบอีกมากมายสำหรับความเป็นมาตรฐานที่มีให้มากกว่านี้]
hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))
- ถ้าค่า p เป็นตามที่ควรจะเป็นนั่นก็จะดูสม่ำเสมอ!
กล่าวโดยย่อการทดสอบ Shapiro-Wilk เป็นการทดสอบเฉพาะสำหรับความเป็นมาตรฐานในขณะที่วิธีการที่ใช้โดยการทดสอบ Kolmogorov-Smirnovนั้นเป็นเรื่องทั่วไปมากกว่า แต่มีประสิทธิภาพน้อยกว่า สถิติทั้งสองมีค่าปกติเป็นโมฆะและสร้างสถิติทดสอบตามตัวอย่าง แต่วิธีการที่พวกเขาทำนั้นแตกต่างจากกันในวิธีที่ทำให้พวกเขามีความไวต่อคุณลักษณะของการแจกแจงแบบปกติมากขึ้นหรือน้อยลง
วิธีคำนวณว่า W (สถิติการทดสอบสำหรับ Shapiro-Wilk) นั้นมีความเกี่ยวข้องเพียงเล็กน้อยแต่ในทางแนวคิดแล้วมันเกี่ยวข้องกับการจัดเรียงค่าตัวอย่างตามขนาดและการวัดที่เหมาะสมกับค่าเฉลี่ยความแปรปรวนและความแปรปรวนร่วม การเปรียบเทียบหลายแบบกับกฎเกณฑ์อย่างที่ฉันเข้าใจให้การทดสอบมากกว่าพลังการทดสอบ Kolmogorov-Smirnov ซึ่งเป็นวิธีหนึ่งที่พวกเขาอาจแตกต่างกัน
ในทางตรงกันข้ามการทดสอบ Kolmogorov-Smirnov สำหรับภาวะปกตินั้นได้มาจากวิธีการทั่วไปสำหรับการประเมินความดีของความพอดีโดยการเปรียบเทียบการแจกแจงสะสมที่คาดหวังกับการแจกแจงสะสมเชิงประจักษ์:
เช่นนี้มันมีความไวที่กึ่งกลางของการกระจายไม่ใช่หาง อย่างไรก็ตามการทดสอบ KS เป็นการรวมกันในแง่ที่ว่ามีแนวโน้มที่จะไม่มีที่สิ้นสุดการทดสอบมาบรรจบกับคำตอบที่น่าจะเป็นในความเป็นจริง (ฉันเชื่อว่าทฤษฎีบทของ Glivenko-Cantelliนำไปใช้ที่นี่ แต่บางคนอาจแก้ไขฉันได้) นี่เป็นอีกสองวิธีที่การทดสอบทั้งสองนี้อาจแตกต่างกันในการประเมินความเป็นมาตรฐาน