จนถึงตอนนี้ฉันใช้สถิติของ Shapiro-Wilk เพื่อทดสอบสมมติฐานปกติในตัวอย่างเล็ก ๆ
คุณช่วยแนะนำเทคนิคอื่นได้ไหม
จนถึงตอนนี้ฉันใช้สถิติของ Shapiro-Wilk เพื่อทดสอบสมมติฐานปกติในตัวอย่างเล็ก ๆ
คุณช่วยแนะนำเทคนิคอื่นได้ไหม
คำตอบ:
fBasicsแพคเกจใน R (ส่วนหนึ่งของRmetrics ) รวมถึงการทดสอบภาวะปกติหลายครอบคลุมหลายที่เป็นที่นิยมการทดสอบ frequentist - Kolmogorov-Smirnov ชาปิโร-Wilk, Jarque-Bera และตือศิลปวัตถุ - พร้อมกับเสื้อคลุมสำหรับการทดสอบภาวะปกติได้ ในnortestแพคเกจ - แอนเดอ-ดาร์ลิ่ง, แครมเมอฟอนคะเน Lilliefors (Kolmogorov-Smirnov) เพียร์สันไคสแควร์และชาปิโร-แฟรง เอกสารแพคเกจยังให้การอ้างอิงที่สำคัญทั้งหมด นี่คือตัวอย่างที่แสดงให้เห็นถึงวิธีการใช้การทดสอบจาก nortest
วิธีหนึ่งถ้าคุณมีเวลาคือใช้การทดสอบมากกว่าหนึ่งครั้งและตรวจสอบข้อตกลง การทดสอบแตกต่างกันไปในหลายวิธีดังนั้นจึงไม่ตรงไปตรงมาที่จะเลือก "ดีที่สุด" นักวิจัยคนอื่น ๆ ในสาขาของคุณใช้อะไร สิ่งนี้อาจแตกต่างกันไปและอาจเป็นการดีที่สุดที่จะปฏิบัติตามวิธีการที่ยอมรับเพื่อให้คนอื่นยอมรับงานของคุณ ฉันมักใช้การทดสอบ Jarque-Bera ส่วนหนึ่งด้วยเหตุผลนั้นและ Anderson – Darling เพื่อเปรียบเทียบ
คุณสามารถดูได้ที่"การเปรียบเทียบการทดสอบสำหรับค่านิยมทั่วไปที่ไม่เปลี่ยนแปลง" (Seier 2002) และ"การเปรียบเทียบการทดสอบตามปกติต่างๆ" (Yazici; Yolacan 2007) สำหรับการเปรียบเทียบและการอภิปรายปัญหา
นอกจากนี้ยังเป็นเรื่องเล็กน้อยที่จะทดสอบวิธีการเหล่านี้เพื่อเปรียบเทียบใน R ขอบคุณฟังก์ชันการแจกแจงทั้งหมด นี่คือตัวอย่างง่ายๆที่มีข้อมูลจำลอง (ฉันจะไม่พิมพ์ผลลัพธ์เพื่อประหยัดพื้นที่) แม้ว่าจะต้องมีการแสดงออกอย่างเต็มที่มากขึ้น:
library(fBasics); library(ggplot2)
set.seed(1)
# normal distribution
x1 <- rnorm(1e+06)
x1.samp <- sample(x1, 200)
qplot(x1.samp, geom="histogram")
jbTest(x1.samp)
adTest(x1.samp)
# cauchy distribution
x2 <- rcauchy(1e+06)
x2.samp <- sample(x2, 200)
qplot(x2.samp, geom="histogram")
jbTest(x2.samp)
adTest(x2.samp)
เมื่อคุณได้ผลลัพธ์จากการทดสอบต่าง ๆ ผ่านการแจกแจงที่แตกต่างกันคุณสามารถเปรียบเทียบการทดสอบที่มีประสิทธิภาพมากที่สุด ตัวอย่างเช่นค่า p สำหรับการทดสอบ Jarque-Bera ด้านบนคืนค่า 0.276 สำหรับการแจกแจงแบบปกติ (ยอมรับ) และ <2.2e-16 สำหรับ cauchy (ปฏิเสธสมมติฐานว่าง)
สำหรับความปกติ Shapiro-Wilk ที่แท้จริงนั้นมีพลังที่ดีในกลุ่มตัวอย่างที่ค่อนข้างเล็ก
คู่แข่งหลักในการศึกษาที่ฉันได้เห็นคือแอนเดอร์สัน - ดาร์ลิ่งทั่วไปมากกว่าซึ่งทำได้ค่อนข้างดี แต่ฉันจะไม่พูดว่ามันดีกว่า หากคุณสามารถอธิบายได้ว่าทางเลือกใดที่คุณสนใจอาจเป็นไปได้ว่าสถิติที่ดีกว่านั้นชัดเจนยิ่งขึ้น [แก้ไข: หากคุณประเมินพารามิเตอร์ควรทำการทดสอบโฆษณาสำหรับสิ่งนั้น]
[ฉันขอแนะนำอย่างยิ่งให้ไม่พิจารณา Jarque-Bera ในกลุ่มตัวอย่างขนาดเล็ก (ซึ่งอาจเป็นที่รู้จักกันดีในนาม Bowman-Shenton ในแวดวงสถิติ - พวกเขาศึกษาการกระจายตัวตัวอย่างขนาดเล็ก) การกระจายข้อต่อเชิงเส้นกำกับของความเบ้และความโด่งเป็นอะไรที่ไม่เหมือนกับการกระจายตัวตัวอย่างขนาดเล็กในลักษณะเดียวกับที่กล้วยมีลักษณะไม่เหมือนส้ม นอกจากนี้ยังมีพลังงานที่ต่ำมากเมื่อเทียบกับทางเลือกที่น่าสนใจอื่น ๆ เช่นมีพลังงานต่ำในการรับการกระจายแบบสมมาตรบิโมดัลที่มีความโด่งใกล้เคียงกับการแจกแจงแบบปกติ]
ผู้คนมักทดสอบความดีที่เหมาะสมว่าอะไรเป็นเหตุผลที่ไม่ดีโดยเฉพาะหรือพวกเขาตอบคำถามอื่นนอกเหนือจากคำถามที่พวกเขาต้องการตอบ
ตัวอย่างเช่นคุณเกือบจะแน่นอนรู้อยู่แล้วว่าข้อมูลของคุณไม่ได้จริงๆปกติ (ไม่ตรง) เพื่อให้มีจุดในการพยายามที่จะตอบคำถามที่คุณรู้คำตอบไปไม่ - และการทดสอบสมมติฐานที่ไม่จริงตอบมันอยู่แล้ว
เมื่อคุณรู้ว่าคุณไม่มีกฎเกณฑ์ที่แน่นอนอยู่แล้วการทดสอบสมมติฐานของคุณเกี่ยวกับกฎเกณฑ์ปกติจะให้คำตอบกับคำถามที่ใกล้กว่า "คือขนาดตัวอย่างของฉันมีขนาดใหญ่พอที่จะรับจำนวนที่ไม่ใช่กฎเกณฑ์ที่ฉันมี" ในขณะที่ คำถามจริงที่คุณสนใจจะตอบมักจะใกล้เคียงกับ "สิ่งที่เกิดขึ้นกับสิ่งอื่น ๆ ที่ฉันสนใจคืออะไร" การทดสอบสมมติฐานเป็นการวัดขนาดตัวอย่างในขณะที่คำถามที่คุณสนใจตอบไม่ขึ้นอยู่กับขนาดตัวอย่างมากนัก
มีบางครั้งที่การทดสอบความเป็นบรรทัดฐานทำให้เกิดความรู้สึกบางอย่าง แต่สถานการณ์เหล่านั้นแทบไม่เคยเกิดขึ้นกับกลุ่มตัวอย่างขนาดเล็ก
ทำไมคุณต้องทดสอบความเป็นปกติ?
มีหมวดหมู่ทั้งหมดของWikipedia เกี่ยวกับการทดสอบภาวะปกติได้แก่ :
ฉันคิดว่าโฆษณาน่าจะดีที่สุดสำหรับพวกเขา
เพื่อความสมบูรณ์นักเศรษฐศาสตร์ก็ชอบการทดสอบ Kiefer และปลาแซลมอนจากบทความภาควิชาเศรษฐศาสตร์ในจดหมายฉบับปี 2526 ซึ่งเป็นการแสดงออกถึงความเบ้และความโด่งดังของ 'การทำให้เป็นปกติ' ซึ่งเป็นการแจกแจงแบบไคสแควร์ ฉันมี C ++ รุ่นเก่าที่ฉันเขียนระหว่างเรียนจบฉันสามารถแปลเป็น R ได้
แก้ไข:และนี่คือเอกสารล่าสุดโดย Bierens (อีกครั้ง) ที่ได้รับ Jarque-Bera และ Kiefer-Salmon
แก้ไข 2:ฉันดูรหัสเก่าและดูเหมือนว่าเป็นการทดสอบเดียวกันระหว่าง Jarque-Bera และ Kiefer-Salmon
ในความเป็นจริงการทดสอบแซลมอน Kiefer และการทดสอบ Jarque Bera จะแตกต่างกันอย่างยิ่งตามที่แสดงในหลายสถานที่ แต่ส่วนใหญ่เมื่อเร็ว ๆ นี้ที่นี่ - การทดสอบช่วงเวลาสำหรับมาตรฐานการแจกแจงข้อผิดพลาด: วิธีการที่มีประสิทธิภาพง่ายโดย Yi-Ting เฉิน การทดสอบ Kiefer Salmon โดยการก่อสร้างนั้นมีความแข็งแกร่งในการเผชิญกับโครงสร้างข้อผิดพลาดประเภท ARCH ซึ่งแตกต่างจากการทดสอบ Jarque Bera มาตรฐาน บทความโดย Yi-Ting Chen พัฒนาและพูดคุยเกี่ยวกับสิ่งที่ฉันคิดว่าน่าจะเป็นการทดสอบที่ดีที่สุดในขณะนี้
สำหรับขนาดตัวอย่าง<30วัตถุ Shapiro-Wilk ได้รับการพิจารณาว่ามีพลังที่แข็งแกร่ง - โปรดระวังเมื่อทำการปรับระดับความสำคัญของการทดสอบเนื่องจากอาจทำให้เกิดข้อผิดพลาดประเภท II! [1]